WO2014101010A1

WO2014101010A1 - 一种虚拟机系统的资源管理方法、虚拟机系统和装置

Info

Publication number: WO2014101010A1
Application number: PCT/CN2012/087558
Authority: WO
Inventors: 王烽
Original assignee: 华为技术有限公司
Priority date: 2012-12-26
Filing date: 2012-12-26
Publication date: 2014-07-03
Also published as: US20150324232A1; US9405563B2; EP2775399A1; CN104011685A; EP2775399A4; US9367340B2; CN104011685B; US20140344810A1

Abstract

本发明实施例提供一种虚拟机系统的资源管理方法，包括：虚拟资源管理平台可以获取所述虚拟机集群的QoS约束参数以及所述虚拟机集群的当前运行状况统计指标，根据所述虚拟机集群的QoS约束参数和所述虚拟机集群的当前运行状况统计指标，调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。该方法可以保障云应用的QoS。

Description

一种虛拟机系统的资源管理方法、虛拟机系统和装置技术领域本发明实施例涉及 IT技术领域，尤其涉及一种虚拟机系统的资源管理方法、虚拟机系统和装置。

背景技术

云计算的应用环境可以分为三层，分别是云应用、虚拟资源管理平台和物理设备管理平台。云应用指运行在云应用层上的程序，运行时包含一个或多个进程，可能分布在一个或多个虚拟机 ( Virtual Machine, VM ) 上。虚拟资源管理平台将物理资源虚拟化，对外提供 VM、 VM集群、虚拟卷、虚拟网络等虚拟资源。随着云计算的发展，对云应用的服务质量（Quality of Service, QoS )的保证越来越受到重视。现有技术中， QoS的调度靠虚拟资源管理平台的调度模块来完成。调度模块可以分为从云应用到虚拟资源管理平台的上层调度模块和从虚拟资源管理平台到物理设备管理平台的下层调度模块。现有技术中，上层调度模块根据云应用的实际状态信息对 VM集群的虚拟资源进行调整，例如，上层调度模块基于云应用的业务量及吞吐情况等实时状态信息确定云应用需要使用的虚拟资源，并决定需要增加或减少用来处理该云应用的 VM的数量或者决定为已经创建的 VM进行虚拟资源扩容或减容，上层调度模块将增加或减少 VM的指令或者调整 VM资源配置的指令发送给下层调度模块，下层调度模块根据所述指令通过调度物理资源来增加或减少 VM, 或者为 VM扩容或减容。

可见，现有技术中，对 VM集群的 QoS的保障主要靠上层调度模块根据云应用的实时状态作出决策并指令下层进行调整；另外一方面，提供

VM集群的物理资源的物理设备平台上也会有基于能耗管理和节省目的的物理资源调度策略或者物理资源的调度，例如，设定物理设备平台的物理机减容阈值为物理资源平均利用率 30% , 当物理设备平台的物理资源平均利用率小于 30%时，就对物理设备平台上的物理机进行迁空或者下电操作, 以节约能耗。

然而，上述的物理设备平台上的独立的物理资源调度策略或者物理资源的调度有可能造成以下冲突：

VM数量的时候，物理设备平台上却在进行物理机的下电操作，这样就会导致为了创建新的 VM或者为 VM扩容时，临时上电某台物理机，因此而使得虚拟机创建或扩容操作的时延比较长，导致云应用的 QoS无法保障，或者使得物理设备平台上的物理机反复上下电，并不节约能耗。

发明内容

本发明提出了一种虚拟机系统的资源管理方法、虚拟机系统和装置，用以解决物理设备平台的物理资源调度导致的无法保障云应用的 QoS 的问题。

第一方面，本发明实施例提供了一种虚拟机系统的资源管理方法，所述虚拟机系统为至少一个云应用提供服务，所述系统包括虚拟资源管理平台和物理设备平台，所述物理设备平台包括至少一个物理机，所述虚拟资源一台虚拟机，所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群；所述方法包括：

获取所述虚拟机集群的 QoS约束参数；

获取所述虚拟机集群的当前运行状况统计指标；

根据所述虚拟机集群的 QoS约束参数和所述虚拟机集群的当前运行状况统计指标，调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。

在第一种可能的实现方式中，在所述虚拟机集群的创建过程中，接收创建所述虚拟机集群的创建请求，或者在所述虚拟机集群的运行过程中，接收所述虚拟机集群资源的更新请求，所述创建请求或者更新请求携带所述虚拟机集群的 QoS约束参数；以及，记录所述虚拟机集群的 QoS约束参数；

则所述获取所述虚拟机集群的 QoS约束参数包括：

获取在所述虚拟机集群的创建过程中或者在所述虚拟机集群的运行过程中所记录的所述虚拟机集群的 QoS约束参数。

结合第一方面的第一种可能的实现方式，在第二种可能的实现方式中，所述虚拟机集群的 QoS约束参数包括：所述虚拟机集群的资源平均利用率约束参数；获取所述虚拟机集群的当前资源平均利用率的统计值；比较所述虚拟机集群的当前资源平均利用率的统计值与所述虚拟机集群的资源平均利用率约束参数，如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值，抑制所述物理设备平台上的物理机减容操作，和 /或，上电所述物理设备平台上的至少一台物理机。提高所述物理设备平台上的物理机减容阈值，或者，在预定期限内不发起所述物理设备平台上的物理机迁空或下电操作。

结合第一方面的第二种可能的实现方式，在第三种可能的实现方式中，所述虚拟机集群的 QoS约束参数还包括：所述虚拟机集群的占用的总资源的上限或下限；所述获取虚拟机集群的当前运行状况统计指标还包括：获取所述虚拟机集群的当前占用的总资源的统计值；所述上电至少一台所述物理设备平台上的物理机具体包括：获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值，根据所述差值选择相应规格的物理机进行上电操作。

结合第一方面的第二种可能的实现方式，在第四种可能的实现方式中，如果所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数，提高所述虚拟机集群的物理资源调度的优先级级别。

结合第一方面的第一种可能的实现方式，在第五种可能的实现方式中，所述虚拟机集群的 QoS约束参数包括：所述虚拟机集群的平均通信时延的约束参数；所述获取虚拟机集群的当前运行状况统计指标包括：获取所述虚拟机集群的当前平均通信时延的统计值；比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数，如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数，或者两者之差小于设定容忍阈值，集中部署所述虚拟机集群的虚拟机到相同的物理机上。第二方面，本发明实施例还提供了一种虚拟机系统，所述虚拟机系统为至少一个云应用提供服务，所述系统包括虚拟资源管理平台和物理设备平台；所述物理设备平台包括至少一个物理机，用于提供物理资源；所述虚用创建至少一台虚拟机，所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群，监控云应用的运行状况，根据所述云应用的运行状况确定是否对所述云应用对应的虚拟机集群的资源进行更新，以及调度所述物理设备平台上的物理资源以实现所述虚拟机集群的创建或者资源的更新；

所述虚拟资源管理平台还用于获取所述虚拟机集群的 QoS约束参数以及所述虚拟机集群的当前运行状况统计指标，根据所述虚拟机集群的 QoS 约束参数和所述虚拟机集群的当前运行状况统计指标，调整所述物理设备在第一种可能的实现方式中，所述虚拟资源管理平台还用于在所述虚拟机集群的创建过程中，接收所述虚拟机集群的创建请求，或者在所述虚拟机集群的运行过程中，接收所述虚拟机集群资源的更新请求，所述创建请求或者更新请求携带所述虚拟机集群的 QoS约束参数，以及，记录所述虚拟机集群的 QoS约束参数。

结合第二方面的第一种可能的实现方式，在第二种可能的实现方式中，所述虚拟机集群的 QoS约束参数包括：所述虚拟机集群的资源平均利用率约束参数；所述虚拟机集群的当前运行状况统计指标包括：所述虚拟机集群的当前资源平均利用率的统计值；

所述虚拟资源管理平台具体用于比较所述虚拟机集群的当前资源平均利用率的统计值与所述虚拟机集群的资源平均利用率约束参数，如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值，抑制所述物理设备平台上的物理机减容操作，和 /或，上电所述物理设备平台上的至少一台物理机。

结合第二方面的第二种可能的实现方式，在第三种可能的实现方式中，所述虚拟机集群的 QoS约束参数还包括：所述虚拟机集群的占用的总资源的上限或下限；所述虚拟机集群的当前运行状况统计指标包括：所述虚拟机集群的当前占用的总资源的统计值；所述虚拟资源管理平台还用于获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值，根据所述差值选择相应规格的物理机进行上电操作。

结合第二方面的第二种可能的实现方式，在第四种可能的实现方式中，所述虚拟资源管理平台还用于在所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数时，提高所述虚拟机集群的物理资源调度的优先级级别。

结合第二方面的第一种可能的实现方式，在第五种可能的实现方式中，所述虚拟机集群的 QoS约束参数包括：：所述虚拟机集群的平均通信时延的约束参数；所述虚拟机集群的当前运行状况统计指标包括：所述虚拟机集群的当前平均通信时延的统计值；所述虚拟资源管理平台用于比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数，如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数，或者两者之差小于设定容忍阈值，集中部署所述虚拟机集群的虚拟机到相同的物理机上。

第三方面，本发明实施例还提供了一种虚拟机系统资源管理装置，所述虚拟机系统为至少一个云应用提供服务，所述系统包括虚拟资源管理平台和物理设备平台，所述物理设备平台包括至少一个物理机，所述虚拟资源一台虚拟机，所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群；所述装置包括：

约束参数获取模块，用于获取所述虚拟机集群的 QoS约束参数；统计指标获取模块，用于获取所述虚拟机集群的当前运行状况统计指标；

管理模块，用于根据所述虚拟机集群的 QoS约束参数和所述虚拟机集群的当前运行状况统计指标，调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。

第四方面，本发明实施例还提供了一种虚拟机系统资源管理装置，所述虚拟机系统为至少一个云应用提供服务，所述系统包括虚拟资源管理平台和物理设备平台，所述物理设备平台包括至少一个物理机，所述虚拟资源一台虚拟机，所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群；所述装置包括包括处理器、存储器、总线和通信接口；

所述存储器用于存储计算机执行指令，所述处理器与所述存储器通过所述总线连接，当所述虚拟机系统管理装置运行时，所述处理器执行所述存储器存储的所述计算机执行指令，以使所述虚拟机系统管理装置执行如上第一方面所述的虚拟机系统的资源管理方法。

第五方面，本发明实施例还提供了一种计算机可读介质，包括计算机执行指令，以供计算机的处理器执行所述计算机执行指令时，所述计算机执行如上第一方面所述的虚拟机系统的资源管理方法。

本发明实施例由于考虑了虚拟机集群实际运行状况与虚拟机集群的

QoS约束参数来进行物理资源的调度，避免资源管理平台不考虑虚拟机集群的运行状况而只根据物理机集群的资源状况进行虚拟机的创建或者独立的物理资源调度，并因此规避了临时上电物理机造成的虚拟机创建、更新的时间延迟，因而可以解决物理设备平台的物理资源调度导致的无法保障云应用的 QoS的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作筒单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图 1为本发明实施例一提供的虚拟机系统的组成示意图；

图 2为本发明实施例二中云应用部署过程流程示意图；

图 3为本为本发明实施例三中云应用运行过程资源更新流程示意图；图 4为本发明实施例四提供的虚拟机系统资源管理流程示意图；图 5为为本发明实施例五提供的虚拟机系统资源管理流程示意图；图 6为为本发明实施例六提供的虚拟机系统资源管理装置示意图；图 7为为本发明实施例七提供的虚拟机系统资源管理装置示意图。具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

虚拟机系统

为了更好的理解本发明实施例，需要介绍一下本发明实施例的系统架构，系统架构可分为云应用层、虚拟机集群、物理设备平台、虚拟资源管理平台：

云应用层，用于提供云应用程序给用户，其中云应用程序可以包含多个进程，进程需要在虚拟机上创建，可以是一个进程对应一台虚拟机，也可以是多个进程对应一台虚拟机；

虚拟机集群，由虚拟机组成，良务于一个相同的云应用的虚拟机组成供的，可以是一台虚拟机对应一台物理机，也可以是多台虚拟机对应一台物理机；

物理设备平台，包括至少一台物理机，用于提供虚拟机所需要使用的物理资源，为云应用提供物理实体。

虚拟资源管理平台，根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机，同时负责虚拟机集群的调度，监控云应用的运行状况，也即监控所述虚拟机集群的运行状况，当云应用层的云应用的

QoS无法保障时，为虚拟机集群调度新的虚拟机或者为已有的虚拟机扩容, 以保障云应用程序的 QoS; 另外，还根据物理资源使用状况对集群中的物理机进行能耗管理或物理资源的调度。如图 1所示，为本发明实施例一提供的虚拟机系统架构图的一种示例，该示例中的云应用层 11包括云应用 1 和云应用 2, 每个云应用示例性地包括一个控制进程和多个工作进程，本实施例仅以两个云应用为例，本领域技术人员完全可以理解，系统根据实际工作情况还可以支持更多的云应用或者仅有一个云应用在系统中运行。具体地说，云应用的种类可以包含桌面云 VDI业务、数据分析业务或者网站业务等。

虚拟资源管理平台 12 , 可以由一个或多个软件组件或模块来实现，用于为云应用层 11中的各种云应用创建虚拟机 VM, 虚拟资源管理平台 12在创建 VM的时候还将物理设备平台 13中的物理资源配置给每台 VM, 其中，对应于一个云应用的所有 VM组成一个虚拟机集群（VM Cluster ) 。本实施例中，相应于云应用层 11包含的云应用 1和云应用 2 , 虚拟资源管理平台创建了 VM Clusterl和 VM Cluster2 , VM Clusterl对应于云应用 1 , VM Clusterl 中包含多台虚拟机， VM Cluster2对应于云应用 2 , VM Cluster2中包含多台虚拟机。虚拟资源管理平台 12在为云应用创建 VM Cluster之后，还会监控云应用的运行状况信息，并进行 VM Cluster中的 VM的数量或者配置的调度, 以及获取所述 VM Cluster的 QoS约束参数以及所述 VM Cluster的当前运行状况统计指标，根据所述 VM Cluster的 QoS约束参数和所述 VM Cluster的当前运行状况统计指标，调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。

物理设备平台 13上的物理机集群包含一台或多台物理机，本实施例以物理机集群包含三台物理机示例。物理机集群提供的物理资源可以包括 CPU资源、内存资源、存储资源以及网络资源中的一种或者多种，物理设备平台 13提供的物理资源被虚拟资源管理平台 12抽象成多台虚拟机，并分配到 VM Cluster中为相应的云应用服务。

本实施例作为本发明实施例之一，其中的虚拟资源管理平台 12 可以具体包括上层调度模块 121和下层调度模块 122 , 在以下的本说明书中的后续实施例中会具体阐述所述的上层调度模块 121或下层调度模块 122如何执行调度工作的。

虚拟机集群的 QoS约束参数

一个 VM Cluster可以视为一个虚拟资源池，该资源池中的物理资源用于为同一个云应用进行服务，因此，要保障云应用的 QoS , 本发明实施例中的虚拟资源管理平台还需要考虑该云应用所对应的 VM Cluster 的 QoS 约束参数。

本发明实施例所提到的 VM Cluster 的 QoS 约束参数可以包括 VM Cluster占用的总资源的约束参数、 VM Cluster的资源平均利用率的约束参数、 VM Cluster的平均通信时延的约束参数中的一种或者多种，所述的约束参数可以是具体的范围值，例如上下限，也可以是最小值或者最大值的任意一种，例如上限或者下限。举例来说，所述的 VM Cluster占用的总资源的约束参数可以为 VM Cluster中的所有 VM能够允许占用的总内存的上下限，或者是 VM Cluster中的所有 VM能够允许占用的总虚拟中央处理器 ( Virtual Central Processing Unit , VCPU )数量的上下限，或者是 VM Cluster 中能够创建的 VM的总个数的上下限，所述的 VM Cluster的资源平均利用率的约束参数可以是 VM Cluster中的所有 VM占用的内存的平均利用率的上下限，或者是 VM Cluster中的所有 VM占用的 CPU的平均利用率的上下限，所述的 VM Cluster的平均通信时延的约束参数可以是 VM Cluster中的所有 VM的平均通信时延能够允许的上下限。

应当可以理解，上述对 VM Cluster的 QoS约束参数的描述仅仅是作为示例性的，资源也只是示例性地以内存或 CPU 为例，本领域技术人员完全可以根据上述描述，将本发明所提到的 VM Cluster的 QoS约束参数理解到所有能够影响到 VM Cluster的 QoS 的具有集群性质的参数上。另外，本实施例采用 VCPU表示 VM的 CPU的度量单位，一个 VCPU的具体大小可以指代本领域技术中通用的任何一种 CPU 计算能力的单位，例如 MIPS (每秒百万指令数)或者 MHz (百万赫兹）。

虚拟机的 QoS策略

虚拟机的 QoS策略包括 VM区域性约束参数、 VM驻留性约束参数、 VM 关联性约束参数或 VM互斥性约束参数中的一种或几种。 VM区域性约束参数表示指定的虚拟机只能在指定范围的物理机上创建和迁移，用以保证云应用的安全或者资源。 VM驻留性约束参数表示指定的虚拟机很重要，不可自动迁移，如需迁移则通知管理员，由人工决定。 VM关联性约束参数表示指定的多个虚拟机需要放置在同一物理机上，以提高通信 QoS。 VM 互斥性约束参数指定的多个虚拟机不能放置在同一物理机上，以提高应用的可靠性。本发明实施例的资源管理策略

基于上述提及的虚拟机集群的 QoS约束参数和虚拟机的 QoS策略，本发明实施例为解决物理设备平台的物理资源调度导致的无法保障云应用的 QoS的问题，资源管理平台需要获取 QoS约束参数和虚拟机的 QoS 策略两者或者两者任一，并据此创建或者更新虚拟机的资源，或者调整物理设备平台的物理资源调度策略，或者进行物理设备平台上的物理资源调度。

如上述图 1所示的虚拟机系统，其中的虚拟资源管理平台可以获取所述虚拟机集群的 QoS约束参数以及所述虚拟机集群的当前运行状况统计指标，根据所述虚拟机集群的 QoS约束参数和所述虚拟机集群的当前运行状况统计指标，调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。

一个具体的实施例中，资源管理平台中的上层调度模块可以将虚拟机集群的 QoS约束参数和虚拟机的 QoS策略两者或者两者任一提供给下层调度模块，以使得下层调度模块在创建虚拟机，或者在更新虚拟机，或者在进行以能耗管理为目的的物理资源调度时以其作为考量因素，同时考虑虚拟机集群的当前运行状况统计指标，并在比较统计指标与考量因素的基础上，创建或者更新虚拟机的资源，或者调整物理设备平台的物理资源调度策略，或者进行物理设备平台上的物理资源调度。

本发明实施例的资源管理策略，由于考虑了虚拟机集群的 QoS约束参数来进行物理资源的调度，避免资源管理平台不考虑虚拟机集群的运行状况而只根据物理机集群的资源状况进行虚拟机的创建或者独立的物理资源调度，并因此规避了临时上电物理机造成的虚拟机创建、更新的时间延迟，因而可以解决物理设备平台的物理资源调度导致的无法保障云应用的

QoS的问题，同时，物理机的资源管理更加优化，避免了反复上下电物理机造成的能耗浪费。

另外一个方面，由于虚拟机的 QoS策略也成为物理资源调动的考量因素，保证了虚拟机在正确的物理机上进行创建，保证云应用的安全或者资源，以及提高通信 QoS。

以下将分别介绍在云应用的部署过程、更新过程以及运行过程中的自动监控过程中本发明实施例的资源管理的方法。

云应用部署过程中的虚拟机集群创建

在本发明的一个实施例中，如图 2所示，云应用的部署过程中上层调度模块和下层调度模块的资源调度工作流程可以包括：

步骤 201 : 接收创建云应用的请求，获取为所述云应用服务的 VM Cluster的属性信息和该 VM Cluster 中的各个 VM的属性信息，所述 VM Cluster的属性信息包含该 VM Cluster的标识信息、该 VM Cluster中所包含的 VM的数量、各个 VM之间的网络拓朴关系和该 VM Cluster的 QoS约束参数，所述各个 VM的属性信息包括各个 VM的规格（即 VM的资源配置情况，例如 VM的内存大小或者 VCPU的个数 ) 和 VM的 QoS策略；

具体地，本实施例中的 VM Cluster的 QoS约束参数可以包括以下参数中的任意一种或者多种： VM Cluster可占用的总内存的上限值和下限值、 VM Cluster的 CPU平均利用率的上限值和 VM Cluster的平均通信时延上限值。例如，待创建的云应用 1的 VM Cluster的属性信息如下： VM集群标识： VMClusterl；

VM 数量： 3;

VM镜像： image 1；

VM Cluster的 QoS约束参数：

( 1 ) VM Cluster占用的总内存：上限 500G , 下限 100G;

( 2 ) VM Cluster的 CPU平均利用率： VM Clusterl的平均 CPU利用率小于 20%;

( 3 ) VM Cluster的平均通信时延：小于 ls。

各个 VM的属性信息如下：

VM规格： VM1 ( 2VCPU , 60G内存）；

VM2 ( 2VCPU , 60G内存）；

VM3 ( 2VCPU , 40 G内存）；

VM的 QoS策略：

( 1 ) VM区域性约束参数：所有 VM必须在剩余内存大于 20G的物理机上运行；

( 2 ) VM驻留性约束参数：所有 VM可迁移；

( 3 ) VM关联性约束参数： VM1和 VM2需要在同一物理机上运行； ( 4 )VM互斥性约束参数： VM3和 VM1需要在不同一物理机上运行。上述所获取的 VM Cluster的属性信息和各个 VM的属性信息可以是用户创建的云应用模板中直接指定的，也可以是根据待创建的云应用的信息以及预置的策略共同确定的，本发明实施例对此不做限定。步骤 202: 上层调度模块根据预先配置的 VM部署策略（本实施例中可选项，若无该策略配置可以不作为参考项）、所述 VM Cluster的属性信息和各个 _VM的属性信息，确定所述云应用的进程在 VM Cluster上的部署方案。

例如，云应用的进程在 VM Cluster上的部署方案（即应用进程拓朴信息）：控制进程组 CttlGroup,成员： CttlProc; 工作进程组 WorkerGroup , 成员： Workei:Pi:oc#；表示成员进程名为 WorkerProcl , WorkerProc2 , WorkerProc3 ;

CttlProc所在 VM: VMClusterl.VMl ;

WorkerPro c 1所在 VM : VMCluster 1.VM2；

Workei:Pi:oc2所在 VM: VMClusterl.VM2 ;

Workei:Pi:oc3所在 VM: VMCluster l.VM3 o

步骤 203:上层调度模块向下层调度模块提交 VM Cluster的创建请求，该 VM Cluster的创建请求包含所述 VM Cluster的属性信息和该 VM Cluster 中包含的各个 VM的属性信息。

步骤 204: 下层调度模块记录 VM Cluster 的属性信息和 /或该 VM Cluster中包含的各个 VM的属性信息；

步骤 205: 下层调度模块查询当前物理设备平台上的物理资源的状态信息（可以包含各物理机的资源利用率、拓朴关系或者可用资源数量等），根据当前物理设备平台上的物理资源的状态信息、 VM Cluster的属性信息和各个 VM的属性信息，确定该 VM Cluster是否能够在该物理设备平台上创建，如果否，向上层调度模块返回失败响应消息，如果是，执行步骤 206 ; 具体地，本发明实施例中，由于上层调度模块传递到下层调度模块的 VM Cluster的属性信息中包含 VM Cluster的 QoS约束参数，因此，在本步骤中，下层调度模块还可以进一步确定该 VM Cluster是否能够在该物理机集群上创建，例如，如果物理机集群当前的剩余内存量小于或等于该 VM Cluster可占用的总内存的下限值，下层调度模块据此可判断在该物理机集群上创建该 VM Cluster不可能满足云应用的 QoS , 因此确定该 VM Cluster 不能够在该物理机集群上创建。

具体实践中，本步骤 205是可选执行的，大多数情况下，物理机集群的剩余资源和能力都能够满足 VM Cluster 的初始部署的要求，当 VM Cluster的属性信息中包含 VM Cluster可占用的总资源的下限值，则本步骤被有条件的执行，以进一步优化调度模块的性能，保障其所创建的 VM Cluster所服务的云应用的 QoS。

步骤 206 : 下层调度模块根据当前物理设备平台上的物理资源的状态信息和各个 VM的属性信息，确定 VM Cluster上的各 VM在物理机集群上的部署方案。

具体地，例如物理机集群包含的物理机当前的资源利用情况分别如下: PM1 : 总内存： 150G , 已用内存： 10G; 总 VCPU : 50个，已用 VCPU :

5个；

PM2 : 总内存： 150G , 已用内存： 20G; 总 VCPU : 50个，已用 VCPU : 10个；

PM3: 总内存： 150G , 已用内存： 0G; 总 VCPU : 50个，已用 VCPU : 0个。

根据 VM Cluster 的属性信息以及上述物理机的情况，确定的 VM Cluster上的各 VM在物理机集群上的部署方案如下：

VM1 : 规格 ( 2 VCPU, 60G内存），所在 PM ( PM1 ) ；

VM2: 规格 ( 2 VCPU, 40G内存），所在 PM ( PM1 ) ；

VM3: 规格 ( 2 VCPU, 60G内存），所在 PM ( PM2 ) 。

即根据 VM关联性约束参数，将 VM1和 VM2部署在同一物理机 PM1 上运行，根据 VM互斥性约束参数，将 VM3和 VM1分别部署在不同的物理机 PM1和 PM2上运行。

步骤 207: 下层调度模块根据确定的 VM Cluster上的各 VM在物理机集群上的部署方案，利用该物理机集群上的资源创建该 VM Cluster中的各

VM。

步骤 208: 下层调度模块通知上层调度模块该 VM Cluster中的各 VM 已创建成功，上层调度模块安装云业务组件到各 VM上，根据步骤 202确定的云应用的进程在 VM Cluster上的部署方案在各 VM上加载相应的进程。

至此，云应用的部署过程完成，该云应用的各个进程在相应的 VM上运行。在云应用的部署过程中，资源管理平台获取所述 VM Cluster的属性信息和该 VM Cluster中的各个 VM的属性信息中包含的 VM Cluster的 QoS 约束参数和 VM的 QoS策略两者或者两者任一，并可用以后续资源监控过程中的调度考量因素，同时，根据 VM Cluster的 QoS约束参数确定待创建的 VM Cluster是否能在物理设备平台上创建，避免了不必要的流程浪费，提高虚拟机集群创建的时延，对 QoS的保障起到促进作用。云应用运行过程中的虚拟机集群更新

在云应用部署完毕之后，上下层调度模块都会启动相应的资源调度工作，具体地说，上层调度模块启动监控云应用的进程信息，获得为云应用服务的 VM Cluster的运行信息，并根据预置的策略决定对 VM Cluster中的 VM的数量或者资源配置进行调度，如增加或者减少 VM, 为已有 VM扩容或者减容；下层调度模块根据上层调度模块的指令调度物理资源，以增加或者删除 VM, 或者为已有的 VM扩容或者减容。

如图 3所示，在本发明的一个实施例中，云应用的运行过程中上层调度模块资源调度工作流程可以包括：

步骤 301 : 上层调度模块实时监控云应用的进程信息以获取云应用的运行信息；

例如，获取到云应用的如下运行信息：

应用名称： Appl ;

应用所在的 VM集群： VM Clusterl；

应用进程拓朴信息：

控制进程組 CttlGroup,成员： CttlProc;

工作进程組 WorkerGroup , 成员： Woirkei:Pi:oc#；表示成员进程名为 orkerProcl ·. orkerProc2 , WorkerProc3;

CttlProc所在 VM: VMClusterl .VMl ;

WorkerPro c 1所在 VM : VMCluster 1.VM2；

Woirkei:Pi:oc2所在 VM: VMClusterl.VM2 ;

WorkerProc3所在 VM: VMClusterl.VM3 ; 应用资源占用信息：

WorkerProcl当前物理内存： 10G;

Woirkei:Pi:oc2当前物理内存： 20G; Woirkei:Pi:oc3当前物理内存： 30G;

VM1内存余量： 30G; VM2内存余量： 30G; VM3内存余量： 10G; 应用资源需求量： WorkerGroup的总内存需求量大于 100G。

步骤 302: 上层调度模块根据获取的云应用的运行信息和预置的资源调度策略，确定需要在所述 VM Cluster中创建新的 VM, 并确定所增加的

VM的属性信息；

例如，上层调度模块确定当前云应用的资源需求量（ 100G )远大于当前为 Woirkei:Pi:o_Cl_3的工作内存 ( 10G + 20G + 30G 二 60G ) , 于是决定增加 1个进程 WorkerProd 要求 Workei:Pi:oc4能够占用 40G以上内存，然而上层调度模块查询发现目前没有空闲内存大于 40G的 VM, 因此决定创建一个新的 VM。

新增加的 VM的属性信息如下：

VM 名称： VM4;

VM规格： VM4 ( 2VCPU , 40G内存）；

VM的 QoS策略：

( 1 ) VM区域性约束参数： VM4必须在剩余内存大于 20G的物理机上运行；

( 2 ) VM驻留性约束参数： VM4可迁移；

( 3 ) VM关联性约束参数： VM4和 VM3需要在同一物理机上运行；

( 4 )VM互斥性约束参数： VM4和 VM1需要在不同一物理机上运行；进一步地，在本步骤中，上层调度模块进一步还根据待增加的 VM4 的属性信息更新 VM Clusterl的属性信息，例如：

VM集群标识： VMClusterl；

VM 数量： 4;

VM镜像： image 1；

VM Cluster的 QoS约束参数：

( 1 ) VM Cluster占用的总内存：上限 500G , 下限 100G;

( 3 ) VM Cluster的平均通信时延：小于 ls。

步骤 303: 上层调度模块向下层调度模块提交创建 VM4 的请求，即 VM Cluster的更新请求 (由于执行该创建 VM4 的请求后，其所在的 VM Cluster的资源配置将会有所更新，因此创建 VM4的请求在本发明实施例中可以理解成 VM Cluster的更新请求 ) , 该更新请求中包含待创建的 VM4 的属性信息和待创建的 VM4所在的 VM Cluster的属性信息，即更新后的 VM Clusterl的属性信息。

上述实施例以增加 VM的数量为例，在其它的实施例中，上层调度模块的资源调度还可以包括减少 VM的数量、为已有 VM扩容或者减容，具体实现方式在此不赘述。

步骤 304:下层调度模块记录所述待创建的 VM4的属性信息和待创建的 VM4所在的 VM Cluster的属性信息；

进一步地，下层调度模块还可以进一步获取当前物理设备平台上的物理资源的状态信息和待创建 VM所在的 VM Clusterl的运行信息；

具体地，下层调度模块可以在部署了 VM Clusterl之后，即可定期统计 VM Clusterl的运行信息，也可以在接收到创建 VM4的请求之后，才开始统计 VM Clusterl的运行信息，本发明实施例对并不对下层调度模块何时以及如何获取 VM Clusterl的运行信息的具体实现方式进行限定，本领域技术人员可以通过多种方式实现。

下层调度模块获取的 VM Clusterl的运行信息举例如下：

成员 VM: VM1、 VM2、 VM3;

VM信息： VM1 ( 2VCPU、 60G内存），所在 ΡΜ ( PM1 ) ；

VM2 ( 2VCPU、 60G内存），所在 PM ( PM1 ) ；

VM3 ( 2VCPU , 40 G内存），所在 PM ( PM2 ) ；下层调度模块获取的当前物理设备平台上的物理资源的状态信息举例如下：

PM1 : 总内存： 150G, 已用内存： 130G; 总 VCPU: 50个，已用 VCPU:

9个；

PM2: 总内存： 150G, 已用内存： 60G; 总 VCPU: 50个，已用 VCPU: 12个；

PM3: 总内存： 150G, 已用内存： 0G; 总 VCPU: 50个，已用 VCPU: 0个。

步骤 305: 下层调度模块根据当前物理设备平台上的物理资源的状态信息、 VM Clusterl的运行信息、更新的 VM Clusterl的属性信息和待创建 VM4的属性信息，确定该 VM4是否能够在该物理设备平台上创建，如果否，向上层调度模块返回失败响应消息，如果是，执行步骤 306;

具体地，本发明实施例中，由于上层调度模块传递到下层调度模块的 VM Clusterl的属性信息中包含 VM Clusterl的 QoS约束参数，因此，在本步骤中，下层调度模块还可以进一步确定该 VM 4是否能够在该物理机集群上创建，例如，如果创建 VM4之后该 VM Cluster占用的总内存超出了 VM Cluster的 QoS约束参数中的 VM Cluster占用的总内存的上限值，下层调度模块据此可判断在该物理机集群上不能创建该 VM 4。

具体实践中，本步骤 305是可选执行的。

步骤 306: 下层调度模块根据当前物理设备平台上的物理资源的状态信息、 VM Clusterl的运行信息、更新的 VM Clusterl的属性信息和待创建 VM4的属性信息，确定 VM 4在物理设备平台上的部署方案。

具体地，根据 VM4区域性约束参数， VM4需要部署在剩余内存大于 20G的物理机上，根据 VM4关联性约束参数，将 VM4和 VM3部署在同一物理机 PM2上运行，根据 VM4互斥性约束参数，将 VM4和 VM1分别部署在不同的物理机 PM2和 PM1上运行。步骤 307: 下层调度模块根据确定的 VM 4在物理机集群上的部署方案，创建 VM4;

步骤 308: 下层调度模块通知上层调度模块该 VM 4 已创建成功，上层调度模块安装云业务组件到 VM4上，在 VM4上加载相应的进程。

至此，云应用的运行过程中的虚拟机集群的更新过程完成，在云应用的虚拟集群的更新过程中，资源管理平台获取更新后的所述 VM Cluster的属性信息和该 VM Cluster 中的各个 VM 的属性信息中包含的更新的 VM Cluster的 QoS约束参数和更新的 VM的 QoS策略两者或者两者任一，并可用以后续资源监控过程中的调度考量因素；同时，根据更新的 VM Cluster 的 QoS约束参数确定待创建的 VM Cluster是否能在物理设备平台上创建，避免了不必要的流程浪费，提高虚拟机集群创建的时延，对 QoS的保障起到促进作用。

云应用运行过程中的资源管理

在上述的云应用部署时的虚拟机集群创建过程和云应用运行时的虚拟机集群更新过程中，虚拟资源管理平台（具体实施例为其中的下层调度模块）获取并记录了虚拟机集群的 QoS约束参数，那么在为云应用部署了 VM Cluster之后，虚拟资源管理平台即可定期或者随时统计 VM Clusterl 的运行信息，也可以在接收到其它管理模块的资源监控触发消息之后，开始统计 VM Cluster的运行信息，本发明实施例对并不对虚拟资源管理平台何时获取 VM Cluster的运行信息的具体实现方式进行限定，本领域技术人员可以通过多种方式实现。并可根据统计得到的信息以及记录的虚拟机集群的 QoS约束参数，进行物理资源的调度或者修改物理资源调度策略。

本发明实施例中，如图 4所示，具体实施方式可包括：

步骤 401 : 获取所述虚拟机集群的 QoS约束参数；

步骤 402: 获取所述虚拟机集群的当前运行状况统计指标；步骤 403:根据所述虚拟机集群的 QoS约束参数和所述虚拟机集群的当前运行状况统计指标，调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。

本发明实施例的资源管理方法，由于考虑了虚拟机集群的 QoS约束参数来进行物理资源的调度，避免资源管理平台不考虑虚拟机集群的运行状况而只根据物理机集群的资源状况进行虚拟机的创建，或者避免了资源管理平台进行独立的物理资源调度，并因此规避了临时上电物理机造成的虚拟机创建、更新的延迟，因而可以解决物理设备平台的物理资源调度导致的无法保障云应用的 QoS的问题，同时，物理机的资源管理更加优化，避免了反复上下电物理机造成的能耗浪费。

当虚拟资源管理平台的虚拟机资源管理和物理机资源管理的功能可以不细分为不同的模块处理时，上述实施例可以由资源管理平台执行，当虚拟资源管理平台划分为上层调度模块进行虚拟机资源管理，下层调度模块进行物理机资源管理的架构中，上述实施例的执行主体是下层调度模块。

如上实施例，在虚拟资源管理平台划分上下层调度模块的架构中，如图 5所示，一种可实现的实施例的具体实施方式包括如下步骤：

步骤 501 : 获取在所述虚拟机集群的创建过程中或者在所述虚拟机集群的运行过程中所记录的所述虚拟机集群的 QoS约束参数；

例如获取上述步骤 204或 304中记录的 VM Clusterl的 QoS约束参数。步骤 502: 下层调度模块获取云应用的运行信息，即获取已创建的 VM Cluster的运行信息，例如如果对于上述实施例中所提到的云应用 1 , 即获 VM Clusterl的运行信息；下层调度模块可以在部署了 VM Clusterl 之后，可定期获取 VM Clusterl的运行信息，也可以根据相关消息的触发才开始获取 VM Clusterl 的运行信息，也可使实时获取，本发明实施例并不对下层调度模块何时获取 VM Clusterl的运行信息的具体实现方式进行限定，本领域技术人员可以通过多种方式实现。

进一步地，下层调度模块还可以在获取已创建的 VM Cluster的运行信息的时候，也获取当前物理设备平台上的物理资源的使用状态信息。

步骤 503:下层调度模块根据获取的已创建的 VM Cluster的运行信息，获取所述 VM Cluster的当前运行状况统计指标；

该运行状况统计指标可以包括统计参数的和、最大值、最小值、平均值和方差中的一种或者任意几种，具体地，可以包括：

( 1 )虚拟机集群的的当前资源平均利用率的统计值，例如 VM Cluster 的所有 VM 当前占用的内存的平均利用率，或者统计 VM Cluster的所有 VM当前占用的 CPU的平均利用率；

( 2 )虚拟机集群的占用的总资源的统计值，例如 VM Cluster的所有 VM当前占用的内存或者 CPU的和值；

( 3 ) 虚拟机集群的当前平均通信时延的统计值，例如可以统计 VM Cluster中所有任意两个 VM之间的通信时延，再根据统计得到的时延求的通信时延的平均值。

步骤 504: 下层调度模块根据所述虚拟机集群的 QoS约束参数和所述虚拟机集群的当前运行状况统计指标，调整所述物理设备平台的物理资源本步骤中根据虚拟机集群的 QoS 约束参数和所述虚拟机集群的当前运行状况统计指标，来进行物理资源的调度或者物理资源调度策略的修改可以确保 VM Cluster的 QoS。

具体地，进行物理资源的调度或者物理资源调度策略的修改可以包括以下几种方式：

( 1 )抑制所述物理设备平台上的物理机减容操作；

物理机减容是下层调度模块根据获取的物理机集群的物理资源的使用状态信息作出的能耗管理的调度工作，例如物理机减容阈值设置为 CPU 使用率 30% , 那么下层调度模块根据获取的物理机设备平台的物理资源的使用状态信息统计得到物理机集群的 CPU平均使用率为 28% , 则下层调度模块确定物理机集群当前的使用并不饱和，可以进行能耗节省，即进行虚拟机的迁移，将某台物理机迁空并进行下电操作，以节约能耗。

然而，下层调度模块仅根据物理机集群的实际资源使用情况进行物理机的减容操作，却不考虑上层应用对物理资源的需求变化可能会引起资源调度的冲突，例如当上层调度模块需要增加使用物理资源的时候，下层调度模块却进行物理机的减容操作，这些资源调度的冲突会影响到云应用的 QoS , 因此本发明实施例中下层调度模块根据根据所述虚拟机集群的 QoS 约束参数和所述虚拟机集群的当前运行状况统计指标，如果确定上层调度模块即将开始对该 VM Cluster进行扩容或者增加新的虚拟机的资源调度，那么下层调度模块需要为此作好物理资源的准备，因此物理机的减容的能耗管理需要暂緩，因此抑制所述物理设备平台上的物理机减容操作。

具体地，若所述虚拟机集群的 QoS约束参数包括所述虚拟机集群的资源平均利用率约束参数；所述步骤 503中获取虚拟机集群的当前运行状况统计指标包括：获取所述虚拟机集群的当前资源平均利用率的统计值；相应地，在本步骤 504中，下层调度模块比较所述虚拟机集群的当前资源平均利用率的统计值与所述虚拟机集群的资源平均利用率约束参数，如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值，抑制所述物理设备平台上的物理机减容操作。

其中的容忍阈值可以是预先设定的。

再进一步地，抑制所述物理设备平台上的物理机减容操作可以包括两种具体的实现方式，一种是调整所述物理设备平台的物理资源调度策略，如提高所述物理设备平台上的物理机减容阈值，例如， VM Clusterl的所有 VM的当前 CPU平均利用率统计值是 18% , 而 VM Cluster的 CPU平均利用率 QoS约束参数为 20% , 容忍阈值为 5% , 此时当前 CPU平均利用率统计值与所述 VM Cluster的 CPU平均利用率 QoS约束参数之差小于容忍阈值，因此，可以所述将物理机的减容阈值由 CPU平均利用率 30%提高为迁空或下电操作，例如，启动一个定时器，在预定时间内不执行物理机的减容操作，直到所述虚拟机集群的扩容操作完成。

( 2 ) 上电所述物理设备平台上的至少一台物理机；

如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值，下层调度模块还可以直接上电所述物理设备平台上的至少一台物理机，以为虚拟机集群的扩容做好物理资源的准备。

例如，上述实施例中， PM1和 PM2的内存占用分别达到了 130G (总资源 150G ) , 物理机集群的内存平均利用率 57% , 已经大于 50% , 则决定将 PM3 进行上电，这样，当下层调度模块后续接收到上层调度模块的指令需要进行扩容操作时，不需要再去启动 PM3 , 下层调度模块的资源调度时延得到降低，云应用的 QoS相应得到保障。

当所述步骤 501中获取的虚拟机集群的 QoS约束参数还包括：所述虚拟机集群的占用的总资源的上限或下限；步骤 503中获取的虚拟机集群的当前运行状况统计指标还包括：获取所述虚拟机集群的当前占用的总资源的统计值；一个进一步的实施例中，下层调度模块还获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值，根据所述差值选择相应规格的物理机进行上电操作。例如，如果所述虚拟机集群的当前占用的内存的统计值是 950G ,其与虚拟机集群的内而不选择内存规格 200G的物理机。

另一个进一步的实施例中，下层调度模块还可以获取所述物理设备平台上的物理资源当前使用状态信息，在当前在使用的物理机的剩余物理资源不充分时，才执行所述上电至少一台所述物理设备平台上的物理机的操作。

( 3 )提高虚拟机集群的物理资源调度的优先级级别；

如果所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数，此时，需要加快为所述虚拟机集群增加虚拟机或者未虚拟机扩容的操作的速度，减小该操作的时延才能保障云应用的 QoS , 此时下层调度模块还可以提高所述虚拟机集群的物理资源调度的优先级级别，以保障下层调度模块在接收到所述虚拟机集群的资源更新请求时，优先处理该资源更新请求，以保障云应用的 QoS。

( 4 ) 集中部署虚拟机集群的虚拟机到相同的物理机上；

当步骤 501中获取的所述虚拟机集群的 QoS约束参数包括：所述虚拟机集群的平均通信时延的约束参数；相应地，步骤 503中获取的虚拟机集群的当前运行状况统计指标包括：获取所述虚拟机集群的当前平均通信时延的统计值。

此时下层调度模块比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数，如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数，或者两者之差小于设定容忍阈值，集中部署所述虚拟机集群的虚拟机到相同的物理机上，以降低虚拟机集群的通信时延，从而保障云应用的 QoS。

图 6为本发明实施例的虚拟机系统资源管理装置的结构组成示意图。本发明实施例的虚拟机系统资源管理装置部署在虚拟机系统中，所述虚拟机系统为至少一个云应用提供服务，所述系统包括虚拟资源管理平台和物理设备平台，所述物理设备平台包括至少一个物理机，所述虚拟资源管理平台根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机，所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群；该虚拟机系统资源管理装置可包括：约束参数获取模块 601 , 用于获取所述虚拟机集群的 QoS约束参数；统计指标获取模块 602 , 用于获取所述虚拟机集群的当前运行状况统计指标；

管理模块 603 ,用于根据所述虚拟机集群的 QoS约束参数和所述虚拟机集群的当前运行状况统计指标，调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。

具体地，约束参数获取模块 601 , 还用于在所述虚拟机集群的创建过程中，接收创建所述虚拟机集群的创建请求，或者在所述虚拟机集群的运行过程中，接收所述虚拟机集群资源的更新请求，所述创建请求或者更新请求携带所述虚拟机集群的 QoS约束参数；以及，记录所述虚拟机集群的 QoS约束参数。

具体地，所述约束参数获取模块 601具体用于获取所述虚拟机集群的资源平均利用率约束参数；所述统计指标获取模块 602 , 具体用于获取所述虚拟机集群的当前资源平均利用率的统计值；所述管理模块 603具体用于比较所述虚拟机集群的当前资源平均利用率的统计值与所述虚拟机集群的资源平均利用率约束参数，如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值，抑制所述物理设备平台上的物理机减容操作，和 /或，上电所述物理设备平台上的至少一台物理机。管理模块 603提高所述物理设备平台上的物理机减容阈值，或者，在预定具体地，所述约束参数获取模块 601还用于获取所述虚拟机集群的占用的总资源的上限或下限；所述统计指标获取模块 602还用于获取所述虚拟机集群的当前占用的总资源的统计值；所述管理模块 603具体用于获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值，根据所述差值选择相应规格的物理机进行上电操作。

具体地，所述管理模块 603还用于在所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数时，提高所述虚拟机集群的物理资源调度的优先级级别。

具体地，所述约束参数获取模块 601具体用于获取所述虚拟机集群的平均通信时延的约束参数；所述统计指标获取模块 602 , 具体用于获取获取所述虚拟机集群的当前平均通信时延的统计值；所述管理模块 603具体用于比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数，如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数，或者两者之差小于设定容忍阈值，集中部署所述虚拟机集群的虚拟机到相同的物理机上。

具体地，所述虚拟机集群的 QoS约束参数包括：所述虚拟机集群的占用的总资源约束参数；所述装置还包括：处理模块 604还用于获取所述物理设备平台上剩余物理资源信息，根据所述虚拟机集群的占用的总资源约束参数，确定待创建的虚拟机集群或者待更新的虚拟机集群是否能够在所述物理设备平台上执行，如果是，执行虚拟机集群的创建或者资源的更新。

图 7为本发明实施例的虚拟机系统资源管理装置的结构组成示意图。本发明实施例的虚拟机系统资源管理装置部署在虚拟机系统中，所述虚拟机系统为至少一个云应用提供服务，所述系统包括虚拟资源管理平台和物理设备平台，所述物理设备平台包括至少一个物理机，所述虚拟资源管理平台根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机，所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群；该虚拟机系统资源管理装置可包括：

处理器 701、存储器 702、系统总线 703和通信接口 704。处理器 701、存储器 702和通信接口 704之间通过系统总线 703连接并完成相互间的通信。

处理器 701可能为单核或多核中央处理单元（Cent ra l Proces s ing Uni t , CPU ) , 或者为特定集成电路 ( App l icat ion Spec if ic Integrated Ci rcui t , ASIC ) , 或者为被配置成实施本发明实施例的一个或多个集成电路。

存储器 702 可以为高速 RAM 存储器，也可以为非易失性存储器 ( non-volat i le memory ) , 例如至少一个磁盘存储器。

存储器 702用于存放程序 705。具体的，程序 705中可以包括程序代码，所述程序代码包括计算机执行指令。

当虚拟机系统资源管理装置运行时，处理器 701运行程序 705 , 以执行以下指令：

获取所述虚拟机集群的 QoS约束参数；

获取所述虚拟机集群的当前运行状况统计指标；

根据所述虚拟机集群的 QoS约束参数和所述虚拟机集群的当前运行状况统计指标，调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度。具体地，虚拟机系统资源管理装置还根据所述指令执行上述图 5所示的资源管理方法，具体在此不再赘述。的 QoS约束参数来进行物理资源的调度，避免资源管理平台不考虑虚拟机集群的运行状况而只根据物理机集群的资源状况进行虚拟机的创建或者独立的物理资源调度，并因此规避了临时上电物理机造成的虚拟机创建、更新的延迟，因而可以解决物理设备平台的物理资源调度导致的无法保障云应用的 QoS的问题，同时，物理机的资源管理更加优化，避免了反复上下电物理机造成的能耗浪费。

所属领域的技术人员可以清楚地了解到，为描述的方便和筒洁，上述描述的系统，设备和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的单元或流程并不一定是实施本发明所必须的。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括： U盘、移动硬盘、只读存储器（ Read-Only Memory, 筒称 ROM ) 、随机存取存储器（Random Access Memory , 筒称 RAM ) 、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

权利要求书

1、一种虚拟机系统的资源管理方法，其特征在于，所述虚拟机系统为至少一个云应用提供服务，所述系统包括虚拟资源管理平台和物理设备平台，所述物理设备平台包括至少一个物理机，所述虚拟资源管理平台根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机，所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群；所述方法包括：

获取所述虚拟机集群的 QoS约束参数；

获取所述虚拟机集群的当前运行状况统计指标；

2、如权利要求 1所述的方法，其特征在于，所述获取所述虚拟机集群的 QoS约束参数之前，还包括：

在所述虚拟机集群的创建过程中，接收创建所述虚拟机集群的创建请求，或者在所述虚拟机集群的运行过程中，接收所述虚拟机集群资源的更新请求，所述创建请求或者更新请求携带所述虚拟机集群的 QoS约束参数；以及，记录所述虚拟机集群的 QoS约束参数；

则所述获取所述虚拟机集群的 QoS约束参数包括：

3、如权利要求 1或 2所述的方法，其特征在于，所述虚拟机集群的 QoS 约束参数包括：所述虚拟机集群的资源平均利用率约束参数；相应地，所述获取虚拟机集群的当前运行状况统计指标包括：获取所述虚拟机集群的当前资源平均利用率的统计值；

相应地，根据所述虚拟机集群的 QoS约束参数和所述虚拟机集群的当前资源使用统计指标，调整所述物理设备平台的物理资源调度策略或者进行所述物理设备平台上的物理资源调度，包括：

比较所述虚拟机集群的当前资源平均利用率的统计值与所述虚拟机集群的资源平均利用率约束参数，如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值，抑制所述物理设备平台上的物理机减容操作，和 / 或，上电所述物理设备平台上的至少一台物理机。

4、如权利要求 3所述的方法，其特征在于，所述抑制所述物理设备平台上的物理机减容操作包括：

提高所述物理设备平台上的物理机减容阈值，或者，在预定期限内不发起所述物理设备平台上的物理机迁空或下电操作。

5、如权利要求 3所述的方法，其特征在于，所述虚拟机集群的 QoS约束参数还包括：所述虚拟机集群的占用的总资源的上限或下限；

所述获取虚拟机集群的当前运行状况统计指标还包括：获取所述虚拟机集群的当前占用的总资源的统计值；

所述上电至少一台所述物理设备平台上的物理机具体包括：

获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值，根据所述差值选择相应规格的物理机进行上电操作。

6、如权利要求 3或 5所述的方法，其特征在于，在上电至少一台所述物理设备平台上的物理机之前，还包括：

获取所述物理设备平台上的物理资源当前使用状态信息，若当前在使用的物理机的剩余物理资源不充分，执行所述上电至少一台所述物理设备平台上的物理机的步骤。

7、如权利要求 3或 5所述的方法，其特征在于，所述方法还包括：如果所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数，提高所述虚拟机集群的物理资源调度的优先级级别。

8、如权利要求 1或 2所述的方法，其特征在于，所述虚拟机集群的 QoS 约束参数包括：所述虚拟机集群的平均通信时延的约束参数；

相应地，所述获取虚拟机集群的当前运行状况统计指标包括：获取所述虚拟机集群的当前平均通信时延的统计值；

比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数，如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数，或者两者之差小于设定容忍阈值，集中部署所述虚拟机集群的虚拟机到相同的物理机上。

9、如权利要求 2所述的方法，其特征在于，所述虚拟资源管理平台包括上层调度模块和下层调度模块，所述方法还包括：

在所述虚拟机集群的创建过程中，所述上层调度模块接收所述虚拟机集群的创建请求，或者在所述虚拟机集群的运行过程中，接收所述虚拟机集群资源的更新请求，所述创建请求或者更新请求携带所述虚拟机集群的

QoS约束参数；

所述上层调度模块将所述创建请求或者更新请求转发给所述下层调度模块，以使得所述下层调度模块接收并记录所述创建请求或者更新请求中携带的所述虚拟机集群的 QoS约束参数。

10、如权利要求 2所述的方法，其特征在于，所述方法还包括：接收到所述创建请求或者更新请求之后，根据所述创建请求或者更新或者资源的更新。

11、如权利要求 10所述的方法，其特征在于，所述虚拟机集群的 QoS 约束参数包括：所述虚拟机集群的占用的总资源约束参数；

所述调度所述物理设备平台上的物理资源以实现所述虚拟机集群的创建或者资源的更新之前，还包括：

获取所述物理设备平台上剩余物理资源信息，根据所述虚拟机集群的占用的总资源约束参数，确定待创建的虚拟机集群或者待更新的虚拟机集群是否能够在所述物理设备平台上执行，如果是，执行所述调度所述物理设备平台上的物理资源的步骤。

12、一种虚拟机系统，其特征在于，所述虚拟机系统为至少一个云应用提供服务，所述系统包括虚拟资源管理平台和物理设备平台；所述物理设备平台包括至少一个物理机，用于提供物理资源为每个云应用创建至少一台虚拟机，所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群，监控云应用的运行状况，根据所述云应用的运行状况确定是否对所述云应用对应的虚拟机集群的资源进行更新，以及调度所述物理设备平台上的物理资源以实现所述虚拟机集群的创建或者资源的更新；

所述虚拟资源管理平台还用于获取所述虚拟机集群的 QoS约束参数以及所述虚拟机集群的当前运行状况统计指标，根据所述虚拟机集群的 QoS 约束参数和所述虚拟机集群的当前运行状况统计指标，调整所述物理设备

13、如权利要求 12所述的系统，其特征在于，所述虚拟资源管理平台还用于在所述虚拟机集群的创建过程中，接收所述虚拟机集群的创建请求或者在所述虚拟机集群的运行过程中，接收所述虚拟机集群资源的更新请求，所述创建请求或者更新请求携带所述虚拟机集群的 QoS约束参数，以及，记录所述虚拟机集群的 QoS约束参数。

14、如权利要求 12或 13所述的系统，其特征在于，所述虚拟机集群的 QoS约束参数包括：所述虚拟机集群的资源平均利用率约束参数；所述虚拟机集群的当前运行状况统计指标包括：所述虚拟机集群的当前资源平均利用率的统计值；

15、如权利要求 14所述的系统，其特征在于，如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值，所述虚拟资源管理平台具体用于提高所述物理设备平台上的物理机减容阈值，或者，在预定期限内不发起所述物理设备平台上的物理机迁空或下电操作。

16、如权利要求 14所述的系统，其特征在于，所述虚拟机集群的 QoS 约束参数还包括：所述虚拟机集群的占用的总资源的上限或下限；所述虚拟机集群的当前运行状况统计指标包括：所述虚拟机集群的当前占用的总资源的统计值；

所述虚拟资源管理平台还用于获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值，根据所述差值选择相应规格的物理机进行上电操作。

17、如权利要求 14所述的系统，其特征在于，所述虚拟资源管理平台还用于在所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数时，提高所述虚拟机集群的物理资源调度的优先级级别。

18、如权利要求 12或 13所述的系统，其特征在于，所述虚拟机集群的 QoS约束参数包括：：所述虚拟机集群的平均通信时延的约束参数；所述虚拟机集群的当前运行状况统计指标包括：所述虚拟机集群的当前平均通信时延的统计值；

所述虚拟资源管理平台用于比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数，如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数，或者两者之差小于设定容忍阈值，集中部署所述虚拟机集群的虚拟机到相同的物理机上。

19、如权利要求 12或 13所述的系统，其特征在于，所述虚拟资源管理平台包括上层调度模块和下层调度模块；

所述上层调度模块用于根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机，所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群，监控所述虚拟机集群的运行状况，根据所述虚拟机集群的运行状况确定是否对所述虚拟机集群的资源进行更新，向所述下层调度模块发送所述虚拟机集群创建请求或者资源的更新请求；

所述下层调度模块用于根据所述上层调度模块的创建请求或者更新或者资源更新；以及获取所述虚拟机集群的 QoS约束参数以及所述虚拟机集群的当前运行状况统计指标，根据所述虚拟机集群的 QoS约束参数和所述虚拟机集群的当前运行状况统计指标，调整所述物理设备平台的物理资

20、如权利要求 19所述的系统，其特征在于，所述上层调度模块还用于在所述虚拟机集群的创建过程中，接收所述虚拟机集群的创建请求，或者在所述虚拟机集群的运行过程中，接收所述虚拟机集群资源的更新请求, 所述创建请求或者更新请求携带所述虚拟机集群的 QoS约束参数，以及将所述创建请求或者更新请求转发给所述下层调度模块；

所述下层调度模块还用于接收所述创建请求或者更新请求，记录携带在所述创建请求或者更新请求中的所述虚拟机集群的 QoS约束参数。

21、如权利要求 20所述的系统，其特征在于，所述虚拟机集群的 QoS 约束参数包括：所述虚拟机集群的占用的总资源约束参数；

所述下层调度模块还用于在接收到所述创建请求或者更新请求时，获取所述物理设备平台上剩余物理资源信息，根据所述虚拟机集群的占用的总资源约束参数，确定待创建的虚拟机集群或者待更新的虚拟机集群是否能够在所述物理设备平台上执行，如果是，调度所述物理设备平台上的物理资源以实现所述虚拟机集群的创建或者资源更新。

22、一种虚拟机系统资源管理装置，其特征在于，所述虚拟机系统为至少一个云应用提供服务，所述系统包括虚拟资源管理平台和物理设备平台，所述物理设备平台包括至少一个物理机，所述虚拟资源管理平台根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机，所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群；

所述装置包括：

23、如权利要求 22所述的装置，其特征在于，所述约束参数获取模块，还用于在所述虚拟机集群的创建过程中，接收创建所述虚拟机集群的创建请求，或者在所述虚拟机集群的运行过程中，接收所述虚拟机集群资源的更新请求，所述创建请求或者更新请求携带所述虚拟机集群的 QoS约束参数；以及，记录所述虚拟机集群的 QoS约束参数。

24、如权利要求 22或 23所述的装置，其特征在于，所述约束参数获取模块具体用于获取所述虚拟机集群的资源平均利用率约束参数；所述统计指标获取模块，具体用于获取所述虚拟机集群的当前资源平均利用率的统计值；

所述管理模块具体用于比较所述虚拟机集群的当前资源平均利用率的统计值与所述虚拟机集群的资源平均利用率约束参数，如果所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值，抑制所述物理设备平台上的物理机减容操作，和 /或，上电所述物理设备平台上的至少一台物理机。

25、如权利要求 24所述的装置，其特征在于，所述管理模块具体用于在所述虚拟机集群的当前资源平均利用率的统计值小于所述虚拟机集群的资源平均利用率约束参数且两者之差小于设定容忍阈值时，提高所述物理设备平台上的物理机减容阈值，或者，在预定期限内不发起所述物理设备平台上的物理机迁空或下电操作。

26、如权利要求 24所述的装置，其特征在于，所述约束参数获取模块还用于获取所述虚拟机集群的占用的总资源的上限或下限；所述统计指标获取模块还用于获取所述虚拟机集群的当前占用的总资源的统计值；所述管理模块具体用于获得所述虚拟机集群的当前占用的总资源的统计值与所述虚拟机集群的占用的总资源上限之间的差值，根据所述差值选择相应规格的物理机进行上电操作。

27、如权利要求 24或 26所述的装置，其特征在于，所述管理模块还用于在所述虚拟机集群的当前资源平均利用率的统计值大于所述虚拟机集群的资源平均利用率约束参数时，提高所述虚拟机集群的物理资源调度的优先级级别。

28、如权利要求 22或 23所述的装置，其特征在于，所述约束参数获取模块具体用于获取所述虚拟机集群的平均通信时延的约束参数；所述统计指标获取模块，具体用于获取获取所述虚拟机集群的当前平均通信时延的统计值；

所述管理模块具体用于比较所述虚拟机集群的当前平均通信时延的统计值与所述虚拟机集群的平均通信时延的约束参数，如果所述虚拟机集群的当前平均通信时延的统计值大于所述虚拟机集群的平均通信时延的约束参数，或者两者之差小于设定容忍阈值，集中部署所述虚拟机集群的虚拟机到相同的物理机上。

29、如权利要求 23所述的装置，其特征在于，所述装置还包括：处理模块：用于在接收到所述创建请求或者更新请求之后，根据所述创建请求或者更新请求，调度所述物理设备平台上的物理资源以实现所述虚拟机集群的创建或者资源的更新。

30、如权利要求 29所述的装置，其特征在于，所述虚拟机集群的 QoS 约束参数包括：所述虚拟机集群的占用的总资源约束参数；据所述虚拟机集群的占用的总资源约束参数，确定待创建的虚拟机集群或者待更新的虚拟机集群是否能够在所述物理设备平台上执行，如果是，执行虚拟机集群的创建或者资源的更新。

31、一种虚拟机系统资源管理装置，其特征在于，所述虚拟机系统为至少一个云应用提供服务，所述系统包括虚拟资源管理平台和物理设备平台，所述物理设备平台包括至少一个物理机，所述虚拟资源管理平台根据所述物理设备平台提供的物理资源为每个云应用创建至少一台虚拟机，所述每个云应用对应的至少一台虚拟机组成一个虚拟机集群；

所述装置包括包括处理器、存储器、总线和通信接口；

所述存储器用于存储计算机执行指令，所述处理器与所述存储器通过所述总线连接，当所述虚拟机系统管理装置运行时，所述处理器执行所述存储器存储的所述计算机执行指令，以使所述虚拟机系统管理装置执行如权利要求 1-11中任一所述的虚拟机系统的资源管理方法。

32、一种计算机可读介质，其特征在于，包括计算机执行指令，以供计算机的处理器执行所述计算机执行指令时，所述计算机执行如权利要求 1-11中任一所述的虚拟机系统的资源管理方法。