CN112463392A

CN112463392A - 一种vGPU管理方法、装置及电子设备和存储介质

Info

Publication number: CN112463392A
Application number: CN202011453327.6A
Authority: CN
Inventors: 宋文平; 亓开元; 苏广峰; 张百林
Original assignee: Beijing Inspur Data Technology Co Ltd
Current assignee: Beijing Inspur Data Technology Co Ltd
Priority date: 2020-12-11
Filing date: 2020-12-11
Publication date: 2021-03-09

Abstract

本申请公开了一种vGPU管理方法、装置及一种电子设备和计算机可读存储介质，该方法包括：若接收到目标虚拟机创建请求，则确定符合目标规格的目标主机；其中，目标虚拟机为绑定目标规格的vGPU的虚拟机，目标规格包括GPU型号和vGPU类型；将目标主机中的资源分配至目标虚拟机，并记录目标虚拟机与目标规格的对应关系；在目标主机中创建目标虚拟机，并创建目标虚拟机与目标规格的vGPU之间的通信中间件；启动目标虚拟机。由此可见，本申请实现了创建虚拟机绑定目标规格的vGPU资源的功能，提高了创建vGPU的效率，为云平台中vGPU的使用提供了很大的便捷性与良好的体验性。

Description

一种vGPU管理方法、装置及电子设备和存储介质

技术领域

本申请涉及计算机技术领域，更具体地说，涉及一种vGPU管理方法、装置及一种电子设备和一种计算机可读存储介质。

背景技术

云计算平台基于硬件资源和软件资源服务，提供计算、网络和存储能力。在相关技术中，创建虚拟机后，需要为每台虚拟机单独指定关联的GPU(中文全称：图形处理器，英文全称：Graphics Processing Unit)型号和vGPU(虚拟图形处理单元)类型，效率较低。

因此，如何提高创建vGPU的效率是本领域技术人员需要解决的技术问题。

发明内容

本申请的目的在于提供一种vGPU管理方法、装置及一种电子设备和一种计算机可读存储介质，提高了创建vGPU的效率。

为实现上述目的，本申请提供了一种vGPU管理方法，包括：

若接收到目标虚拟机创建请求，则确定符合目标规格的目标主机；其中，所述目标虚拟机为绑定所述目标规格的vGPU的虚拟机，所述目标规格包括GPU型号和vGPU类型；

将所述目标主机中的资源分配至所述目标虚拟机，并记录所述目标虚拟机与所述目标规格的对应关系；

在所述目标主机中创建所述目标虚拟机，并创建所述目标虚拟机与所述目标规格的vGPU之间的通信中间件；

启动所述目标虚拟机。

其中，确定符合所述目标规格的目标主机，包括：

获取符合所述目标规格的候选主机；

根据每个所述候选主机的指标计算每个所述候选主机的权重；

选择所述权重最高的候选主机为目标主机。

其中，启动所述目标虚拟机，包括：

生成所述目标规格的虚拟机的xml文件，并调用libvirt启动所述目标虚拟机。

其中，还包括：

在已创建的虚拟机中确定待绑定虚拟机，并向所述待绑定虚拟机分配vGPU资源；

创建所述待绑定虚拟机与待绑定规格的vGPU之间的通信中间件；

记录所述待绑定虚拟机与所述待绑定vGPU规格之间的对应关系。

其中，还包括：

确定待解绑虚拟机，并释放所述待解绑虚拟机对应的vGPU资源；

删除创建所述待解绑虚拟机与对应规格的vGPU之间的通信中间件，并删除所述待解绑虚拟机与对应规格之间的对应关系。

为实现上述目的，本申请提供了一种vGPU管理装置，包括：

确定模块，用于若接收到目标虚拟机创建请求，则确定符合目标规格的目标主机；其中，所述目标虚拟机为绑定所述目标规格的vGPU的虚拟机，所述目标规格包括GPU型号和vGPU类型；

第一记录模块，用于将所述目标主机中的资源分配至所述目标虚拟机，并记录所述目标虚拟机与所述目标规格的对应关系；

第一创建模块，用于在所述目标主机中创建所述目标虚拟机，并创建所述目标虚拟机与所述目标规格的vGPU之间的通信中间件；

启动模块，用于启动所述目标虚拟机。

其中，还包括：

分配模块，用于在已创建的虚拟机中确定待绑定虚拟机，并向所述待绑定虚拟机分配vGPU资源；

第二创建模块，用于创建所述待绑定虚拟机与待绑定规格的vGPU之间的通信中间件；

第二记录模块，用于记录所述待绑定虚拟机与所述待绑定vGPU规格之间的对应关系。

其中，还包括：

释放模块，用于确定待解绑虚拟机，并释放所述待解绑虚拟机对应的vGPU资源；

删除模块，用于删除创建所述待解绑虚拟机与对应规格的vGPU之间的通信中间件，并删除所述待解绑虚拟机与对应规格之间的对应关系。

为实现上述目的，本申请提供了一种电子设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上述vGPU管理方法的步骤。

为实现上述目的，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述vGPU管理方法的步骤。

通过以上方案可知，本申请提供的一种vGPU管理方法，包括：若接收到目标虚拟机创建请求，则确定符合目标规格的目标主机；其中，所述目标虚拟机为绑定所述目标规格的vGPU的虚拟机，所述目标规格包括GPU型号和vGPU类型；将所述目标主机中的资源分配至所述目标虚拟机，并记录所述目标虚拟机与所述目标规格的对应关系；在所述目标主机中创建所述目标虚拟机，并创建所述目标虚拟机与所述目标规格的vGPU之间的通信中间件；启动所述目标虚拟机。

本申请提供的vGPU管理方法，用户可以自定义vGPU规格，其中包括GPU型号和vGPU类型，然后选择目标规格批量创建虚拟机，最终创建出绑定有目标规格的vGPU资源的虚拟机。由此可见，本申请实现了创建虚拟机绑定目标规格的vGPU资源的功能，提高了创建vGPU的效率，为云平台中vGPU的使用提供了很大的便捷性与良好的体验性。本申请还公开了一种vGPU管理装置及一种电子设备和一种计算机可读存储介质，同样能实现上述技术效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本申请。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。在附图中：

图1为根据一示例性实施例示出的一种vGPU管理方法的流程图；

图2为根据一示例性实施例示出的一种使用目标规格创建虚拟机的时序图；

图3为根据一示例性实施例示出的另一种vGPU管理方法的流程图；

图4为根据一示例性实施例示出的一种虚拟机挂载vGPU资源的时序图；

图5为根据一示例性实施例示出的又一种vGPU管理方法的流程图；

图6为根据一示例性实施例示出的一种vGPU管理装置的结构图；

图7为根据一示例性实施例示出的一种电子设备的结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。另外，在本申请实施例中，“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

为了理解本申请提供的vGPU管理方法，首先对其应用的系统进行介绍，该系统具体为OpenStack，一个开源的云计算管理平台项目，是一系列软件开源项目的组合。其中可以包括客户端、Nova api、Nova conductor、Nova scheduler、Nova compute、云平台资源系统和硬件加速资源系统。Nova api用于提供OpenStack中计算服务相关接口。Novaconductor为OpenStack中计算相关服务和数据库交互的进程。Nova scheduler为OpenStack中创建虚拟机时调度主机、过滤主机，进而最终选出合适主机创建虚拟机的服务进程。Nova compute部署在计算节点上，用于启动虚拟机进程服务。云平台资源系统为OpenStack中对CPU、Memory、Disk、PCI/PCIe设备等资源的使用、调度、管理的服务。硬件加速资源系统用于管理GPU、FPGA、NVMe SSD、SmartNIC等硬件加速资源的管理系统，通过该硬件加速资源系统，可以方便实用云平台中的硬件加速资源。

本申请实施例公开了一种vGPU管理方法，提高了创建vGPU的效率。

参见图1，根据一示例性实施例示出的一种vGPU管理方法的流程图，如图1所示，包括：

S101：若接收到目标虚拟机创建请求，则确定符合目标规格的目标主机；其中，所述目标虚拟机为绑定所述目标规格的vGPU的虚拟机，所述目标规格包括GPU型号和vGPU类型；

在本实施例中，用户可以自定义vGPU规格，其中包括GPU型号和vGPU类型。GPU型号与vGPU类型的组合，用于创建虚拟机使用。比如Tesla V100+nvidia-180，Tesla P40+nvidia-252，使用该规格创建的虚拟机将会绑定一个Tesla V100型号下的nvidia-180vGPU和一个Tesla P40型号下的nvidia-252vGPU。

在具体实施中，如图2所示，用户使用目标规格发起创建虚拟机的请求到nova-api。Nova-api下发异步创建虚拟机请求到nova-condutor。Nova-conductor首先调用nova-scheduler获取可用的候选主机。Nova-scheduler从云平台资源系统获取符合目标规格的候选主机列表信息，然后筛选出权重较高的主机，即确定符合所述目标规格的目标主机的步骤包括：获取符合所述目标规格的候选主机；根据每个所述候选主机的指标计算每个所述候选主机的权重；选择所述权重最高的候选主机为目标主机。上述候选主机的权重可以基于候选主机的各指标进行计算，例如CPU、内存、磁盘的使用率等。

S102：将所述目标主机中的资源分配至所述目标虚拟机，并记录所述目标虚拟机与所述目标规格的对应关系；

在本步骤中，将目标主机中的云平台资源分配至虚拟机，同时将目标主机信息返回给nova-condutor服务。Nova-condutor调用硬件加速资源系统接口异步分配vGPU资源，即绑定目标虚拟机与目标规格的对应关系。

S103：在所述目标主机中创建所述目标虚拟机，并创建所述目标虚拟机与所述目标规格的vGPU之间的通信中间件；

S104：启动所述目标虚拟机。

在具体实施中，调用nova-compute服务创建目标虚拟机。Nova-compute创建vGPUmdev，vGPU mdev是目标虚拟机和目标规格的vGPU通信的中间件。一旦nova-compute接收到硬件加速资源系统返回的绑定vGPU完成的消息，nova-compute生成虚拟机的xml文件，调用libvirt最终启动绑定有vGPU的虚拟机。即启动所述目标虚拟机的步骤包括：生成所述目标规格的虚拟机的xml文件，并调用libvirt启动所述目标虚拟机。

本申请实施例提供的vGPU管理方法，用户可以自定义vGPU规格，其中包括GPU型号和vGPU类型，然后选择目标规格批量创建虚拟机，最终创建出绑定有目标规格的vGPU资源的虚拟机。由此可见，本申请实施例实现了创建虚拟机绑定目标规格的vGPU资源的功能，提高了创建vGPU的效率，为云平台中vGPU的使用提供了很大的便捷性与良好的体验性。

下面介绍已创建的虚拟机绑定vGPU规格的方法，具体的：

参见图3，根据一示例性实施例示出的另一种vGPU管理方法的流程图，如图3所示，包括：

S201：在已创建的虚拟机中确定待绑定虚拟机，并向所述待绑定虚拟机分配vGPU资源；

S202：创建所述待绑定虚拟机与待绑定规格的vGPU之间的通信中间件；

S203：记录所述待绑定虚拟机与所述待绑定vGPU规格之间的对应关系。

在具体实施中，如图4所示，首先用户选择待绑定vGPU规格，并发起绑定到待绑定虚拟机的请求到nova-api。Nova-api下发同步请求到nova-compute。Nova-compute调用云平台资源系统分配vGPU资源，然后创建vGPU mdev，同时发送异步请求到硬件加速资源系统分配vGPU资源，即绑定待绑定虚拟机与待绑定vGPU规格的对应关系。Nova-compute接收到硬件加速资源系统绑定vGPU通知信息后，通知nova-api vGPU绑定成功的消息。Nova-api提示用户绑定vGPU成功。

由此可见，本实施例实现了对虚拟机单独绑定GPU资源的操作。

下面介绍虚拟机解绑vGPU资源的方法，具体的：

参见图5，根据一示例性实施例示出的又一种vGPU管理方法的流程图，如图5所示，包括：

S301：确定待解绑虚拟机，并释放所述待解绑虚拟机对应的vGPU资源；

S302：删除创建所述待解绑虚拟机与对应规格的vGPU之间的通信中间件，并删除所述待解绑虚拟机与对应规格之间的对应关系。

在具体实施中，首先用户选择待解绑vGPU规格，并发起解绑请求到nova-api。Nova-api下发同步请求到nova-compute。Nova-compute解除vGPU的资源分配，释放vGPU资源，供再次创建虚拟机使用。然后删除待解绑虚拟机的mdev信息，删除所述待解绑虚拟机与对应规格之间的对应关系。Nova-compute接收到硬件加速资源系统解绑vGPU通知信息后，通知nova-api vGPU解绑成功的消息。Nova-api提示用户解绑vGPU成功。

由此可见，本实施例实现了对虚拟机解绑GPU资源的操作。

下面对本申请实施例提供的一种vGPU管理装置进行介绍，下文描述的一种vGPU管理装置与上文描述的一种vGPU管理方法可以相互参照。

参见图6，根据一示例性实施例示出的一种vGPU管理装置的结构图，如图6所示，包括：

确定模块601，用于若接收到目标虚拟机创建请求，则确定符合目标规格的目标主机；其中，所述目标虚拟机为绑定所述目标规格的vGPU的虚拟机，所述目标规格包括GPU型号和vGPU类型；

第一记录模块602，用于将所述目标主机中的资源分配至所述目标虚拟机，并记录所述目标虚拟机与所述目标规格的对应关系；

第一创建模块603，用于在所述目标主机中创建所述目标虚拟机，并创建所述目标虚拟机与所述目标规格的vGPU之间的通信中间件；

启动模块604，用于启动所述目标虚拟机。

本申请实施例提供的vGPU管理装置，用户可以自定义vGPU规格，其中包括GPU型号和vGPU类型，然后选择目标规格批量创建虚拟机，最终创建出绑定有目标规格的vGPU资源的虚拟机。由此可见，本申请实施例实现了创建虚拟机绑定目标规格的vGPU资源的功能，提高了创建vGPU的效率，为云平台中vGPU的使用提供了很大的便捷性与良好的体验性。

在上述实施例的基础上，作为一种优选实施方式，所述确定模块601具体为若接收到目标虚拟机创建请求，则获取符合所述目标规格的候选主机，根据每个所述候选主机的指标计算每个所述候选主机的权重，选择所述权重最高的候选主机为目标主机的模块。

在上述实施例的基础上，作为一种优选实施方式，所述启动模块604具体为生成所述目标规格的虚拟机的xml文件，并调用libvirt启动所述目标虚拟机的模块。

在上述实施例的基础上，作为一种优选实施方式，还包括：

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

基于上述程序模块的硬件实现，且为了实现本申请实施例的方法，本申请实施例还提供了一种电子设备，图7为根据一示例性实施例示出的一种电子设备的结构图，如图7所示，电子设备包括：

通信接口1，能够与其它设备比如网络设备等进行信息交互；

处理器2，与通信接口1连接，以实现与其它设备进行信息交互，用于运行计算机程序时，执行上述一个或多个技术方案提供的vGPU管理方法。而所述计算机程序存储在存储器3上。

当然，实际应用时，电子设备中的各个组件通过总线系统4耦合在一起。可理解，总线系统4用于实现这些组件之间的连接通信。总线系统4除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图7中将各种总线都标为总线系统4。

本申请实施例中的存储器3用于存储各种类型的数据以支持电子设备的操作。这些数据的示例包括：用于在电子设备上操作的任何计算机程序。

可以理解，存储器3可以是易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(ROM，Read Only Memory)、可编程只读存储器(PROM，Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM，Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM，Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM，ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM，Compact Disc Read-Only Memory)；磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM，Random AccessMemory)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(SRAM，Static Random Access Memory)、同步静态随机存取存储器(SSRAM，Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM，Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM，SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM，Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM，Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM，SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM，Direct Rambus Random Access Memory)。本申请实施例描述的存储器2旨在包括但不限于这些和任意其它适合类型的存储器。

上述本申请实施例揭示的方法可以应用于处理器2中，或者由处理器2实现。处理器2可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器2中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器2可以是通用处理器、DSP，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器2可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤，可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中，该存储介质位于存储器3，处理器2读取存储器3中的程序，结合其硬件完成前述方法的步骤。

处理器2执行所述程序时实现本申请实施例的各个方法中的相应流程，为了简洁，在此不再赘述。

在示例性实施例中，本申请实施例还提供了一种存储介质，即计算机存储介质，具体为计算机可读存储介质，例如包括存储计算机程序的存储器3，上述计算机程序可由处理器2执行，以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台电子设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种vGPU管理方法，其特征在于，包括：

启动所述目标虚拟机。

2.根据权利要求1所述vGPU管理方法，其特征在于，确定符合所述目标规格的目标主机，包括：

获取符合所述目标规格的候选主机；

选择所述权重最高的候选主机为目标主机。

3.根据权利要求1所述vGPU管理方法，其特征在于，启动所述目标虚拟机，包括：

4.根据权利要求1所述vGPU管理方法，其特征在于，还包括：

5.根据权利要求1所述vGPU管理方法，其特征在于，还包括：

6.一种vGPU管理装置，其特征在于，包括：

启动模块，用于启动所述目标虚拟机。

7.根据权利要求6所述vGPU管理装置，其特征在于，还包括：

8.根据权利要求6所述vGPU管理装置，其特征在于，还包括：

9.一种超声设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至5任一项所述vGPU管理方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述vGPU管理方法的步骤。