CN115546008A - 一种gpu虚拟化管理系统和方法 - Google Patents

一种gpu虚拟化管理系统和方法 Download PDF

Info

Publication number
CN115546008A
CN115546008A CN202211492010.2A CN202211492010A CN115546008A CN 115546008 A CN115546008 A CN 115546008A CN 202211492010 A CN202211492010 A CN 202211492010A CN 115546008 A CN115546008 A CN 115546008A
Authority
CN
China
Prior art keywords
gpu
virtual
virtual machine
module
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211492010.2A
Other languages
English (en)
Other versions
CN115546008B (zh
Inventor
江鸿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Src Technology Co ltd
Original Assignee
Wuhan Src Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Src Technology Co ltd filed Critical Wuhan Src Technology Co ltd
Priority to CN202211492010.2A priority Critical patent/CN115546008B/zh
Publication of CN115546008A publication Critical patent/CN115546008A/zh
Application granted granted Critical
Publication of CN115546008B publication Critical patent/CN115546008B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明提供的一种GPU虚拟化管理系统和方法,系统包括:用户交互模块、应用服务模块和KVM底层模块;应用服务模块,用于根据交互指令生成资源分配指令,并将资源分配指令发送至KVM底层模块;KVM底层模块,用于根据所述资源分配指令,获取其对应的虚拟GPU,并将虚拟GPU挂载至预设虚拟机中。本发明通过根据用户的交互指令生成资源分配指令,并通过资源分配指令为用户分配虚拟GPU资源,从而实现了物理GPU资源虚拟化使用,多个用户分段时间共享同一物理GPU资源的目的,进而可以在存在多个用户需要使用GPU资源时为每个用户合理分配虚拟GPU资源,有效降低了GPU资源的空闲率。

Description

一种GPU虚拟化管理系统和方法
技术领域
本发明涉及计算机技术领域,更具体地,涉及一种GPU虚拟化管理系统和方法。
背景技术
图形处理器(graphics processing unit,GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时GPU所采用的核心技术有硬件T&L(几何转换和光照处理)、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬件T&L技术可以说是GPU的标志。
随着计算机硬件的高速发展,计算机的数据处理能力也得到了极大的提升。在一些需要大量的图形渲染和虚拟桌面需求的行业,由于同时采购多个大型图形工作站无疑会大大的增加企业的成本,同时多个用户也并非同时段使用图形工作站,并且使其GPU的算力达到满负荷运行,而虚拟化技术无疑成为解决改善这种情况的关键,因此,如何通过虚拟化技术为用户合理分配GPU算力是亟待解决的问题。
发明内容
本发明针对现有技术中存在的技术问题,提供一种GPU虚拟化管理系统和方法,用以解决如何通过虚拟化技术为用户合理分配GPU算力的问题。
根据本发明的第一方面,提供了一种GPU虚拟化管理系统,包括:用户交互模块、应用服务模块和KVM底层模块;
所述用户交互模块,用于接收用户交互指令,并将所述交互指令发送至所述应用服务模块;
所述应用服务模块,用于根据所述交互指令生成资源分配指令,并将所述资源分配指令发送至所述KVM底层模块;
所述KVM底层模块,用于根据所述资源分配指令,获取其对应的虚拟GPU,并将所述虚拟GPU挂载至预设虚拟机中。
在上述技术方案的基础上,本发明还可以作出如下改进。
优选的,所述应用服务模块包括:动态配置单元、消息队列单元和数据存储单元;
所述动态配置单元,用于动态管理所述应用服务模块中的所有应用配置和服务配置;
所述消息队列单元,用于将所述用户交互模块、所述应用服务模块和所述KVM底层模块发出的指令和/或消息转发至对应模块;
所述数据存储单元,用于存储系统初始化已经系统运行过程中产生的数据。
优选的,所述数据存储单元包括:缓存数据库和关系型数据库;
所述缓存数据库,用于存储所述预设虚拟机的配置信息;
所述关系型数据库,用于存储所述用户的详细信息以及其与所述预设虚拟机的对应关系。
优选的,所述系统还包括:虚拟环境管理模块;
所述虚拟环境管理模块,用于为系统中虚拟环境的操作指令以及参数配置提供支持,所述操作指令至少包括虚拟机创建、虚拟机状态更新、网络参数配置和存储空间配置。
优选的,所述应用服务模块,还包括:资源管理模块;
所述资源管理模块,用于根据所述用户发送的关机指令,卸载所述预设虚拟机中挂载的虚拟GPU,释放虚拟GPU资源。
优选的,所述系统还包括:自动巡检模块;
所述自动巡检模块,用于基于预设巡检周期检测系统中处于关机状态的虚拟机的虚拟GPU状态,所述虚拟GPU状态至少包括挂载中、未挂载。
优选的,所述系统还包括:资源供给模块;
所述资源供给模块,用于将所述预设虚拟机通过所述用户交互模块为所述用户提供服务。
根据本发明的第二方面,提供一种GPU虚拟化管理方法,包括:
基于用户发送的登录指令,获取所述用户对应的GPU资源信息;
根据所述GPU资源信息生成资源分配指令;
基于所述资源分配指令获取其对应的虚拟GPU资源;
将所述虚拟GPU资源挂载至预设虚拟机中,基于所述预设虚拟机为所述用户提供GPU算力。
优选的,所述将所述虚拟GPU资源挂载至预设虚拟机中,基于所述预设虚拟机为所述用户提供GPU算力的步骤之后,还包括:
基于用户发送的关机指令,获取所述关机指令对应的虚拟机;
将所述虚拟机中的虚拟GPU进行卸载,在卸载完成后关闭所述虚拟机。
优选的,所述在卸载完成后关闭所述虚拟机的步骤之后,还包括:
基于预设巡检周期检测当前虚拟环境中处于关机状态的虚拟机的虚拟GPU状态,所述虚拟GPU状态至少包括挂载中、未挂载;
在所述虚拟GPU状态为挂载中时,对所述虚拟机的虚拟GPU进行卸载。
根据本发明的第三方面,提供了一种电子设备,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现上述第二方面中任一GPU虚拟化管理方法的步骤。
根据本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现上述第二方面中任一GPU虚拟化管理方法的步骤。
本发明提供的一种GPU虚拟化管理系统和方法,系统包括:用户交互模块、应用服务模块和KVM底层模块;所述用户交互模块,用于接收用户交互指令,并将所述交互指令发送至所述应用服务模块;所述应用服务模块,用于根据所述交互指令生成资源分配指令,并将所述资源分配指令发送至所述KVM底层模块;所述KVM底层模块,用于根据所述资源分配指令,获取其对应的虚拟GPU,并将所述虚拟GPU挂载至预设虚拟机中。本发明通过根据用户的交互指令生成资源分配指令,并通过资源分配指令为用户分配虚拟GPU资源,从而实现了物理GPU资源虚拟化使用,多个用户分段时间共享同一物理GPU资源的目的,进而可以在存在多个用户需要使用GPU资源时为每个用户合理分配虚拟GPU资源,有效降低了GPU资源的空闲率,大大节省了GPU算力的使用成本。
附图说明
图1为本发明提供的一种GPU虚拟化管理系统结构示意图;
图2为本发明提供的GPU虚拟化管理系统操作时序图;
图3为本发明提供的自动设备巡检流程的示意图;
图4为本发明提供的一种GPU虚拟化管理方法流程图;
图5为本发明提供的一种可能的电子设备的硬件结构示意图;
图6为本发明提供的一种可能的计算机可读存储介质的硬件结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
图1为本发明提供的一种GPU虚拟化管理系统结构示意图,如图1所示,系统包括:用户交互模块、应用服务模块和KVM底层模块。
其中,所述用户交互模块,用于接收用户交互指令,并将所述交互指令发送至所述应用服务模块;所述应用服务模块,用于根据所述交互指令生成资源分配指令,并将所述资源分配指令发送至所述KVM底层模块;所述KVM底层模块,用于根据所述资源分配指令,获取其对应的虚拟GPU,并将所述虚拟GPU挂载至预设虚拟机中。
需要说明的是,在使用本系统之前还可以在一台实体设备中部署搭建KVM底层系统,从而通过上述KVM底层系统提供虚拟化服务。
同时,上述KVM-Engine管理平台还可用于管理配置网络接口,将上述实体设备加入至公司路由设备中,可以使得上述实体设备可以在公司内网中使用,从个人完成虚拟机的操作以及虚拟机网络的配置。
可以理解的是,上述用户交互指令可以是用户发出的登录指令,也可以是用户发出了使用虚拟机的操作指令,本实施例对此不作限制,上述在发出上述交互指令之前并未开启需要使用的虚拟机。
应理解的是,上述资源分配指令中可以包含有虚拟GPU的相关参数,例如:显存大小、承载显示器最大数量、最大分辨率、支持的最大用户数和/或用户场景;还可以包含有对应的虚拟机ID,用于在虚拟GPU分配成功后通过虚拟机ID挂载至对应的虚拟机中。
在具体实现中,系统通过用户交互模块接收到用户发送的交互指令后,解析交互指令中的用户信息,根据用户信息获取用户的权限,当用户的权限中包含有可以使用的虚拟机时,将虚拟机列表发送给用户,以使用户选择对应的虚拟机设备,若没有可使用的虚拟机时,则设定用户选定的是通用虚拟机设备,应用服务模块在接收到上述虚拟机设备时,根据上述虚拟机设备的参数生成资源分配指令,并调用KVM底层模块的API,对系统所在实体设备中的实体GPU进行虚拟化,并将虚拟化后的GPU进行分片,得到上述虚拟机设备的参数对应的虚拟GPU,当用户选择了虚拟机设备时,将上述虚拟GPU挂载至对应的虚拟机设备上,当用户选择的是通用虚拟机设备时,调用KVM底层模块创建一个新的虚拟机设备,并将上述虚拟GPU挂载至上述新的虚拟机设备,从而为用户提供GPU算力。
作为实施例,所述应用服务模块包括:动态配置单元、消息队列单元和数据存储单元。
其中,所述动态配置单元,用于动态管理所述应用服务模块中的所有应用配置和服务配置;所述消息队列单元,用于将所述用户交互模块、所述应用服务模块和所述KVM底层模块发出的指令和/或消息转发至对应模块;所述数据存储单元,用于存储系统初始化已经系统运行过程中产生的数据。
需要说明的是,在上述KVM部署完成后,还需要创建一台虚拟及用户部署安装应用服务模块的基础环境,上述基础环境包括:Redis、mysql、Nacos、RabbitMQ以及调用java的jar服务包。
可以理解的是,上述动态配置单元为Nacos,上述Nacos可以用于发现、配置和管理微服务。Nacos 提供了一组简单易用的特性集,可以用于快速实现动态服务发现、服务配置、服务元数据及流量管理。上述动态配置单元中的服务包括但不限于:用户登录、权限认证、虚拟机操作。
应理解的是,上述消息队列单元为RabbitMQ,RabbitMQ是实现了高级消息对垒协议的开源消息代理软件(也称之为面向消息的中间件),上述消息队列单元主要用于系统中各模块之间的通讯。
作为实施例,所述数据存储单元包括:缓存数据库和关系型数据库;其中,所述缓存数据库,用于存储所述预设虚拟机的配置信息;所述关系型数据库,用于存储所述用户的详细信息以及其与所述预设虚拟机的对应关系。
可以理解的是,上述缓存数据库为上述Redis,用于存储通用虚拟机的参数模板,以及对应的虚拟GPU参数信息。
应理解的是,上述关系型数据库为上是mysql,用于存储系统中的业务数据,包括但不限于用于与虚拟机的对应关系,以及用户信息和用户权限等。
作为实施例,所述GPU虚拟化管理系统还包括:虚拟环境管理模块;其中,所述虚拟环境管理模块,用于为系统中虚拟环境的操作指令以及参数配置提供支持,所述操作指令至少包括虚拟机创建、虚拟机状态更新、网络参数配置和存储空间配置。
可以理解的是,KVM底层系统之上还可以包括KVM-Engine管理平台,KVM-Engine是基于Web的管理平台,可以通过Web protal对整个KVM环境进行管理;KVM-Engine搭建在一体机环境中,用于根据指令创建虚拟机,给虚拟机分配vGPU资源并启动所述虚拟机,从而运行业务程序;也可还用于提供GPU直通、GPU完全虚拟化和SR-IOV支持,从而使虚拟机获得GPU的运算能力,能进行图形渲染、科学计算等工作;也可用于对外提供控制接口,控制接口包括创建、开启、删除虚拟机,更新虚拟机配置、配置并开启GPU虚拟化和调整虚拟GPU配置等功能。
作为实施例,所述应用服务模块还包括:资源管理模块;所述资源管理模块,用于根据所述用户发送的关机指令,卸载所述预设虚拟机中挂载的虚拟GPU,释放虚拟GPU资源。
在具体实现中,为了避免虚拟GPU资源长期被占用而产生资源浪费,在用户不在需要使用虚拟机时,也即是用户发送关机指令时,资源管理模块还可以调用KVM底层系统API卸载上述用户选择关闭的虚拟机中的虚拟GPU,从而释放GPU资源,实现GPU虚拟化动态管理的目的,大大提高了GPU资源的利用率。
作为实施例,所述GPU虚拟化管理系统还包括:所述资源供给模块,用于将所述预设虚拟机通过所述用户交互模块为所述用户提供服务。
可以理解的是,基于背景技术中的缺陷,本发明提供的一种GPU虚拟化管理系统和方法,系统包括:用户交互模块、应用服务模块和KVM底层模块;所述用户交互模块,用于接收用户交互指令,并将所述交互指令发送至所述应用服务模块;所述应用服务模块,用于根据所述交互指令生成资源分配指令,并将所述资源分配指令发送至所述KVM底层模块;所述KVM底层模块,用于根据所述资源分配指令,获取其对应的虚拟GPU,并将所述虚拟GPU挂载至预设虚拟机中。本发明通过根据用户的交互指令生成资源分配指令,并通过资源分配指令为用户分配虚拟GPU资源,从而实现了物理GPU资源虚拟化使用,多个用户分段时间共享同一物理GPU资源的目的,进而可以在存在多个用户需要使用GPU资源时为每个用户合理分配虚拟GPU资源,有效降低了GPU资源的空闲率,大大节省了GPU算力的使用成本。
在一种可能的应用场景中,本发明实施例还包括一种可能的实施流程,参见图2,图2为本发明提供的GPU虚拟化管理系统操作时序图;在图2中,用户首先通过展示层输出用户信息进行登录,展示层将登录指令发送至服务层,服务层会对登录信息进验证,在验证失败时返回登录失败的消息至展示层,以使用户重置密码或重新进行登录;若验证成功,则根据查询系统中Mysql数据库中的用户权限,将用户权限中对应的虚拟机设备列表返回至展示层,以使用户选择设备,并将设备ID发送至服务层,服务层根据上述设备ID查询虚拟机的信息,从而获取用户选定的虚拟机配置参数,并根据上述配置参数生成资源分配指令,从而根据上述资源分配指令调用KVM底层API对虚拟化的GPU进行切片,得到对应的虚拟GPU资源,并将上述虚拟GPU资源挂载至上述虚拟机中并启动,虚拟机将自身的端口号返回至服务层,服务层基于上述虚拟机端口号为用户提供虚拟服务。当用户发送关机指令时,虚拟机通知KVM底层卸载自身的显卡,当卸载成功后,调用自身的关机命令进行关机。
服务层中,还包括有定期巡检服务,根据管理员设定的巡检周期,检测系统中虚拟机的虚拟GPU状态。
作为实施例,所述GPU虚拟化管理系统还包括:自动巡检模块;其中,所述自动巡检模块,用于基于预设巡检周期检测系统中处于关机状态的虚拟机的虚拟GPU状态,所述虚拟GPU状态至少包括挂载中、未挂载。
在具体实现中,为了进一步降低GPU资源因占比而未被使用产生的资源浪费,本实施例还包括了自动巡检模块,参见图3,图3为本发明提供的自动设备巡检流程的示意图,通过管理员设定的巡检周期(通常可以为一天,也可以根据实体机的性能设定,当实体机的GPU算力远远大于平均使用量时可适当延长)唤醒检测线程,查询已使用显卡的虚拟机,检查其是否处于关机状态,若处于关机状态则对关机状态的虚拟机中的虚拟GPU状态进行检测,当检测到虚拟GPU为未挂载时设定虚拟机为正常状态,当检测到虚拟GPU为挂载中状态时,则调用KVM底层系统将对应的虚拟GPU进行卸载。
请参阅图4,图4为本发明实施例提供的一种GPU虚拟化管理方法流程图,如图4所示,一种GPU虚拟化管理方法,方法包括:
步骤S100:基于用户发送的登录指令,获取所述用户对应的GPU资源信息;
需要说明的是,本实施例方法的执行主体可以是具有数据处理、网络通信及程序运行功能的计算机终端设备,例如:电脑、平板电脑等;也可以是具有相同相似功能的服务器设备,还可以是具有相似功能的云服务器,本实施例对此不做限制。为了便于理解,本实施例及下述各实施例将以服务器设备为例进行说明。
步骤S200:根据所述GPU资源信息生成资源分配指令;
步骤S300:基于所述资源分配指令获取其对应的虚拟GPU资源;
步骤S400:将所述虚拟GPU资源挂载至预设虚拟机中,基于所述预设虚拟机为所述用户提供GPU算力。
在一种可能的实现方式中,所述将所述虚拟GPU资源挂载至预设虚拟机中,基于所述预设虚拟机为所述用户提供GPU算力的步骤之后,还包括:
步骤S500:基于用户发送的关机指令,获取所述关机指令对应的虚拟机;
步骤S600:将所述虚拟机中的虚拟GPU进行卸载,在卸载完成后关闭所述虚拟机。
在一种可能的实现方式中,所述在卸载完成后关闭所述虚拟机的步骤之后,还包括:
步骤S700:基于预设巡检周期检测当前虚拟环境中处于关机状态的虚拟机的虚拟GPU状态,所述虚拟GPU状态至少包括挂载中、未挂载;
步骤S800:在所述虚拟GPU状态为挂载中时,对所述虚拟机的虚拟GPU进行卸载。
可以理解的是,本发明提供的一种GPU虚拟化管理方法与前述各实施例提供的GPU虚拟化管理系统相对应,GPU虚拟化管理方法的相关技术特征可参考GPU虚拟化管理系统的相关技术特征,在此不再赘述。
请参阅图5,图5为本发明实施例提供的电子设备的实施例示意图。如图5所示,本发明实施例提供了一种电子设备,包括存储器1310、处理器1320及存储在存储器1310上并可在处理器1320上运行的计算机程序1311,处理器1320执行计算机程序1311时实现以下步骤:
基于用户发送的登录指令,获取上述用户对应的GPU资源信息;根据上述GPU资源信息生成资源分配指令;基于上述资源分配指令对物理GPU进行虚拟化,得到上述GPU资源信息对应的虚拟GPU资源;将上述虚拟GPU资源挂载至预设虚拟机中,基于上述预设虚拟机为上述用户提供GPU算力。
请参阅图6,图6为本发明提供的一种计算机可读存储介质的实施例示意图。如图6所示,本实施例提供了一种计算机可读存储介质1400,其上存储有计算机程序1411,该计算机程序1411被处理器执行时实现如下步骤:
基于用户发送的登录指令,获取上述用户对应的GPU资源信息;根据上述GPU资源信息生成资源分配指令;基于上述资源分配指令对物理GPU进行虚拟化,得到上述GPU资源信息对应的虚拟GPU资源;将上述虚拟GPU资源挂载至预设虚拟机中,基于上述预设虚拟机为上述用户提供GPU算力。
本发明提供的一种GPU虚拟化管理系统和方法,系统包括:用户交互模块、应用服务模块和KVM底层模块;所述用户交互模块,用于接收用户交互指令,并将所述交互指令发送至所述应用服务模块;所述应用服务模块,用于根据所述交互指令生成资源分配指令,并将所述资源分配指令发送至所述KVM底层模块;所述KVM底层模块,用于根据所述资源分配指令,获取其对应的虚拟GPU,并将所述虚拟GPU挂载至预设虚拟机中。本发明通过根据用户的交互指令生成资源分配指令,并通过资源分配指令为用户分配虚拟GPU资源,从而实现了物理GPU资源虚拟化使用,多个用户分段时间共享同一物理GPU资源的目的,进而可以在存在多个用户需要使用GPU资源时为每个用户合理分配虚拟GPU资源,有效降低了GPU资源的空闲率,大大节省了GPU算力的使用成本。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (10)

1.一种GPU虚拟化管理系统,其特征在于,所述系统包括:用户交互模块、应用服务模块和KVM底层模块;
所述用户交互模块,用于接收用户交互指令,并将所述交互指令发送至所述应用服务模块;
所述应用服务模块,用于根据所述交互指令生成资源分配指令,并将所述资源分配指令发送至所述KVM底层模块;
所述KVM底层模块,用于根据所述资源分配指令,获取其对应的虚拟GPU,并将所述虚拟GPU挂载至预设虚拟机中。
2.根据权利要求1所述的GPU虚拟化管理系统,其特征在于,所述应用服务模块包括:动态配置单元、消息队列单元和数据存储单元;
所述动态配置单元,用于动态管理所述应用服务模块中的所有应用配置和服务配置;
所述消息队列单元,用于将所述用户交互模块、所述应用服务模块和所述KVM底层模块发出的指令和/或消息转发至对应模块;
所述数据存储单元,用于存储系统初始化已经系统运行过程中产生的数据。
3.根据权利要求2所述的GPU虚拟化管理系统,其特征在于,所述数据存储单元包括:缓存数据库和关系型数据库;
所述缓存数据库,用于存储所述预设虚拟机的配置信息;
所述关系型数据库,用于存储所述用户的详细信息以及其与所述预设虚拟机的对应关系。
4.根据权利要求1所述的GPU虚拟化管理系统,其特征在于,所述系统还包括:虚拟环境管理模块;
所述虚拟环境管理模块,用于为系统中虚拟环境的操作指令以及参数配置提供支持,所述操作指令至少包括虚拟机创建、虚拟机状态更新、网络参数配置和存储空间配置。
5.根据权利要求1所述的GPU虚拟化管理系统,其特征在于,所述应用服务模块还包括:资源管理模块;
所述资源管理模块,用于根据所述用户发送的关机指令,卸载所述预设虚拟机中挂载的虚拟GPU,释放虚拟GPU资源。
6.根据权利要求1所述的GPU虚拟化管理系统,其特征在于,所述系统还包括:自动巡检模块;
所述自动巡检模块,用于基于预设巡检周期检测系统中处于关机状态的虚拟机的虚拟GPU状态,所述虚拟GPU状态至少包括挂载中、未挂载。
7.根据权利要求1所述的GPU虚拟化管理系统,其特征在于,所述系统还包括:资源供给模块;
所述资源供给模块,用于将所述预设虚拟机通过所述用户交互模块为所述用户提供服务。
8.一种GPU虚拟化管理方法,其特征在于,包括:
基于用户发送的登录指令,获取所述用户对应的GPU资源信息;
根据所述GPU资源信息生成资源分配指令;
基于所述资源分配指令获取其对应的虚拟GPU资源;
将所述虚拟GPU资源挂载至预设虚拟机中,基于所述预设虚拟机为所述用户提供GPU算力。
9.根据权利要求8所述的GPU虚拟化管理方法,其特征在于,所述将所述虚拟GPU资源挂载至预设虚拟机中,基于所述预设虚拟机为所述用户提供GPU算力的步骤之后,还包括:
基于用户发送的关机指令,获取所述关机指令对应的虚拟机;
将所述虚拟机中的虚拟GPU进行卸载,在卸载完成后关闭所述虚拟机。
10.根据权利要求9所述的GPU虚拟化管理方法,其特征在于,所述在卸载完成后关闭所述虚拟机的步骤之后,还包括:
基于预设巡检周期检测当前虚拟环境中处于关机状态的虚拟机的虚拟GPU状态,所述虚拟GPU状态至少包括挂载中、未挂载;
在所述虚拟GPU状态为挂载中时,对所述虚拟机的虚拟GPU进行卸载。
CN202211492010.2A 2022-11-25 2022-11-25 一种gpu虚拟化管理系统和方法 Active CN115546008B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211492010.2A CN115546008B (zh) 2022-11-25 2022-11-25 一种gpu虚拟化管理系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211492010.2A CN115546008B (zh) 2022-11-25 2022-11-25 一种gpu虚拟化管理系统和方法

Publications (2)

Publication Number Publication Date
CN115546008A true CN115546008A (zh) 2022-12-30
CN115546008B CN115546008B (zh) 2023-03-31

Family

ID=84721771

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211492010.2A Active CN115546008B (zh) 2022-11-25 2022-11-25 一种gpu虚拟化管理系统和方法

Country Status (1)

Country Link
CN (1) CN115546008B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140032761A1 (en) * 2012-07-25 2014-01-30 Vmware, Inc. Dynamic allocation of physical computing resources amongst virtual machines
CN104660711A (zh) * 2015-03-13 2015-05-27 华存数据信息技术有限公司 一种基于图形处理器虚拟化的远程可视化应用方法
CN106775940A (zh) * 2016-12-06 2017-05-31 郑州云海信息技术有限公司 一种图形处理系统及虚拟化方法
CN107329799A (zh) * 2017-05-22 2017-11-07 国网安徽省电力公司信息通信分公司 一种融合Docker容器与KVM虚拟化技术的系统
CN108804199A (zh) * 2017-05-05 2018-11-13 龙芯中科技术有限公司 图形处理器虚拟化方法及装置
US10176550B1 (en) * 2017-03-20 2019-01-08 Nutanix, Inc. GPU resource usage display and dynamic GPU resource allocation in a networked virtualization system
CN111209115A (zh) * 2020-01-08 2020-05-29 北京和信创天科技股份有限公司 云桌面vGPU超分配方法
CN111580934A (zh) * 2020-05-13 2020-08-25 杭州电子科技大学 云计算环境下多租户虚拟机性能一致的资源分配方法
CN112948033A (zh) * 2021-01-28 2021-06-11 西安超越申泰信息科技有限公司 一种虚拟桌面平台
CN114138483A (zh) * 2021-11-29 2022-03-04 平安壹账通云科技(深圳)有限公司 一种虚拟化资源管理方法、装置、服务器、系统及介质
CN114416274A (zh) * 2021-10-18 2022-04-29 徐州医科大学 一种虚拟资源管理系统及其方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140032761A1 (en) * 2012-07-25 2014-01-30 Vmware, Inc. Dynamic allocation of physical computing resources amongst virtual machines
CN104660711A (zh) * 2015-03-13 2015-05-27 华存数据信息技术有限公司 一种基于图形处理器虚拟化的远程可视化应用方法
CN106775940A (zh) * 2016-12-06 2017-05-31 郑州云海信息技术有限公司 一种图形处理系统及虚拟化方法
US10176550B1 (en) * 2017-03-20 2019-01-08 Nutanix, Inc. GPU resource usage display and dynamic GPU resource allocation in a networked virtualization system
CN108804199A (zh) * 2017-05-05 2018-11-13 龙芯中科技术有限公司 图形处理器虚拟化方法及装置
CN107329799A (zh) * 2017-05-22 2017-11-07 国网安徽省电力公司信息通信分公司 一种融合Docker容器与KVM虚拟化技术的系统
CN111209115A (zh) * 2020-01-08 2020-05-29 北京和信创天科技股份有限公司 云桌面vGPU超分配方法
CN111580934A (zh) * 2020-05-13 2020-08-25 杭州电子科技大学 云计算环境下多租户虚拟机性能一致的资源分配方法
CN112948033A (zh) * 2021-01-28 2021-06-11 西安超越申泰信息科技有限公司 一种虚拟桌面平台
CN114416274A (zh) * 2021-10-18 2022-04-29 徐州医科大学 一种虚拟资源管理系统及其方法
CN114138483A (zh) * 2021-11-29 2022-03-04 平安壹账通云科技(深圳)有限公司 一种虚拟化资源管理方法、装置、服务器、系统及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LI TENG: "GPU resource sharing and virtualization on high performance computing systems" *
陈志佳;朱元昌;邸彦强;冯少冲;: "一种改进的GPU虚拟化实施方法" *

Also Published As

Publication number Publication date
CN115546008B (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
US11405274B2 (en) Managing virtual network functions
CN111488196B (zh) 渲染方法及装置、存储介质、处理器
CN112104723B (zh) 一种多集群的数据处理系统及方法
US20160205541A1 (en) Apparatus For End-User Transparent Utilization of Computational, Storage, and Network Capacity of Mobile Devices, and Associated Methods
US20220156133A1 (en) Cross-Process Communication Method, Apparatus, and Device
US11210132B2 (en) Virtual machine migration in virtualization environment having different virtualization systems
AU2019256257B2 (en) Processor core scheduling method and apparatus, terminal, and storage medium
JP2022516486A (ja) リソース管理方法と装置、電子デバイス、及び記録媒体
CN108073423B (zh) 一种加速器加载方法、系统和加速器加载装置
JP2013508869A (ja) アプリケーション画像の表示方法及び装置
CN111651219A (zh) 一种多模块项目配置文件管理的方法及设备
WO2022041507A1 (zh) 3d渲染方法及系统
CN111338641A (zh) 一种应用发布方法及装置
US10318343B2 (en) Migration methods and apparatuses for migrating virtual machine including locally stored and shared data
CN111459403B (zh) 一种存储硬件管理方法及装置
CN115686805A (zh) Gpu资源共享的方法和装置、调度gpu资源共享的方法和装置
CN107734050B (zh) 一种负载机分配方法、计算设备及负载机分配系统
CN116800616B (zh) 虚拟化网络设备的管理方法及相关装置
WO2018103372A1 (zh) 一种驱动管理方法及宿主机
CN115546008B (zh) 一种gpu虚拟化管理系统和方法
CN116860391A (zh) Gpu算力资源调度方法、装置、设备和介质
CN115562807A (zh) 一种在kubernetes环境下为安卓容器挂载动态设备的方法及系统
CN114281444A (zh) 一种实施云桌面客户端的布置方法
CN114579250A (zh) 一种构建虚拟集群的方法、装置及存储介质
CN112583653A (zh) 压力测试方法、装置及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant