CN117742957A - 内存分配方法、装置、电子设备和存储介质 - Google Patents

内存分配方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN117742957A
CN117742957A CN202311764609.1A CN202311764609A CN117742957A CN 117742957 A CN117742957 A CN 117742957A CN 202311764609 A CN202311764609 A CN 202311764609A CN 117742957 A CN117742957 A CN 117742957A
Authority
CN
China
Prior art keywords
memory
capacity
virtual gpu
residual
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311764609.1A
Other languages
English (en)
Inventor
请求不公布姓名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Moore Threads Technology Co Ltd
Original Assignee
Moore Threads Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Moore Threads Technology Co Ltd filed Critical Moore Threads Technology Co Ltd
Priority to CN202311764609.1A priority Critical patent/CN117742957A/zh
Publication of CN117742957A publication Critical patent/CN117742957A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Memory System (AREA)

Abstract

本公开涉及一种内存分配方法、装置、电子设备和存储介质。所述方法包括:响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,其中,所述可分配系统内存剩余容量表示允许分配给虚拟GPU的系统内存的剩余容量;响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存。

Description

内存分配方法、装置、电子设备和存储介质
技术领域
本公开涉及计算机技术领域,尤其涉及一种内存分配方法、装置、电子设备和存储介质。
背景技术
GPU(Graphics Processing Unit,图形处理器)作为有计算能力的处理器,包括计算单元和存储单元。其中,计算单元完成下发给GPU的各种计算任务。在计算单元完成计算任务的过程中,计算单元需要访问数据,且需要保存计算单元的计算结果和计算过程产生的临时数据,因此,存储单元也是GPU的重要组成部分。在典型的计算机系统中,GPU通常作为PCI(Peripheral Component Interconnect,外设部件互连)设备,在显卡上有GPU专用的内存(即显存)。
目前,虚拟GPU(vGPU)的存储资源分配全部使用显存,资源利用率较低。
发明内容
本公开提供了一种内存分配技术方案。
根据本公开的一方面,提供了一种内存分配方法,包括:
响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,其中,所述可分配系统内存剩余容量表示允许分配给虚拟GPU的系统内存的剩余容量;
响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存。
在一种可能的实现方式中,
所述响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,包括:响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量;响应于所述目标内存容量大于所述剩余显存容量,获取可分配系统内存剩余容量;
所述响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存,包括:响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和所述系统内存中、或者仅从所述系统内存中为所述虚拟GPU分配内存。
在一种可能的实现方式中,
所述响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,包括:响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量;
所述响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存,包括:响应于所述剩余显存容量大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存中为所述虚拟GPU分配内存。
在一种可能的实现方式中,所述方法还包括:
响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存。
在一种可能的实现方式中,所述第一预设内存位置交换条件包括:
所述第一虚拟GPU的优先级高于所述第二虚拟GPU的优先级。
在一种可能的实现方式中,所述第一预设内存位置交换条件还包括:
所述第一虚拟GPU为占用所述系统内存的虚拟GPU中,优先级最高的虚拟GPU。
在一种可能的实现方式中,所述第一预设内存位置交换条件还包括:
所述第一内存页为所述第一虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
在一种可能的实现方式中,所述第一预设内存位置交换条件还包括:
所述第二虚拟GPU为显存占用比例大于或等于预设比例的虚拟GPU中,优先级最低的虚拟GPU,其中,任一虚拟GPU的显存占用比例表示所述虚拟GPU所占用的显存容量与所述虚拟GPU所占用的总内存容量的比例,所述虚拟GPU所占用的总内存容量为所述虚拟GPU所占用的显存容量与系统内存容量之和;
或者,
所述第二虚拟GPU为占用所述显存的虚拟GPU中,优先级最低的虚拟GPU。
在一种可能的实现方式中,所述第一预设内存位置交换条件还包括:
所述第二内存页为所述第二虚拟GPU在所述显存的内存页中,使用率最低的内存页。
在一种可能的实现方式中,所述响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存,包括:
通过宿主机中的虚拟机监控程序响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存。
在一种可能的实现方式中,所述方法还包括:
响应于所述剩余显存容量大于或等于单个内存页的大小,且所述系统内存中第三虚拟GPU的第三内存页满足第二预设内存位置交换条件,将所述第三内存页交换至所述显存。
在一种可能的实现方式中,所述第二预设内存位置交换条件包括:
所述第三虚拟GPU为占用所述系统内存的虚拟GPU中,优先级最高的虚拟GPU。
在一种可能的实现方式中,所述第二预设内存位置交换条件还包括:
所述第三内存页为所述第三虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
在一种可能的实现方式中,所述第二预设内存位置交换条件包括:
所述第三内存页为各个虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
在一种可能的实现方式中,所述方法还包括:
获取超分比例,其中,所述超分比例表示虚拟GPU能够使用的系统内存的最大容量占显存容量的比例;
根据所述超分比例和所述显存容量,确定可分配系统内存总容量;
根据所述可分配系统内存总容量,申请系统内存。
在一种可能的实现方式中,在所述获取可分配系统内存剩余容量之后,所述方法还包括:
响应于所述剩余显存容量与所述可分配系统内存剩余容量之和小于所述目标内存容量,返回虚拟GPU创建失败的消息。
根据本公开的一方面,提供了一种内存分配装置,包括:
第一获取模块,用于响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,其中,所述可分配系统内存剩余容量表示允许分配给虚拟GPU的系统内存的剩余容量;
内存分配模块,用于响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存。
在一种可能的实现方式中,
所述第一获取模块用于:响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量;响应于所述目标内存容量大于所述剩余显存容量,获取可分配系统内存剩余容量;
所述内存分配模块用于:响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和所述系统内存中、或者仅从所述系统内存中为所述虚拟GPU分配内存。
在一种可能的实现方式中,
所述第一获取模块用于:响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量;
所述内存分配模块用于:响应于所述剩余显存容量大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存中为所述虚拟GPU分配内存。
在一种可能的实现方式中,所述装置还包括:
第一交换模块,用于响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存。
在一种可能的实现方式中,所述第一预设内存位置交换条件包括:
所述第一虚拟GPU的优先级高于所述第二虚拟GPU的优先级。
在一种可能的实现方式中,所述第一预设内存位置交换条件还包括:
所述第一虚拟GPU为占用所述系统内存的虚拟GPU中,优先级最高的虚拟GPU。
在一种可能的实现方式中,所述第一预设内存位置交换条件还包括:
所述第一内存页为所述第一虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
在一种可能的实现方式中,所述第一预设内存位置交换条件还包括:
所述第二虚拟GPU为显存占用比例大于或等于预设比例的虚拟GPU中,优先级最低的虚拟GPU,其中,任一虚拟GPU的显存占用比例表示所述虚拟GPU所占用的显存容量与所述虚拟GPU所占用的总内存容量的比例,所述虚拟GPU所占用的总内存容量为所述虚拟GPU所占用的显存容量与系统内存容量之和;
或者,
所述第二虚拟GPU为占用所述显存的虚拟GPU中,优先级最低的虚拟GPU。
在一种可能的实现方式中,所述第一预设内存位置交换条件还包括:
所述第二内存页为所述第二虚拟GPU在所述显存的内存页中,使用率最低的内存页。
在一种可能的实现方式中,所述第一交换模块用于:
通过宿主机中的虚拟机监控程序响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存。
在一种可能的实现方式中,所述装置还包括:
第二交换模块,用于响应于所述剩余显存容量大于或等于单个内存页的大小,且所述系统内存中第三虚拟GPU的第三内存页满足第二预设内存位置交换条件,将所述第三内存页交换至所述显存。
在一种可能的实现方式中,所述第二预设内存位置交换条件包括:
所述第三虚拟GPU为占用所述系统内存的虚拟GPU中,优先级最高的虚拟GPU。
在一种可能的实现方式中,所述第二预设内存位置交换条件还包括:
所述第三内存页为所述第三虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
在一种可能的实现方式中,所述第二预设内存位置交换条件包括:
所述第三内存页为各个虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
在一种可能的实现方式中,所述信息还包括:
第二获取模块,用于获取超分比例,其中,所述超分比例表示虚拟GPU能够使用的系统内存的最大容量占显存容量的比例;
确定模块,用于根据所述超分比例和所述显存容量,确定可分配系统内存总容量;
申请模块,用于根据所述可分配系统内存总容量,申请系统内存。
在一种可能的实现方式中,所述装置还包括:
返回模块,用于响应于所述剩余显存容量与所述可分配系统内存剩余容量之和小于所述目标内存容量,返回虚拟GPU创建失败的消息。
根据本公开的一方面,提供了一种电子设备,包括:一个或多个处理器;用于存储可执行指令的存储器;其中,所述一个或多个处理器被配置为调用所述存储器存储的可执行指令,以执行上述方法。
根据本公开的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。
根据本公开的一方面,提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备中运行时,所述电子设备中的处理器执行上述方法。
在本公开实施例中,通过响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,其中,所述可分配系统内存剩余容量表示允许分配给虚拟GPU的系统内存的剩余容量,响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存,由此基于系统内存实现虚拟GPU的内存超分,即,不仅从显存中向虚拟GPU分配虚拟显存,还允许从系统内存中向虚拟GPU分配虚拟显存,从而能够充分利用硬件资源,在相同的硬件条件下能够创建更多的虚拟GPU实例,提升资源利用率,降低总体拥有成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出GPU访问显存和系统内存的示意图。
图2示出相关技术中虚拟GPU的内存分配方案的示意图。
图3示出本公开实施例提供的内存分配方法的流程图。
图4示出本公开实施例提供的内存分配方法的一示意图。
图5示出本公开实施例提供的内存分配方法的另一示意图。
图6示出本公开实施例提供的内存分配方法的另一示意图。
图7示出本公开实施例提供的内存分配装置的框图。
图8示出本公开实施例提供的电子设备1900的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
显卡上有GPU专用的内存(即显存),另外,GPU也可以访问CPU侧的内存(即系统内存)。对于GPU来说,访问显存的时延更小、带宽更大,因此GPU通常会优先使用显存。然而,显存的大小有限,当显存不够时,GPU会访问系统内存,以获得更大的存储空间。图1示出GPU访问显存和系统内存的示意图。如图1所示,GPU既可以访问显存,也可以访问系统内存。由于访问系统内存需要经过PCIe(Peripheral Component Interconnect express,快速外设部件互连)总线,因此其性能低于显存。但是在虚拟化场景下,系统内存往往比显存大,其成本也低于显存。
在相关技术中,虚拟GPU(即vGPU)的计算资源是共享的,而存储资源是独占的。若剩余显存容量不足,则无法创建虚拟GPU。图2示出相关技术中虚拟GPU的内存分配方案的示意图。如图2所示,在相关技术中,仅从GPU的显存中为虚拟GPU(vGPU)分配虚拟显存。
本公开实施例提供了一种内存分配方法,通过响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,其中,所述可分配系统内存剩余容量表示允许分配给虚拟GPU的系统内存的剩余容量,响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存,由此基于系统内存实现虚拟GPU的内存超分,即,不仅从显存中向虚拟GPU分配虚拟显存,还允许从系统内存中向虚拟GPU分配虚拟显存,从而能够充分利用硬件资源,在相同的硬件条件下能够创建更多的虚拟GPU实例,提升资源利用率,降低总体拥有成本(Total Cost of Ownership,TCO)。
下面结合附图对本公开实施例提供的内存分配方法进行详细的说明。
图3示出本公开实施例提供的内存分配方法的流程图。在一种可能的实现方式中,所述内存分配方法的执行主体可以是内存分配装置,例如,所述内存分配方法可以由终端设备或服务器或其它电子设备执行。其中,终端设备可以是用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal DigitalAssistant,PDA)、手持设备、计算设备、车载设备或者可穿戴设备等。在一些可能的实现方式中,所述内存分配方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。如图3所示,所述内存分配方法包括步骤S31至步骤S32。
在步骤S31中,响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,其中,所述可分配系统内存剩余容量表示允许分配给虚拟GPU的系统内存的剩余容量。
在步骤S32中,响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存。
在本公开实施例中,可以从显存和系统内存中为虚拟GPU分配内存,以用作虚拟GPU的虚拟显存。图4示出本公开实施例提供的内存分配方法的一示意图。如图4所示,可以从显存和系统内存中为虚拟GPU分配内存。
对于单个虚拟GPU而言,它的虚拟显存对应的物理内存可能均为显存,或者可能为显存和系统内存,或者可能均为系统内存。不同虚拟GPU的虚拟显存对应的物理内存的类型可能相同或不同。
在一种可能的实现方式中,一部分虚拟GPU的虚拟显存对应的物理内存仅为显存,另一部分虚拟GPU的虚拟显存对应的物理内存为显存和系统内存。
在另一种可能的实现方式中,一部分虚拟GPU的虚拟显存对应的物理内存仅为显存,一部分虚拟GPU的虚拟显存对应的物理内存为显存和系统内存,另一部分虚拟GPU的虚拟显存对应的物理内存仅为系统内存。
在另一种可能的实现方式中,在显存充足的情况下,各个虚拟GPU的虚拟显存对应的物理内存可以均为显存。
在一种可能的实现方式中,可以通过宿主机(Host)执行所述内存分配方法。在该实现方式中,客户机(Guest)可以不区分两种类型的虚拟显存(即,从显存分配得到的虚拟显存和从系统内存分配得到的虚拟显存),虚拟GPU的虚拟显存与物理内存的映射关系可以均由宿主机完成。例如,可以由宿主机的驱动记录虚拟GPU的虚拟显存与物理内存之间的映射关系,客户机的驱动可以不区分两种类型的虚拟显存。其中,物理内存包括显存和系统内存。在一个例子中,可以通过宿主机中的虚拟机监控程序执行所述内存分配方法。在一些应用场景中,虚拟机监控程序(Hypervisor)也可以称为虚拟机管理程序、虚拟机监控器(Virtual Machine Monitor,VMM)等等,在此不作限定。
在一种可能的实现方式中,所述方法还包括:获取超分比例,其中,所述超分比例表示虚拟GPU能够使用的系统内存的最大容量占显存容量的比例;根据所述超分比例和所述显存容量,确定可分配系统内存总容量;根据所述可分配系统内存总容量,申请系统内存。
在该实现方式中,可以获取超分比例,其中,超分比例可以表示虚拟GPU能够使用的系统内存的最大容量占显存容量的比例,即,超分比例可以表示允许分配给虚拟GPU的系统内存容量与显存容量之间的比例。将显存容量与超分比例相乘,可以得到可分配系统内存总容量。其中,可分配系统内存总容量可以表示允许分配给虚拟GPU的系统内存的总容量。在确定可分配系统内存总容量之后,可以申请系统内存。
作为该实现方式的一个示例,超分比例可以根据实际应用场景需求由用户灵活设置。
作为该实现方式的另一个示例,超分比例可以为默认值。
作为该实现方式的一个示例,宿主机的驱动可以根据超分比例和显存容量,确定可分配系统内存总容量,并可以根据可分配系统内存总容量,申请系统内存。
在实现方式中,通过获取超分比例,其中,所述超分比例表示虚拟GPU能够使用的系统内存的最大容量占显存容量的比例,根据所述超分比例和所述显存容量,确定可分配系统内存总容量,根据所述可分配系统内存总容量,申请系统内存,由此有利于申请到连续的系统内存,从而有利于向虚拟GPU分配连续的系统内存,进而有助于提高虚拟GPU的性能,以及提高系统内存的利用率。
在另一种可能的实现方式中,所述方法还包括:获取可分配系统内存总容量;根据所述可分配系统内存总容量,申请系统内存。在该实现方式中,用户可以直接设置可分配系统内存总容量。
在本公开实施例中,可以响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量。
其中,所述剩余显存容量可以表示能够分配给虚拟GPU的显存的剩余容量。
所述可分配系统内存剩余容量表示允许分配给虚拟GPU的系统内存的剩余容量。在一种可能的实现方式中,可以根据可分配系统内存总容量和已分配给虚拟GPU的系统内容容量,确定所述可分配系统内存剩余容量。
所述虚拟GPU创建请求对应的目标内存容量可以表示待分配给所述虚拟GPU创建请求对应的虚拟GPU的内存容量。在一种可能的实现方式中,所述虚拟GPU创建请求可以携带所述目标内存容量。在另一种可能的实现方式中,目标内存容量可以为预设值。
在一种可能的实现方式中,可以响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量,并可以响应于所述目标内存容量大于所述剩余显存容量,获取可分配系统内存剩余容量。
在另一种可能的实现方式中,可以响应于虚拟GPU创建请求,获取剩余显存容量、可分配系统内存剩余容量以及所述虚拟GPU创建请求对应的目标内存容量。在该实现方式中,剩余显存容量和可分配系统内存剩余容量均可以响应于虚拟GPU创建请求获取。
在一种可能的实现方式中,所述响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,包括:响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量;所述响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存,包括:响应于所述剩余显存容量大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存中为所述虚拟GPU分配内存。
在该实现方式中,可以响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量。在所述剩余显存容量大于或等于所述目标内存容量的情况下,可以无需获取可分配系统内存剩余容量,并可以根据所述虚拟GPU创建请求创建虚拟GPU,根据所述目标内存容量,从显存中为所述虚拟GPU分配内存。由于可分配系统内存剩余容量大于或等于0,因此,在剩余显存容量大于或等于目标内存容量的情况下下,仅根据剩余显存容量即可判定剩余显存容量与可分配系统内存剩余容量之和大于或等于目标内存容量。
图5示出本公开实施例提供的内存分配方法的另一示意图。如图5所示,在显存充足的情况下,可以优先向虚拟GPU分配显存。
在该实现方式中,通过响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量,响应于所述剩余显存容量大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存中为所述虚拟GPU分配内存,由此在显存充足的情况下,可以优先向虚拟GPU分配显存,从而能够使虚拟GPU获得更好的性能。
在一种可能的实现方式中,所述响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,包括:响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量;响应于所述目标内存容量大于所述剩余显存容量,获取可分配系统内存剩余容量;所述响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存,包括:响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和所述系统内存中、或者仅从所述系统内存中为所述虚拟GPU分配内存。
在该实现方式中,可以响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量。在所述剩余显存容量小于所述目标内存容量的情况下,可以获取可分配系统内存剩余容量。在所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和所述系统内存中、或者仅从所述系统内存中为所述虚拟GPU分配内存。其中,在剩余显存容量不为0的情况下,可以根据所述目标内存容量,从显存和所述系统内存中为所述虚拟GPU分配内存;在剩余显存容量为0的情况下,可以根据所述目标内存容量,仅从所述系统内存中为所述虚拟GPU分配内存。
在该实现方式中,通过响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量,响应于所述目标内存容量大于所述剩余显存容量,获取可分配系统内存剩余容量,响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和所述系统内存中、或者仅从所述系统内存中为所述虚拟GPU分配内存,由此在相同的显存资源条件下能够创建更多的虚拟GPU实例。
在一种可能的实现方式中,在所述获取可分配系统内存剩余容量之后,所述方法还包括:响应于所述剩余显存容量与所述可分配系统内存剩余容量之和小于所述目标内存容量,返回虚拟GPU创建失败的消息。
在该实现方式中,在所述剩余显存容量与所述可分配系统内存剩余容量之和小于所述目标内存容量的情况下,可以返回虚拟GPU创建失败的消息,以提示用户在暂时无法继续创建虚拟GPU。
作为该实现方式的一个示例,所述虚拟GPU创建失败的消息可以携带剩余显存容量和可分配系统内存剩余容量不足的信息。
在一种可能的实现方式中,所述方法还包括:响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存。
在该实现方式中,第一内存页为第一虚拟GPU在系统内存中的某一内存页,第二内存页为第二虚拟GPU在显存中的某一内存页。
在虚拟化、云计算等场景下,最大化资源利用率是核心目标之一。相关技术中,由于显存是独占的,因此资源利用率较低。例如,按照相关技术中的方案,vGPU a创建时从显存中申请了内存后,由于负载不大,没有使用申请得到的全部显存。这部分vGPU a没有使用的显存也由vGPU a占用,导致再创建vGPU b时无法使用这部分显存。这样,即使vGPU b有较高的负载,也会由于显存资源不够,影响其计算性能。
在该实现方式中,通过响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存,由此在剩余显存容量不足的情况下,可以动态调整虚拟GPU的内存页的位置,从而能够提高虚拟GPU的虚拟显存分配的灵活性,提高显存资源利用率。
作为该实现方式的一个示例,所述响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存,包括:通过宿主机中的虚拟机监控程序响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存。
在该示例中,通过宿主机中的虚拟机监控程序响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存,由此由宿主机中的虚拟机监控程序对虚拟GPU的内存页的位置进行动态调节,客户机无感知,从而能够降低不同的客户机操作系统(Guest OS)之间的适配成本。其中,客户机操作系统可以表示安装在客户机上的操作系统。
作为该实现方式的一个示例,所述第一预设内存位置交换条件包括:所述第一虚拟GPU的优先级高于所述第二虚拟GPU的优先级。
在该示例中,通过基于虚拟GPU的优先级交换虚拟GPU的内存页的位置,使优先级较低的虚拟GPU更倾向于使用系统内存,优先级较高的虚拟GPU更倾向于使用显存。图6示出本公开实施例提供的内存分配方法的另一示意图。如图6所示,优先级较高的虚拟GPU与优先级较低的虚拟GPU相比,更倾向于使用显存;优先级较低的虚拟GPU与优先级较高的虚拟GPU相比,更倾向于使用系统内存。
在该示例中,在显存不足的情况下,可以将优先级较低的虚拟GPU的内存页交换到系统内存中,将优先级较高的虚拟GPU的内存页交换到显存中,由此能够提高优先级较高的虚拟GPU的性能,并有助于提高显存的利用率。
在一个示例中,所述第一预设内存位置交换条件还包括:所述第一虚拟GPU为占用所述系统内存的虚拟GPU中,优先级最高的虚拟GPU。在该示例中,在显存不足的情况下,可以优先保证优先级最高的虚拟GPU的性能。
在另一个示例中,所述第一虚拟GPU可以为占用所述系统内存的虚拟GPU中,优先级比所述第二虚拟GPU高的任一虚拟GPU。
在一个示例中,所述第一预设内存位置交换条件还包括:所述第一内存页为所述第一虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
其中,使用率可以采用LRU(Least Recently Used,最近最少使用)算法、LFU(Least Frequently Used,最少访问)算法等确定,在此不作限定。
在该示例中,通过基于使用率交换虚拟GPU的内存页的位置,由此根据虚拟GPU的负载动态调整虚拟GPU的内存页的位置,有助于使使用率较高的内存页交换至显存中,从而能够提高显存的利用率,并能够从整体上提高虚拟GPU的性能。
在一个示例中,所述第一预设内存位置交换条件还包括:所述第二虚拟GPU为显存占用比例大于或等于预设比例的虚拟GPU中,优先级最低的虚拟GPU,其中,任一虚拟GPU的显存占用比例表示所述虚拟GPU所占用的显存容量与所述虚拟GPU所占用的总内存容量的比例,所述虚拟GPU所占用的总内存容量为所述虚拟GPU所占用的显存容量与系统内存容量之和;或者,所述第二虚拟GPU为占用所述显存的虚拟GPU中,优先级最低的虚拟GPU。
在一个例子中,第二虚拟GPU可以为显存占用比例大于或等于预设比例的虚拟GPU中,优先级最低的虚拟GPU。
例如,各个虚拟GPU对应的预设比例可以相同。例如,预设比例可以为10%或者20%等等,在此不作限定。
又如,相同优先级的虚拟GPU对应的预设比例可以相同,优先级更高的虚拟GPU对应的预设比例可以高于优先级更低的虚拟GPU对应的预设比例。
在另一个例子中,第二虚拟GPU为占用所述显存的虚拟GPU中,优先级最低的虚拟GPU。在这个例子中,可以不考虑虚拟GPU的显存占用比例。
在该示例中,在显存不足的情况下,可以将优先级较低的虚拟GPU的内存页交换到系统内存中,将优先级较高的虚拟GPU的内存页交换到显存中,由此能够提高优先级较高的虚拟GPU的性能,并有助于提高显存的利用率。
在一个示例中,所述第一预设内存位置交换条件还包括:所述第二内存页为所述第二虚拟GPU在所述显存的内存页中,使用率最低的内存页。通过将第二虚拟GPU在显存的内存页中、使用率最低的内存页交换至系统内存,由此能够在几乎不降低第二虚拟GPU的性能的前提下,提高第一虚拟GPU的性能。
在一个例子中,第一预设内存位置交换条件可以为:第一虚拟GPU为占用系统内存的虚拟GPU中,优先级最高的虚拟GPU;第二虚拟GPU为显存占用比例大于或等于预设比例的虚拟GPU中,优先级最低的虚拟GPU;第一内存页为第一虚拟GPU在系统内存的内存页中,使用率最高的内存页;第二内存页为第二虚拟GPU在显存的内存页中,使用率最低的内存页。
作为该实现方式的另一个示例,所述第一预设内存位置交换条件包括:所述第一内存页为各个虚拟GPU在所述系统内存的内存页中,使用率最高的内存页,所述第二内存页为各个虚拟GPU在所述显存的内存页中,使用率最低的内存页。通过采用该示例,能够使负载较低的虚拟GPU更倾向于使用系统内存,并使负载较低的虚拟GPU更倾向于使用显存。在该示例中,可以不考虑虚拟GPU的优先级,即,可以不设置虚拟GPU的优先级。
作为该实现方式的另一个示例,所述第一预设内存位置交换条件包括:所述第一内存页为各个虚拟GPU在所述系统内存的内存页中,权重最高的内存页,所述第二内存页为各个虚拟GPU在所述显存的内存页中,权重最低的内存页。在该示例中,任一内存页的权重可以根据所述内存页对应的虚拟GPU的优先级和所述内存页的使用率确定。所述内存页的权重与所述内存页对应的虚拟GPU的优先级正相关,且所述内存页的权重与所述内存页的使用率正相关。即,所述内存页对应的虚拟GPU的优先级越高,所述内存页的权重越高;所述内存页的使用率越高,所述内存页的权重越高。
在一种可能的实现方式中,所述方法还包括:响应于所述剩余显存容量大于或等于单个内存页的大小,且所述系统内存中第三虚拟GPU的第三内存页满足第二预设内存位置交换条件,将所述第三内存页交换至所述显存。
在该实现方式中,在部分虚拟GPU实例被销毁的情况下,将可能使剩余显存容量大于或等于单个内存页的大小。通过响应于所述剩余显存容量大于或等于单个内存页的大小,且所述系统内存中第三虚拟GPU的第三内存页满足第二预设内存位置交换条件,将所述第三内存页交换至所述显存,由此能够提高第三虚拟GPU的性能,提高显存的利用率。
作为该实现方式的一个示例,所述第二预设内存位置交换条件包括:所述第三虚拟GPU为占用所述系统内存的虚拟GPU中,优先级最高的虚拟GPU。
在该示例中,在显存出现空余的情况下,可以将占用系统内存的虚拟GPU中优先级最高的虚拟GPU的内存页交换至显存,由此可以优先保证优先级最高的虚拟GPU的性能。
在一个示例中,所述第二预设内存位置交换条件还包括:所述第三内存页为所述第三虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。在该示例中,通过基于使用率交换虚拟GPU的内存页的位置,由此根据虚拟GPU的负载动态调整虚拟GPU的内存页的位置,有助于使使用率较高的内存页交换至显存中,从而能够提高显存的利用率,并能够从整体上提高虚拟GPU的性能。
在一个例子中,第二预设内存位置交换条件可以为:所述第三虚拟GPU为占用所述系统内存的虚拟GPU中,优先级最高的虚拟GPU,且所述第三内存页为所述第三虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
作为该实现方式的一个示例,所述第二预设内存位置交换条件包括:所述第三内存页为各个虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。通过采用该示例,能够使负载较低的虚拟GPU更倾向于使用系统内存,并使负载较低的虚拟GPU更倾向于使用显存。在该示例中,可以不考虑虚拟GPU的优先级,即,可以不设置虚拟GPU的优先级。
本公开实施例提供的内存分配方法可以应用于GPU、vGPU、虚拟化、超分等技术领域,在此不作限定。
下面通过一个具体的应用场景说明本公开实施例提供的内存分配方法。在该应用场景中,可以通过宿主机(Host)中的虚拟机监控程序执行所述内存分配方法。
在该应用场景中,用户可以设置超分比例。宿主机可以根据超分比例和显存容量,确定可分配系统内存总容量,并可以根据可分配系统内存总容量,申请系统内存。
宿主机可以响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量。宿主机可以响应于所述剩余显存容量大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存中为所述虚拟GPU分配内存;宿主机可以响应于所述目标内存容量大于所述剩余显存容量,获取可分配系统内存剩余容量,响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和所述系统内存中、或者仅从所述系统内存中为所述虚拟GPU分配内存;宿主机可以响应于所述剩余显存容量与所述可分配系统内存剩余容量之和小于所述目标内存容量,返回虚拟GPU创建失败的消息。
宿主机可以响应于剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存。其中,第一预设内存位置交换条件可以为:第一虚拟GPU为占用系统内存的虚拟GPU中,优先级最高的虚拟GPU;第二虚拟GPU为显存占用比例大于或等于预设比例的虚拟GPU中,优先级最低的虚拟GPU;第一内存页为第一虚拟GPU在系统内存的内存页中,使用率最高的内存页;第二内存页为第二虚拟GPU在显存的内存页中,使用率最低的内存页。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
此外,本公开还提供了内存分配装置、电子设备、计算机可读存储介质、计算机程序产品,上述均可用来实现本公开提供的任一种内存分配方法,相应技术方案和技术效果可参见方法部分的相应记载,不再赘述。
图7示出本公开实施例提供的内存分配装置的框图。如图7所示,所述内存分配装置包括:
第一获取模块71,用于响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,其中,所述可分配系统内存剩余容量表示允许分配给虚拟GPU的系统内存的剩余容量;
内存分配模块72,用于响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存。
在一种可能的实现方式中,
所述第一获取模块71用于:响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量;响应于所述目标内存容量大于所述剩余显存容量,获取可分配系统内存剩余容量;
所述内存分配模块72用于:响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和所述系统内存中、或者仅从所述系统内存中为所述虚拟GPU分配内存。
在一种可能的实现方式中,
所述第一获取模块71用于:响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量;
所述内存分配模块72用于:响应于所述剩余显存容量大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存中为所述虚拟GPU分配内存。
在一种可能的实现方式中,所述装置还包括:
第一交换模块,用于响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存。
在一种可能的实现方式中,所述第一预设内存位置交换条件包括:
所述第一虚拟GPU的优先级高于所述第二虚拟GPU的优先级。
在一种可能的实现方式中,所述第一预设内存位置交换条件还包括:
所述第一虚拟GPU为占用所述系统内存的虚拟GPU中,优先级最高的虚拟GPU。
在一种可能的实现方式中,所述第一预设内存位置交换条件还包括:
所述第一内存页为所述第一虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
在一种可能的实现方式中,所述第一预设内存位置交换条件还包括:
所述第二虚拟GPU为显存占用比例大于或等于预设比例的虚拟GPU中,优先级最低的虚拟GPU,其中,任一虚拟GPU的显存占用比例表示所述虚拟GPU所占用的显存容量与所述虚拟GPU所占用的总内存容量的比例,所述虚拟GPU所占用的总内存容量为所述虚拟GPU所占用的显存容量与系统内存容量之和;
或者,
所述第二虚拟GPU为占用所述显存的虚拟GPU中,优先级最低的虚拟GPU。
在一种可能的实现方式中,所述第一预设内存位置交换条件还包括:
所述第二内存页为所述第二虚拟GPU在所述显存的内存页中,使用率最低的内存页。
在一种可能的实现方式中,所述第一交换模块用于:
通过宿主机中的虚拟机监控程序响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存。
在一种可能的实现方式中,所述装置还包括:
第二交换模块,用于响应于所述剩余显存容量大于或等于单个内存页的大小,且所述系统内存中第三虚拟GPU的第三内存页满足第二预设内存位置交换条件,将所述第三内存页交换至所述显存。
在一种可能的实现方式中,所述第二预设内存位置交换条件包括:
所述第三虚拟GPU为占用所述系统内存的虚拟GPU中,优先级最高的虚拟GPU。
在一种可能的实现方式中,所述第二预设内存位置交换条件还包括:
所述第三内存页为所述第三虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
在一种可能的实现方式中,所述第二预设内存位置交换条件包括:
所述第三内存页为各个虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
在一种可能的实现方式中,所述信息还包括:
第二获取模块,用于获取超分比例,其中,所述超分比例表示虚拟GPU能够使用的系统内存的最大容量占显存容量的比例;
确定模块,用于根据所述超分比例和所述显存容量,确定可分配系统内存总容量;
申请模块,用于根据所述可分配系统内存总容量,申请系统内存。
在一种可能的实现方式中,所述装置还包括:
返回模块,用于响应于所述剩余显存容量与所述可分配系统内存剩余容量之和小于所述目标内存容量,返回虚拟GPU创建失败的消息。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现和技术效果可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。其中,所述计算机可读存储介质可以是非易失性计算机可读存储介质,或者可以是易失性计算机可读存储介质。
本公开实施例还提出一种计算机程序,包括计算机可读代码,当所述计算机可读代码在电子设备中运行时,所述电子设备中的处理器执行上述方法。
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备中运行时,所述电子设备中的处理器执行上述方法。
本公开实施例还提供一种电子设备,包括:一个或多个处理器;用于存储可执行指令的存储器;其中,所述一个或多个处理器被配置为调用所述存储器存储的可执行指令,以执行上述方法。
电子设备可以被提供为终端、服务器或其它形态的设备。
图8示出本公开实施例提供的电子设备1900的框图。例如,电子设备1900可以被提供为一服务器或一终端。参照图8,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入/输出接口1958(I/O接口)。电子设备1900可以操作基于存储在存储器1932的操作系统,例如微软服务器操作系统(Windows ServerTM),苹果公司推出的基于图形用户界面操作系统(MacOS XTM),多用户多进程的计算机操作系统(UnixTM),自由和开放原代码的类Unix操作系统(LinuxTM),开放原代码的类Unix操作系统(FreeBSDTM)或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
若本公开实施例的技术方案涉及个人信息,应用本公开实施例的技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本公开实施例的技术方案涉及敏感个人信息,应用本公开实施例的技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (19)

1.一种内存分配方法,其特征在于,包括:
响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,其中,所述可分配系统内存剩余容量表示允许分配给虚拟GPU的系统内存的剩余容量;
响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存。
2.根据权利要求1所述的方法,其特征在于,
所述响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,包括:响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量;响应于所述目标内存容量大于所述剩余显存容量,获取可分配系统内存剩余容量;
所述响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存,包括:响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和所述系统内存中、或者仅从所述系统内存中为所述虚拟GPU分配内存。
3.根据权利要求1所述的方法,其特征在于,
所述响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,包括:响应于虚拟GPU创建请求,获取剩余显存容量和所述虚拟GPU创建请求对应的目标内存容量;
所述响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存,包括:响应于所述剩余显存容量大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存中为所述虚拟GPU分配内存。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存。
5.根据权利要求4所述的方法,其特征在于,所述第一预设内存位置交换条件包括:
所述第一虚拟GPU的优先级高于所述第二虚拟GPU的优先级。
6.根据权利要求5所述的方法,其特征在于,所述第一预设内存位置交换条件还包括:
所述第一虚拟GPU为占用所述系统内存的虚拟GPU中,优先级最高的虚拟GPU。
7.根据权利要求5或6所述的方法,其特征在于,所述第一预设内存位置交换条件还包括:
所述第一内存页为所述第一虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
8.根据权利要求5所述的方法,其特征在于,所述第一预设内存位置交换条件还包括:
所述第二虚拟GPU为显存占用比例大于或等于预设比例的虚拟GPU中,优先级最低的虚拟GPU,其中,任一虚拟GPU的显存占用比例表示所述虚拟GPU所占用的显存容量与所述虚拟GPU所占用的总内存容量的比例,所述虚拟GPU所占用的总内存容量为所述虚拟GPU所占用的显存容量与系统内存容量之和;
或者,
所述第二虚拟GPU为占用所述显存的虚拟GPU中,优先级最低的虚拟GPU。
9.根据权利要求5或8所述的方法,其特征在于,所述第一预设内存位置交换条件还包括:
所述第二内存页为所述第二虚拟GPU在所述显存的内存页中,使用率最低的内存页。
10.根据权利要求4所述的方法,其特征在于,所述响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存,包括:
通过宿主机中的虚拟机监控程序响应于所述剩余显存容量小于单个内存页的大小,且所述系统内存中第一虚拟GPU的第一内存页与所述显存中第二虚拟GPU的第二内存页满足第一预设内存位置交换条件,将所述第二内存页交换至所述系统内存,并将所述第一内存页交换至所述显存。
11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于所述剩余显存容量大于或等于单个内存页的大小,且所述系统内存中第三虚拟GPU的第三内存页满足第二预设内存位置交换条件,将所述第三内存页交换至所述显存。
12.根据权利要求11所述的方法,其特征在于,所述第二预设内存位置交换条件包括:
所述第三虚拟GPU为占用所述系统内存的虚拟GPU中,优先级最高的虚拟GPU。
13.根据权利要求12所述的方法,其特征在于,所述第二预设内存位置交换条件还包括:
所述第三内存页为所述第三虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
14.根据权利要求11所述的方法,其特征在于,所述第二预设内存位置交换条件包括:
所述第三内存页为各个虚拟GPU在所述系统内存的内存页中,使用率最高的内存页。
15.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取超分比例,其中,所述超分比例表示虚拟GPU能够使用的系统内存的最大容量占显存容量的比例;
根据所述超分比例和所述显存容量,确定可分配系统内存总容量;
根据所述可分配系统内存总容量,申请系统内存。
16.根据权利要求1所述的方法,其特征在于,在所述获取可分配系统内存剩余容量之后,所述方法还包括:
响应于所述剩余显存容量与所述可分配系统内存剩余容量之和小于所述目标内存容量,返回虚拟GPU创建失败的消息。
17.一种内存分配装置,其特征在于,包括:
第一获取模块,用于响应于虚拟GPU创建请求,获取剩余显存容量和可分配系统内存剩余容量中的至少一项,以及所述虚拟GPU创建请求对应的目标内存容量,其中,所述可分配系统内存剩余容量表示允许分配给虚拟GPU的系统内存的剩余容量;
内存分配模块,用于响应于所述剩余显存容量与所述可分配系统内存剩余容量之和大于或等于所述目标内存容量,创建虚拟GPU,并根据所述目标内存容量,从显存和/或所述系统内存中为所述虚拟GPU分配内存。
18.一种电子设备,其特征在于,包括:
一个或多个处理器;
用于存储可执行指令的存储器;
其中,所述一个或多个处理器被配置为调用所述存储器存储的可执行指令,以执行权利要求1至16中任意一项所述的方法。
19.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至16中任意一项所述的方法。
CN202311764609.1A 2023-12-20 2023-12-20 内存分配方法、装置、电子设备和存储介质 Pending CN117742957A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311764609.1A CN117742957A (zh) 2023-12-20 2023-12-20 内存分配方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311764609.1A CN117742957A (zh) 2023-12-20 2023-12-20 内存分配方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN117742957A true CN117742957A (zh) 2024-03-22

Family

ID=90256162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311764609.1A Pending CN117742957A (zh) 2023-12-20 2023-12-20 内存分配方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN117742957A (zh)

Similar Documents

Publication Publication Date Title
US10025503B2 (en) Autonomous dynamic optimization of platform resources
US9135079B2 (en) Dynamically assigning a portion of physical computing resource to logical partitions based on characteristics of executing logical partitions
US20160239333A1 (en) Apparatus and method for scheduling graphics processing unit workloads from virtual machines
US20180067674A1 (en) Memory management in virtualized computing
US9753851B2 (en) Multi-section garbage collection system including real-time garbage collection scheduling
US20180267835A1 (en) Managing provisioning for cloud resource allocations
CN114418828B (zh) 显存管理方法、装置、设备、存储介质及程序产品
CN111209080A (zh) 一种图形处理器透传的方法
CN111104219A (zh) 虚拟核心与物理核心的绑定方法、装置、设备及存储介质
CN114691300A (zh) 一种虚拟机实例的热迁移方法
US9697047B2 (en) Cooperation of hoarding memory allocators in a multi-process system
CN113886019B (zh) 虚拟机创建方法、装置、系统、介质和设备
CN115904761A (zh) 片上系统、车辆及视频处理单元虚拟化方法
CN114625536A (zh) 显存分配方法、装置、介质及电子设备
CN113032088B (zh) 脏页记录方法、装置、电子设备及计算机可读介质
CN111143072A (zh) 用户态程序内存分配方法、系统及相关组件
US9405470B2 (en) Data processing system and data processing method
CN113485835B (zh) 一种多场景下共享内存的实现方法、系统、设备及介质
US10719342B2 (en) Provisioning based on workload displacement
CN117742957A (zh) 内存分配方法、装置、电子设备和存储介质
US10223284B2 (en) Flexible I/O DMA address allocation in virtualized systems
US11429412B2 (en) Guest protection from application code execution in kernel mode
US11481255B2 (en) Management of memory pages for a set of non-consecutive work elements in work queue designated by a sliding window for execution on a coherent accelerator
US9176910B2 (en) Sending a next request to a resource before a completion interrupt for a previous request
CN114281516A (zh) 一种基于numa属性的资源分配方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination