CN117519907A - 云主机集群自适应切分vGPU的方法、装置及设备 - Google Patents

云主机集群自适应切分vGPU的方法、装置及设备 Download PDF

Info

Publication number
CN117519907A
CN117519907A CN202311681284.0A CN202311681284A CN117519907A CN 117519907 A CN117519907 A CN 117519907A CN 202311681284 A CN202311681284 A CN 202311681284A CN 117519907 A CN117519907 A CN 117519907A
Authority
CN
China
Prior art keywords
configuration
core
cloud host
cloud
cores
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311681284.0A
Other languages
English (en)
Inventor
朱晓锟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Os Easy Cloud Computing Co ltd
Original Assignee
Wuhan Os Easy Cloud Computing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Os Easy Cloud Computing Co ltd filed Critical Wuhan Os Easy Cloud Computing Co ltd
Priority to CN202311681284.0A priority Critical patent/CN117519907A/zh
Publication of CN117519907A publication Critical patent/CN117519907A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种云主机集群自适应切分vGPU的方法、装置及设备,涉及虚拟机、云桌面管理平台、显卡虚拟化相关技术领域,该方法包括获取计算节点中每块显卡的每个核心所支持的配置,并在云主机创建时进行配置选择;查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心:若是,则在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机;若否,则修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。本申请能够解决小规模使用时需要过多人工干预的问题,同时不需要大型云平台服务商的高成本。

Description

云主机集群自适应切分vGPU的方法、装置及设备
技术领域
本申请涉及虚拟机、云桌面管理平台、显卡虚拟化相关技术领域,具体涉及一种云主机集群自适应切分vGPU的方法、装置及设备。
背景技术
显卡作为图形渲染、建模、大数据计算、AI(Artificial Intelligence,人工智能)计算等多个领域的计算力资源,在云平台上需要针对不同的业务场景为用户提供不同的配置选项。目前常见的显卡厂商的显卡产品一般提供以下功能:1、一块物理显卡设备(包括通过电路板、显卡外壳部件等物理方式把多个显卡封装成一个设备的)具有一个核心或多个核心;2、每个核心配备一定数量的显存;3、每个核心及其配备的显存,可以通过显卡厂商的工具包进行设置,可作为一个整体使用,也可以按照显卡厂商给出的配置(又称显卡配置)的选项,切分为多个虚拟显卡使用;4、每个核心无论是作为一个整体使用,还是切分后提供给多台云主机使用,可同时使用的云主机台数不能超出特定值,具体的,作为整体使用时,不能超过一台云主机,切分为多个虚拟显卡使用时,不能超过配置选项规定的数量;5、如需重新设置当前核心,需确保当前没有云主机正在使用当前核心。
在上述功能限制下,目前主流云平台使用显卡的方式一般包括以下两种:
(1)预先规划好常用业务需要的显卡配置,并按照规划对显卡核心进行设置。用户使用云主机时,直接开机即可获取到对应的显卡。如果需要使用不同配置时,由管理员安排特定时段,避免影响常用业务,重新设置显卡核心,提供给用户使用。此方式适用于大多数的小规模使用场景或计划性较强的教学场景,但需要提前做好规划,增加实施环节,并且遇到偶发的特殊需求时需要管理员人工干预;
(2)部署多个带显卡的计算节点,预估显卡配置的使用率,对不同计算节点的显卡核心进行不同的设置。用户使用某一款配置时,把云主机创建到对应的计算节点上。但此方式由于硬件成本较高,一般仅适用于大型云平台服务商。
发明内容
本申请提供一种云主机集群自适应切分vGPU的方法、装置及设备,能够解决小规模使用时需要过多人工干预的问题,同时不需要大型云平台服务商的高成本。
第一方面,本申请实施例提供一种云主机集群自适应切分vGPU的方法,所述云主机集群自适应切分vGPU的方法包括:
获取计算节点中每块显卡的每个核心所支持的配置,并在云主机创建时进行配置选择;
查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心:
若是,则在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机;
若否,则修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
结合第一方面,在一种实施方式中,所述获取计算节点中每块显卡的每个核心所支持的配置,具体为:
进行云平台系统的部署和启动,并查询得到已启用自适应切分显卡功能的计算节点;
获取查询得到的计算节点中每块显卡的每个核心所支持的配置。
结合第一方面,在一种实施方式中,在云主机创建时进行配置选择,具体为:
在计算节点进行云主机创建,并对创建的云主机进行硬件设置,判断云主机所在计算节点是否启用自适应切分显卡功能:
若否,则云主机在预先设定的配置中进行配置选择,并将选择的配置记录至数据库;
若是,则云主机在预先设定的配置中,以及获取的配置中进行配置选择,并将选择的配置记录至数据库。
结合第一方面,在一种实施方式中,在查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心之前,还包括:
进行云主机开机时,判断云主机是否进行配置选择:
若是,则判断云主机所在的所在计算节点是否启用自适应切分显卡功能:
-若启用,则判断云主机所在的所在计算节点是否带有显卡,若未带有,则云主机进入常规开机流程,若带有,则查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心;
-若未启用,则云主机进入常规开机流程;
若否,则云主机进入常规开机流程。
结合第一方面,在一种实施方式中,所述查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心,具体为:
获取得到云主机所在计算节点显卡所有核心的配置;
将获取得到的配置依次与所选择的配置进行比对,进行是否一致判断。
结合第一方面,在一种实施方式中,所述在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机,具体为:
获取云主机所在计算节点显卡的核心中,所有与所选择配置一致的核心;
判断获取的所有核心中是否存在满足判定条件的核心,所述判定条件为核心当前已使用云主机台数小于所选择配置规定的数量:
若存在,则在所有满足判定条件的核心中选择一核心分配给创建的云主机;
若不存在,判断云主机所在计算节点显卡当前是否存在空闲核心:
-若是,则修改一空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机;
-若否,则获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心,修改获取的核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
结合第一方面,在一种实施方式中,所述获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心,修改获取的核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机,具体为:
获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心;
判断获取的核心的配置是否与所选择配置相同:
若是,则将正在使用该核心的其中一云主机进行关机,然后查询当前正使用该核心的云主机数量,确定该核心至少已释放出一空闲数量后,将该核心分配给创建的云主机;
若否,则将正在使用该核心的所有云主机进行关机,然后查询当前正使用该核心的云主机数量,以确保使用该核心的所有云主机均已释放,然后修改该核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
结合第一方面,在一种实施方式中,修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机,具体为:
判断云主机所在计算节点显卡当前是否存在空闲核心:
-若是,则修改一空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机;
-若否,则获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心,将正在使用该核心的所有云主机进行关机,然后查询当前正使用该核心的云主机数量,以确保使用该核心的所有云主机均已释放,然后修改该核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
第二方面,本申请实施例提供一种云主机集群自适应切分vGPU的装置,所述云主机集群自适应切分vGPU的装置包括:
获取模块,其用于获取计算节点中每块显卡的每个核心所支持的配置,并在云主机创建时进行配置选择;
判断模块,其用于查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心,若是,则驱使第一执行模块工作,若否,则驱使第二执行模块工作;
第一执行模块,其用于在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机;
第二执行模块,其用于修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
第二方面,本申请实施例提供一种云主机集群自适应切分vGPU的设备,所述云主机集群自适应切分vGPU的设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的云主机集群自适应切分vGPU的程序,其中所述云主机集群自适应切分vGPU的程序被所述处理器执行时,实现上述所述的云主机集群自适应切分vGPU的方法的步骤。
本申请实施例提供的技术方案带来的有益效果包括:
通过在云主机创建时进行配置选择,然后查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心,若存在,则在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机,若不存在,则修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机,根据云主机的业务需求自适应切分显卡核心,用以解决小规模使用时需要过多人工干预的问题,同时不需要大型云平台服务商的高成本。
附图说明
图1为本申请一种云主机集群自适应切分vGPU的方法的流程图;
图2为本申请一种云主机集群自适应切分vGPU的装置的结构示意图;
图3为本申请云主机集群自适应切分vGPU的设备的硬件结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
第一方面,本申请实施例提供一种云主机集群自适应切分vGPU的方法,基于教育桌面云、校园云平台、政企桌面云等云平台系统实现,根据不同云主机需求的虚拟显卡配置,自动对物理显卡进行设置并提供给云主机使用。当然,本申请的云主机集群自适应切分vGPU的方法,在其他通用开源的桌面云平台或是各厂商自主实现的桌面云平台上,在实现了对应的接口与技术点之后,也同样可以使用。vGPU,即虚拟GPU。GPU,即GraphicsProcessing Unit,全称图形处理器。
一实施例中,参照图1,图1为本申请云主机集群自适应切分vGPU的方法的流程示意图。如图1所示,云主机集群自适应切分vGPU的方法包括:
S1:获取计算节点中每块显卡的每个核心所支持的配置,并在云主机创建时进行配置选择;需要说明的是,配置即为显卡配置,用于指示单个核心切分为多少虚拟显卡使用,例如,某个核心的配置为当前核心作为整体使用,某个创建的云主机所选择的配置为使用作为整体使用的核心,则该云主机所选择配置与该核心的配置相同;某个核心的配置为当前核心切分为2个虚拟显卡使用,某个创建的云主机所选择的配置为当前云主机需使用切分为2个虚拟显卡使用的核心,则该云主机所选择配置与该核心的配置相同。
进一步的,在一实施例中,获取计算节点中每块显卡的每个核心所支持的配置,具体为:
S101:进行云平台系统的部署和启动,并查询得到已启用自适应切分显卡功能的计算节点;
S102:获取查询得到的计算节点中每块显卡的每个核心所支持的配置。
即在云平台系统部署、启动完成后,在适当的时机查询启用了自适应切分显卡功能的计算节点,获取得到启用了自适应切分显卡功能的计算节点中,每块显卡的每个核心所支持的配置。假如某块显卡包括2个核心,则其中一核心支持一配置,另一核心支持一配置,这两个配置可能相同也可能不相同;假如某块显卡仅包括1个核心,则该核心支持一配置,该显卡仅支持一配置。
进一步的,在一实施例中,在云主机创建时进行配置选择,具体为:
在计算节点进行云主机创建,并对创建的云主机进行硬件设置,判断云主机所在计算节点是否启用自适应切分显卡功能:
若否,则云主机在预先设定的配置中进行配置选择,并将选择的配置记录至数据库;
若是,则云主机在预先设定的配置中,以及获取的配置中进行配置选择,并将选择的配置记录至数据库。当用户创建云主机的请求成功提交后,将对云主机所选择的配置记录至数据库。
具体的,用户在计算节点进行云主机创建时,除了常规的CPU、内存、硬盘等硬件的设置,还可以进行显卡对应配置的选择,在进行配置选择时,若云主机所在计算节点未启用自适应切分显卡功能,则用户便只能在管理员预先规划、设置的特定的一种或几种配置中进行选择;若云主机所在计算节点启用了自适应切分显卡功能,则在进行配置选择时,不仅可以在预先设定的配置中进行选择,也可以在步骤S102中获取的配置中进行选择。
S2:查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心,若是,则转到S3,若否,则转到S4;
进一步的,在一实施例中,在查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心之前,还包括:
进行云主机开机时,判断云主机是否进行配置选择:
若是,则判断云主机所在的所在计算节点是否启用自适应切分显卡功能:
-若启用,则判断云主机所在的所在计算节点是否带有显卡,若未带有,则云主机进入常规开机流程,若带有,则查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心;
-若未启用,则云主机进入常规开机流程;
若否,则云主机进入常规开机流程。
具体的,云主机开机时,首先判断该云主机是否进行了配置选择(即是否有显卡配置),若没有显卡配置则进入常规的开机流程,若有显卡配置则判断云主机所在的所在计算节点是否启用自适应切分显卡功能,若未启用则同样的进入常规的开机流程,若启动了则判断云主机所在的所在计算节点是否带有显卡,若未带有则同样的进入常规的开机流程,若带有,则查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心。
进一步的,在一实施例中,查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心,具体为:
S201:获取得到云主机所在计算节点显卡所有核心的配置;
S202:将获取得到的配置依次与所选择的配置进行比对,进行是否一致判断。即获取云主机所在计算节点显卡所有核心的配置,判断云主机所在计算节点显卡的核心中,是否存在与所选择配置相同配置的核心。
S3:在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机;
进一步的,在一实施例中,在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机,具体为:
S301:获取云主机所在计算节点显卡的核心中,所有与所选择配置一致的核心;
S302:判断获取的所有核心中是否存在满足判定条件的核心,所述判定条件为核心当前已使用云主机台数小于所选择配置规定的数量:
若存在,则在所有满足判定条件的核心中选择一核心分配给创建的云主机;
若不存在,判断云主机所在计算节点显卡当前是否存在空闲核心:
-若是,则修改一空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机;
-若否,则获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心,修改获取的核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。需要说明的是,本申请的描述“云主机所在计算节点”中的“云主机”均指创建的云主机。
即当云主机所在计算节点显卡的核心中,存在与所选择配置相同配置的核心时,对于找到的核心,判断使用当前核心的云主机台数是否小于所选择配置规定的数量,即当前核心还有剩余可用数,若是,则将当前核心分配给创建的云主机使用;
对于找到的核心,若所有核心都没有剩余可用数了,此时则查询云主机所在计算节点的显卡,判断所有核心当中是否还存在未被其它云主机使用的核心,即空闲核心,由于与所选择配置相同配置的核心均已不满足判定条件,故接下来找寻得到的空闲核心的配置必然与所选择配置不同。
进一步的,若云主机所在计算节点显卡当前还存在空闲核心,则选择任一空闲核心,并修改该核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。需要说明的是,对于云平台产品,计算节点上的PCI(Peripheral ComponentInterconnect,定义局部总线的标准)设备有变化时,需要稍等若干秒钟才会把信息同步到主控,而显卡也是一种PCI设备,所以修改显卡核心配置之后需要稍等一定的时间,此期间通过云平台提供的list_pci_devices接口不断查询,根据查询结果判断核心是否已经获取到了修改之后的新的配置。对于其他的云平台产品,同样需要注意类似的设置生效时间问题。
进一步的,若云主机所在计算节点显卡当前不存在空闲核心了,则获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心,修改获取的核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机,具体的,获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心,修改获取的核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机,具体为:
a:获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心;
b:判断获取的核心的配置是否与所选择配置相同:
若是,则将正在使用该核心的其中一云主机进行关机,然后查询当前正使用该核心的云主机数量,确定该核心至少已释放出一空闲数量后,将该核心分配给创建的云主机;
若否,则将正在使用该核心的所有云主机进行关机,然后查询当前正使用该核心的云主机数量,以确保使用该核心的所有云主机均已释放,然后修改该核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
具体的,当云主机所在计算节点显卡当前不存在空闲核心时,此时需要找到云主机所在计算节点显卡所有核心中,被使用的云主机数量最小的一个核心(即云主机所在计算节点显卡核心中,当前正在使用的云主机数量最少的核心),然后对该核心进行配置修改操作,在对该核心进行配置修改操作时,此时存在两种情况,一是该核心的配置与所选择配置相同;二是该核心的配置与所选择配置不相同。例如,核心A的配置与所选择配置相同,但核心A不满足判定条件,且核心A不为空闲核心,且核心A为云主机所在计算节点显卡所有核心中,被使用的云主机数量最小的一个核心。
在没有空闲核心情形下,在对核心进行配置修改时,若核心的配置与所选择配置相同,则将正在使用该核心的其中一云主机进行关机,由于云平台是在云主机关机完毕后才释放其使用的显卡核心空闲数的,所以需要稍等一段时间,待云主机的状态为SHUTOFF之后,再次查询正在使用该核心的云主机的数量,确定已经释放出了至少一个空闲数量之后,将该核心分配给创建的云主机,然后让用户需要使用的云主机进入常规的开机流程;若核心的配置与所选择配置不相同,则将正在使用该核心的所有云主机进行关机,然后查询当前正使用该核心的云主机数量,以确保使用该核心的所有云主机均已释放,然后修改该核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
S4:修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
进一步的,在一实施例中,修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机,具体为:
判断云主机所在计算节点显卡当前是否存在空闲核心:
-若是,则修改一空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机;
-若否,则获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心,将正在使用该核心的所有云主机进行关机,然后查询当前正使用该核心的云主机数量,以确保使用该核心的所有云主机均已释放,然后修改该核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
本申请的云主机集群自适应切分vGPU的方法,为了兼容旧版本云产品以及其他常见云平台使用显卡的方式,增加了设置开关,可以针对每个计算节点启用或停用自适应切分显卡功能。
本申请实施例的云主机集群自适应切分vGPU的方法,通过在云主机创建时进行配置选择,然后查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心,若存在,则在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机,若不存在,则修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机,根据云主机的业务需求自适应切分显卡核心,用以解决小规模使用时需要过多人工干预的问题,同时不需要大型云平台服务商的高成本。
第二方面,本申请实施例还提供一种云主机集群自适应切分vGPU的装置。
一实施例中,参照图2,图2为本申请云主机集群自适应切分vGPU的装置的功能模块示意图。如图2所示,云主机集群自适应切分vGPU的装置包括获取模块、判断模块、第一执行模块和第二执行模块。
获取模块用于获取计算节点中每块显卡的每个核心所支持的配置,并在云主机创建时进行配置选择;判断模块用于查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心,若是,则驱使第一执行模块工作,若否,则驱使第二执行模块工作;第一执行模块用于在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机;第二执行模块用于修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
其中,上述云主机集群自适应切分vGPU的装置中各个模块的功能实现与上述云主机集群自适应切分vGPU的方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
第三方面,本申请实施例提供一种云主机集群自适应切分vGPU的设备,云主机集群自适应切分vGPU的设备可以是个人计算机(personal computer,PC)、笔记本电脑、服务器等具有数据处理功能的设备。
参照图3,图3为本申请实施例方案中涉及的云主机集群自适应切分vGPU的设备的硬件结构示意图。本申请实施例中,云主机集群自适应切分vGPU的设备可以包括处理器、存储器、通信接口以及通信总线。
其中,通信总线可以是任何类型的,用于实现处理器、存储器以及通信接口互连。
通信接口包括输入/输出(input/output,I/O)接口、物理接口和逻辑接口等用于实现云主机集群自适应切分vGPU的设备内部的器件互连的接口,以及用于实现云主机集群自适应切分vGPU的设备与其他设备(例如其他计算设备或用户设备)互连的接口。物理接口可以是以太网接口、光纤接口、ATM接口等;用户设备可以是显示屏(Display)、键盘(Keyboard)等。
存储器可以是各种类型的存储介质,例如随机存取存储器(randomaccessmemory,RAM)、只读存储器(read-only memory,ROM)、非易失性RAM(non-volatileRAM,NVRAM)、闪存、光存储器、硬盘、可编程ROM(programmable ROM,PROM)、可擦除PROM(erasable PROM,EPROM)、电可擦除PROM(electrically erasable PROM,EEPROM)等。
处理器可以是通用处理器,通用处理器可以调用存储器中存储的云主机集群自适应切分vGPU的程序,并执行本申请实施例提供的云主机集群自适应切分vGPU的方法。例如,通用处理器可以是中央处理器(central processing unit,CPU)。其中,云主机集群自适应切分vGPU的程序被调用时所执行的方法可参照本申请云主机集群自适应切分vGPU的方法的各个实施例,此处不再赘述。
本领域技术人员可以理解,图3中示出的硬件结构并不构成对本申请的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
需要说明的是,上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。术语“第一”、“第二”和“第三”等描述,是用于区分不同的对象等,其不代表先后顺序,也不限定“第一”、“第二”和“第三”是不同的类型。
在本申请实施例的描述中,“示例性的”、“例如”或者“举例来说”等用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”、“例如”或者“举例来说”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”、“例如”或者“举例来说”等词旨在以具体方式呈现相关概念。
在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;文本中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,另外,在本申请实施例的描述中,“多个”是指两个或多于两个。
在本申请实施例描述的一些流程中,包含了按照特定顺序出现的多个操作或步骤,但是应该理解,这些操作或步骤可以不按照其在本申请实施例中出现的顺序来执行或并行执行,操作的序号仅用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作或步骤可以按顺序执行或并行执行,并且这些操作或步骤可以进行组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备执行本申请各个实施例所述的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种云主机集群自适应切分vGPU的方法,其特征在于,所述云主机集群自适应切分vGPU的方法包括:
获取计算节点中每块显卡的每个核心所支持的配置,并在云主机创建时进行配置选择;
查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心:
若是,则在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机;
若否,则修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
2.如权利要求1所述的一种云主机集群自适应切分vGPU的方法,其特征在于,所述获取计算节点中每块显卡的每个核心所支持的配置,具体为:
进行云平台系统的部署和启动,并查询得到已启用自适应切分显卡功能的计算节点;
获取查询得到的计算节点中每块显卡的每个核心所支持的配置。
3.如权利要求2所述的一种云主机集群自适应切分vGPU的方法,其特征在于,在云主机创建时进行配置选择,具体为:
在计算节点进行云主机创建,并对创建的云主机进行硬件设置,判断云主机所在计算节点是否启用自适应切分显卡功能:
若否,则云主机在预先设定的配置中进行配置选择,并将选择的配置记录至数据库;
若是,则云主机在预先设定的配置中,以及获取的配置中进行配置选择,并将选择的配置记录至数据库。
4.如权利要求1所述的一种云主机集群自适应切分vGPU的方法,其特征在于,在查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心之前,还包括:
进行云主机开机时,判断云主机是否进行配置选择:
若是,则判断云主机所在的所在计算节点是否启用自适应切分显卡功能:
-若启用,则判断云主机所在的所在计算节点是否带有显卡,若未带有,则云主机进入常规开机流程,若带有,则查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心;
-若未启用,则云主机进入常规开机流程;
若否,则云主机进入常规开机流程。
5.如权利要求1所述的一种云主机集群自适应切分vGPU的方法,其特征在于,所述查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心,具体为:
获取得到云主机所在计算节点显卡所有核心的配置;
将获取得到的配置依次与所选择的配置进行比对,进行是否一致判断。
6.如权利要求5所述的一种云主机集群自适应切分vGPU的方法,其特征在于,所述在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机,具体为:
获取云主机所在计算节点显卡的核心中,所有与所选择配置一致的核心;
判断获取的所有核心中是否存在满足判定条件的核心,所述判定条件为核心当前已使用云主机台数小于所选择配置规定的数量:
若存在,则在所有满足判定条件的核心中选择一核心分配给创建的云主机;
若不存在,判断云主机所在计算节点显卡当前是否存在空闲核心:
-若是,则修改一空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机;
-若否,则获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心,修改获取的核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
7.如权利要求6所述的一种云主机集群自适应切分vGPU的方法,其特征在于,所述获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心,修改获取的核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机,具体为:
获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心;
判断获取的核心的配置是否与所选择配置相同:
若是,则将正在使用该核心的其中一云主机进行关机,然后查询当前正使用该核心的云主机数量,确定该核心至少已释放出一空闲数量后,将该核心分配给创建的云主机;
若否,则将正在使用该核心的所有云主机进行关机,然后查询当前正使用该核心的云主机数量,以确保使用该核心的所有云主机均已释放,然后修改该核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
8.如权利要求5所述的一种云主机集群自适应切分vGPU的方法,其特征在于,修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机,具体为:
判断云主机所在计算节点显卡当前是否存在空闲核心:
-若是,则修改一空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机;
-若否,则获取云主机所在计算节点显卡的所有核心中,当前已使用云主机台数最少的核心,将正在使用该核心的所有云主机进行关机,然后查询当前正使用该核心的云主机数量,以确保使用该核心的所有云主机均已释放,然后修改该核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
9.一种云主机集群自适应切分vGPU的装置,其特征在于,所述云主机集群自适应切分vGPU的装置包括:
获取模块,其用于获取计算节点中每块显卡的每个核心所支持的配置,并在云主机创建时进行配置选择;
判断模块,其用于查询并判断云主机所在计算节点显卡的所有核心中是否存在与所选择配置一致的核心,若是,则驱使第一执行模块工作,若否,则驱使第二执行模块工作;
第一执行模块,其用于在所有一致核心中,选择一当前已使用云主机台数小于所选择配置规定数量的核心,分配给创建的云主机;
第二执行模块,其用于修改云主机所在计算节点显卡的空闲核心的配置,以与所选择配置一致,并将配置修改后的核心分配给创建的云主机。
10.一种云主机集群自适应切分vGPU的设备,其特征在于,所述云主机集群自适应切分vGPU的设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的云主机集群自适应切分vGPU的程序,其中所述云主机集群自适应切分vGPU的程序被所述处理器执行时,实现如权利要求1至8中任一项所述的云主机集群自适应切分vGPU的方法的步骤。
CN202311681284.0A 2023-12-06 2023-12-06 云主机集群自适应切分vGPU的方法、装置及设备 Pending CN117519907A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311681284.0A CN117519907A (zh) 2023-12-06 2023-12-06 云主机集群自适应切分vGPU的方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311681284.0A CN117519907A (zh) 2023-12-06 2023-12-06 云主机集群自适应切分vGPU的方法、装置及设备

Publications (1)

Publication Number Publication Date
CN117519907A true CN117519907A (zh) 2024-02-06

Family

ID=89755034

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311681284.0A Pending CN117519907A (zh) 2023-12-06 2023-12-06 云主机集群自适应切分vGPU的方法、装置及设备

Country Status (1)

Country Link
CN (1) CN117519907A (zh)

Similar Documents

Publication Publication Date Title
US10003514B2 (en) Method and system for determining a deployment of applications
CN110389843B (zh) 一种业务调度方法、装置、设备及可读存储介质
CN104951694A (zh) 一种管理虚拟机的隔离方法及装置
CN112486522A (zh) 含智能网卡OpenStack裸机的部署方法及装置
CN113127150A (zh) 云原生系统的快速部署方法、装置、电子设备和存储介质
CN111176790A (zh) 云平台物理主机的主动维护方法、装置及可读存储介质
CN115617364B (zh) Gpu虚拟化部署方法、系统、计算机设备和存储介质
CN110633130A (zh) 一种基于内存热插拔技术的虚拟内存管理方法和装置
CN114968477A (zh) 容器热迁移方法及容器热迁移装置
US11561843B2 (en) Automated performance tuning using workload profiling in a distributed computing environment
US6598105B1 (en) Interrupt arbiter for a computing system
CN110308914B (zh) 升级处理方法、装置、设备、系统及计算机可读存储介质
CN117519907A (zh) 云主机集群自适应切分vGPU的方法、装置及设备
CN115277398A (zh) 一种集群的网络配置方法和装置
EP4086756A1 (en) Method and apparatus for processing virtual machine component
CN111722888B (zh) 一种操作执行方法、装置、设备及可读存储介质
CN114281444A (zh) 一种实施云桌面客户端的布置方法
CN113687908A (zh) Pmem虚拟机的创建方法、装置、设备及可读存储介质
CN112052439A (zh) 嵌入式系统的访问权限控制方法、控制装置及存储介质
CN111858234A (zh) 一种任务执行方法、装置、设备、介质
CN105094947A (zh) 一种虚拟计算资源的配额管理方法及系统
CN113032141B (zh) 一种ai平台资源切换方法、系统及介质
CN109002347B (zh) 一种虚拟机内存分配方法、装置及系统
CN114217973A (zh) 私有云计算资源池构建方法及系统
CN117270976A (zh) 基本输入输出系统开机方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination