CN110471766A

CN110471766A - 一种基于cuda的gpu资源调度系统和方法

Info

Publication number: CN110471766A
Application number: CN201910724239.6A
Authority: CN
Inventors: 苏斌
Original assignee: Beijing Huaheng Shengshi Technology Co Ltd
Current assignee: Beijing Huaheng Shengshi Technology Co Ltd
Priority date: 2019-08-06
Filing date: 2019-08-06
Publication date: 2019-11-19
Anticipated expiration: 2039-08-06
Also published as: CN110471766B

Abstract

本发明公开了一种基于CUDA的GPU资源调度系统，管理节点和系统用户，所述系统用户通过提交作业模块连接到管理节点，所述管理节点通过派发作业模块连接有IBM Power计算节点和NVDIA DGX计算节点。本发明针对不同类型的应用采用不同的GPU特性，提高整个系统中GPU的利用率，加速应用在GPU中的运行效率。系统可以针对应用需求，动态切换GPU模式，根据应用需要选择最适合应用的GPU类型及其需要的GPU Factor，同一用户多个应用可通过GPU MPS以独占的方式共享使用GPU，提高GPU利用率，支持IBM Power和NVIDIA DGX两种GPU NVLINK拓扑，将应用分配到带有NVLINK互联的GPU上，通过把当前GPU的主要特性应用于资源调度系统中，提高了这个系统的GPU资源利用率以及应用的运行效率。

Description

一种基于CUDA的GPU资源调度系统和方法

技术领域

本发明涉及CUDA GPU及资源调度系统技术领域，具体为一种基于CUDA的GPU资源调度系统，同时，本发明还涉及一种基于CUDA的GPU资源调度方法。

背景技术

GPU又称显示核心、视觉处理器、显示芯片，是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器

随着GPU(Graphic Processing Unit，图形处理器)通用技术的发展，GPU不仅能够处理图像负载，也能够处理特定类型的通用程序。目前，当有多个不同的kernel程序需要访问GPU时，一般是以序列化的方式使请求访问GPU的kernel程序按照发送请求的时间顺序逐个访问GPU。

GPU目前在机器学习，深度学习，科学计算，游戏制作等领域有着广泛的应用。随着GPU的普及，原来越多的集群配置了GPU。其中CUDA GPU的应用最为广泛，其支持的特性包括GPU内存，GPU类型(如TeslaK80，Tesla P100)，GPU Factor，GPU MPS(Multiple ProcessService多进程服务)，GPU模式，GPU NVLINK(一种基于总线的高速通讯协议)等，不同类型的应用使用不同的GPU特性可以提高应用的运行效率，进而提升整个资源调度系统的GPU利用率。目前主流资源调度系统PBS，Slurm，LSF等对GPU资源的调度主要集中在GPU个数及GPU内存的使用限制，没有一种资源调度系统可以把各种GPU特性整合在系统中，为此我们提出一种基于CUDA的GPU资源调度系统和方法。

发明内容

本发明的目的在于提供一种基于CUDA的GPU资源调度系统和方法，针对不同类型的应用采用不同的GPU特性，提高整个系统中GPU的利用率，加速应用在GPU中的运行效率。系统可以针对应用需求，动态切换GPU模式，根据应用需要选择最适合应用的GPU类型及其需要的GPU Factor，同一用户多个应用可通过GPU MPS以独占的方式共享使用GPU，提高GPU利用率。支持IBM Power和NVIDIA DGX两种GPU NVLINK拓扑，将应用分配到带有NVLINK互联的GPU上，通过把当前GPU的主要特性应用于资源调度系统中，提高了这个系统的GPU资源利用率以及应用的运行效率，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：一种基于CUDA的GPU资源调度系统，管理节点和系统用户，所述系统用户通过提交作业模块连接到管理节点，所述管理节点通过派发作业模块连接有IBMPower计算节点和NVDIA DGX计算节点。

优选的，所述管理节点负责接收作业GPU请求，根据作业GPU请求为作业分配合适的GPU计算节点。

优选的，所述IBM Power计算节点负责按照作业GPU请求启动GPU作业，修改GPU模式，以及收集作业GPU使用信息。

优选的，所述NVDIA DGX计算节点负责使用CUDA API(NVIDIA GPU应用开发接口来收集计算节点GPU信息并上报给管理节点，所收集的GPU信息包括GPU个数、GPU内存、GPU类型和GPU NVLINK拓扑结构。

优选的，所述GPU类型包括GeForce系列、Tesla系列和Quadro系列。

本发明还提供一种基于CUDA的GPU资源调度方法，包括以下步骤：

S1：在计算节点上调用CUDA API来收集GPU信息并上报给管理节点；

S2：系统用户把应用作为GPU作业提交至管理节点，管理节点调度系统根据作业的GPU内存，GPU类型，GPU NVLINK的GPU相关请求为作业分配最合适的GPU计算节点，如作业需要GPU内存为10G，则调度系统会将作业调度到GPU可用内存大于10G的机器上运行；作业需要GPU类型为Tesla K80，则调度系统会将作业调度到含有GPU类型为Tesla K80GPU的机器上运行；作业需要GPU之间具有NVLINK连接，则调度系统会将作业调度到GPU之间具有NVLINK的机器上，并确保分配的都个GPU之间都具有NVLINK连接；

S3：计算机点启动作业之前，系统根据作业请求的GPU模式动态切换为作业所分配的GPU的模式，如作业请求以独占的方式使用GPU，则系统可将GPU模式从共享模式切换为独占模式并分配给作业使用，其它作业不能再使用该切换为独占模式的GPU；作业请求以共享的方式使用GPU，则系统也可将GPU模式从独占模式切换为共享模式，其它作业可以共享方式与此作业共同使用该切换为共享模式的GPU；

S4：计算节点为同一用户相同GPU请求作业启动GPU MPS，使同一用户的不同作业以独占的方式共享使用分配的GPU；

S5：计算节点收集作业GPU使用信息并展示给系统用户。

与现有技术相比，本发明的有益效果是：

1、本发明针对不同类型的应用采用不同的GPU特性，提高整个系统中GPU的利用率，加速应用在GPU中的运行效率。系统可以针对应用需求，动态切换GPU模式，根据应用需要选择最适合应用的GPU类型及其需要的GPU Factor，同一用户多个应用可通过GPU MPS以独占的方式共享使用GPU，提高GPU利用率。支持IBM Power和NVIDIA DGX两种GPU NVLINK拓扑，将应用分配到带有NVLINK互联的GPU上，通过把当前GPU的主要特性应用于资源调度系统中，提高了这个系统的GPU资源利用率以及应用的运行效率。

附图说明

图1为本发明IBM Power NVLINK图；

图2为本发明NVDIA DGX-1NVLINK图；

图3为本发明一种基于CUDA的GPU资源调度系统的整体架构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-3，本发明提供一种技术方案：一种基于CUDA的GPU资源调度系统，管理节点和系统用户，所述系统用户通过提交作业模块连接到管理节点，所述管理节点通过派发作业模块连接有IBMPower计算节点和NVDIA DGX计算节点。

具体的，所述管理节点负责接收作业GPU请求，根据作业GPU请求为作业分配合适的GPU计算节点。

具体的，所述IBM Power计算节点负责按照作业GPU请求启动GPU作业，修改GPU模式，以及收集作业GPU使用信息。

具体的，所述NVDIA DGX计算节点负责使用CUDA API(NVIDIA GPU应用开发接口来收集计算节点GPU信息并上报给管理节点，所收集的GPU信息包括GPU个数、GPU内存、GPU类型和GPU NVLINK拓扑结构。

具体的，所述GPU类型包括GeForce系列、Tesla系列和Quadro系列。

S5：计算节点收集作业GPU使用信息并展示给系统用。

综上所述：本发明针对不同类型的应用采用不同的GPU特性，提高整个系统中GPU的利用率，加速应用在GPU中的运行效率。系统可以针对应用需求，动态切换GPU模式，根据应用需要选择最适合应用的GPU类型及其需要的GPU Factor，同一用户多个应用可通过GPUMPS以独占的方式共享使用GPU，提高GPU利用率。支持IBM Power和NVIDIA DGX两种GPUNVLINK拓扑，将应用分配到带有NVLINK互联的GPU上，通过把当前GPU的主要特性应用于资源调度系统中，提高了这个系统的GPU资源利用率以及应用的运行效率。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于CUDA的GPU资源调度系统，包括管理节点和系统用户，其特征在于：所述系统用户通过提交作业模块连接到管理节点，所述管理节点通过派发作业模块连接有IBMPower计算节点和NVDIA DGX计算节点。

2.根据权利要求1所述的一种基于CUDA的GPU资源调度系统，其特征在于：所述管理节点负责接收作业GPU请求，根据作业GPU请求为作业分配合适的GPU计算节点。

3.根据权利要求1所述的一种基于CUDA的GPU资源调度系统，其特征在于：所述IBMPower计算节点负责按照作业GPU请求启动GPU作业，修改GPU模式，以及收集作业GPU使用信息。

4.根据权利要求1所述的一种基于CUDA的GPU资源调度系统，其特征在于：所述NVDIADGX计算节点负责使用CUDA API(NVIDIA GPU应用开发接口来收集计算节点GPU信息并上报给管理节点，所收集的GPU信息包括GPU个数、GPU内存、GPU类型和GPU NVLINK拓扑结构。

5.根据权利要求4所述的一种基于CUDA的GPU资源调度系统，其特征在于：所述GPU类型包括GeForce系列、Tesla系列和Quadro系列。

6.一种根据权利要求1所述的基于CUDA的GPU资源调度方法，其特征在于：包括以下步骤：

S2：系统用户把应用作为GPU作业提交至管理节点，管理节点调度系统根据作业的GPU内存，GPU类型，GPU NVLINK的GPU相关请求为作业分配最合适的GPU计算节点，如作业需要GPU内存为10G，则调度系统会将作业调度到GPU可用内存大于10G的机器上运行；作业需要GPU类型为Tesla K80，则调度系统会将作业调度到含有GPU类型为Tesla K80 GPU的机器上运行；作业需要GPU之间具有NVLINK连接，则调度系统会将作业调度到GPU之间具有NVLINK的机器上，并确保分配的都个GPU之间都具有NVLINK连接；

S5：计算节点收集作业GPU使用信息并展示给系统用户。