CN103077007A - 基于cuda-gpu集群平台的混合式并行绘制方法 - Google Patents
基于cuda-gpu集群平台的混合式并行绘制方法 Download PDFInfo
- Publication number
- CN103077007A CN103077007A CN2013100262283A CN201310026228A CN103077007A CN 103077007 A CN103077007 A CN 103077007A CN 2013100262283 A CN2013100262283 A CN 2013100262283A CN 201310026228 A CN201310026228 A CN 201310026228A CN 103077007 A CN103077007 A CN 103077007A
- Authority
- CN
- China
- Prior art keywords
- group
- control server
- drafting
- cuda
- gpu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Generation (AREA)
Abstract
本发明涉及并行的图形绘制领域,公开了一种基于CUDA-GPU集群平台的混合式并行绘制方法,包括建立了一个混合式的三层嵌套并行的绘制流水线。本发明的优点在于,支持多屏拼接显示方式并进行了优化,充分利用了CUDA架构GPU显卡的性能,提高了并行的绘制过程的效率。
Description
技术领域
本发明涉及并行的图形绘制领域,特别涉及一种基于CUDA-GPU集群平台的混合式并行绘制方法。
背景技术
历经二十多年的高速发展,个人计算机(PC)显卡的图形处理器(GPU)的计算能力日益强大。GPU专为高度并行的实时3D渲染计算而设计,配合专为并行计算而设计的CUDA通用编程模型,GPU的并行计算能力可以得到更灵活完美地发挥。但由于应用需求的推动,单个GPU难以满足大规模场景绘制的需求。因此,人们在PC上安装多个GPU显卡并搭建PC-GPU集群计算环境,开发适合PC-GPU集群环境的并行绘制系统,利用CUDA-GPU集群平台实现高性能图形绘制来满足应用需求。由于PC-GPU集群计算环境具有高性价比、使用灵活、扩展性好等特点,因此逐渐成为并行绘制技术的研究热点。但早期的GPU功能有限,编程接口不统一、兼容性和编程体验极差,制约了相关研究的发展。自NVIDIA在2006年发布专为并行科学计算设计的CUDA统一计算编程模型,CUDA+GPU的软硬件并行架构组合就席卷全球,掀起了CUDA+GPU研究与应用的热潮。使用统一的CUDA通用计算编程模型后,普通的PC-GPU集群一跃升级为CUDA-GPU集群通用计算平台,其编程体验和并行计算能力得到极大提升,成为并行图形绘制领域中势不可挡的发展潮流。
有了CUDA-GPU集群通用计算平台,还需要在平台上运行并行绘制系统才能完成图形绘制任务。特定的平台特性决定了不同的并行绘制系统体系结构,体系结构设计的优劣对系统性能有极大的影响,因此一直是并行绘制系统的基本研究问题之一。
传统上并行绘制系统体系结构按照图形处理流水线的并行方式可以分为sort-first、sort-middle和sort-last三种基本体系结构类型。在PC-GPU集群的并行绘制系统中一般采用sort-first或者sort-last的单个层次的体系结构,对PC-GPU集群来说,使用单一的并行方式无法很好地发挥PC-GPU集群的计算能力,特别地,对于多屏投影拼接显示,由于所需要的计算量较大,需要同时部署多台PC方能满足多平投影拼接显示的计算需求。
发明内容
本发明针对现有技术无法充分地发挥CUDA-GPU集群的性能,设备的利用效率不高,需要同时部署多台PC的缺点,提供了一种能够充分发挥CUDA-GPU集群的计算能力,具有较高的并行绘制能力的新型基于CUDA-GPU集群平台的混合式并行绘制方法,。
为实现上述目的,本发明可采取下述技术方案:
基于CUDA-GPU集群平台的混合式并行绘制方法,包括以下具体步骤:
1)初始化组控服务器,建立组控服务器之间的联系,启动虚拟绘制器,建立动态虚拟绘制组,将虚拟绘制器分配至动态虚拟绘制组,将动态虚拟绘制组注册到组控服务器,所述虚拟绘制器、组控服务器分别为运行于PC环境中的系统进程,所述虚拟绘制器构成虚拟机,所述PC环境为一台PC机或者由多台PC机构成的PC集群,所述PC机上安装有CUDA架构的GPU显卡,所述虚拟绘制器经过逻辑组合构成所述动态虚拟绘制组,一个组控服务器管理和控制一个动态虚拟绘制组;
2)启动绘制任务;
3)按照sort-first方式对所述绘制任务进行细分,将细分后的绘制任务发送至组控服务器;
4)所述组控服务器依据所述细分后的绘制任务的计算量调整所述动态虚拟绘制组的虚拟绘制器的数量;
5)所述组控服务器选择sort-first或者sort-last方式对所述细分后的绘制任务进行二次细分并将二次细分后的绘制任务分配至所属的虚拟绘制器;
6)所述虚拟绘制器并行地对二次细分后的绘制任务进行计算,并将计算结果返回所述组控服务器;
7)所述组控服务器将所述计算结果进行组合并显示在屏幕的相应位置上。
作为优选,所述步骤4还包括注销现有的动态虚拟绘制组或者注册新的动态虚拟绘制组。
作为优选,当所述步骤5中组控服务器选择sort-first方式,则所述步骤7中的组合步骤为对所述计算结果进行拼接;或者当所述步骤5种组控服务器选择sort-last方式,则所述步骤7中的组合步骤为对所述计算结果进行合成。
作为优选, 所述PC机上安装2块CUDA架构的GPU显卡,所述2块GPU显卡之间通过SLI接口连接。
本发明针对的是构建于CUDA-GPU集群上的多屏拼接技术,并行绘制系统的输出只需要按照投影仪阵列的投影显示器进行划分,每个组控服务器分别对应投影显示器的一个显示子区域。
本发明所采用的混合式并行绘制体系结构由三个层次的体系架构所组成,其并行绘制流水线如图3所示,第一层次对应动态虚拟绘制组,一个动态虚拟绘制组对应显示屏幕的一个特定区域,这些动态虚拟绘制组构成了sort-first并行绘制方式;第二层次对应动态虚拟绘制组内部,各虚拟绘制器之间可以选择sort-first 方式或者sort-last方式进行并行绘制;第三层次对应虚拟绘制器内部,由于虚拟绘制器使用了一部分的显卡GPU资源,利用GUDA架构的显卡本身的并行计算能力,在GPU上按照数据与计算并行的方式进行绘制。
组控服务器:每一个连接投影仪的PC机上运行一个对并行绘制过程进行管控的进程,该进程称之为组控服务器(Control Server)。组控服务器本身不参与绘制,但管理一个动态虚拟绘制组,具体的绘制工作由组内的CUDA-GPU虚拟绘制服务器(VR)完成。
CUDA-GPU虚拟绘制服务器(VR):简称虚拟绘制器,是专门完成绘制任务的工作进程。一台PC上可以运行多个虚拟绘制器进程。每一个虚拟绘制器进程都掌握着其所在PC所安装GPU的部分计算与存储资源,每一个虚拟绘制器可以并行地、互不干扰地使用所属的计算存储资源上对绘制任务进行计算。
动态虚拟绘制组(DVRT):由若干CUDA-GPU虚拟绘制服务器构成,是并行绘制系统的基本功能单元。虚拟绘制器是完成组内绘制任务的基本绘制单元,它从对应的组控服务器那里获取绘制任务,完成绘制之后将绘制结果回传给组控服务器。
本发明由于采用了以上技术方案,具有显著的技术效果:
本发明在虚拟机的基础上实现了混合式并行绘制体系结构,提升了绘制方式的适应性,特别针对多屏拼接显示和PC集群进行了优化,令这种混合式的并行绘制体系结构可以兼容不同类型的硬件设备要求。
由于动态虚拟绘制组可以灵活地根据细分的任务对选择sort-first的体系结构或者sort-last体系结构,因此可以适应不同细分任务的绘制要求,使得并行绘制的工作流程更为灵活。由于采用了上述混合式的并行绘制体系结构,充分挖掘了CUDA架构的GPU的并行计算能力,相对于现有的CUDA-GPU集群,提高了集群的整体工作效率。
附图说明
图1是本发明的混合式并行绘制体系结构的逻辑结构示意图。
图2是本发明的虚拟机的逻辑结构示意图。
图3是本发明的并行绘制流水线的逻辑结构示意图。
具体实施方式
下面结合实施例对本发明作进一步的详细描述。
实施例1
基于CUDA-GPU集群平台的混合式并行绘制方法,使用如图1、2所示的并行绘制体系结构,包括进程级的组控服务器1和虚拟绘制器3,以及动态虚拟绘制组2,具体步骤为:
1)初始化组控服务器1,建立组控服务器1之间的联系,启动虚拟绘制器3,建立动态虚拟绘制组2,将虚拟绘制器3分配至动态虚拟绘制组2,初始状态下虚拟绘制器3不属于任何动态虚拟绘制组2,在并行系统运行过程中被实时地分配到各动态虚拟绘制组2中,并归由各组控服务器1支配。将动态虚拟绘制组2注册到组控服务器1,组控服务器1开始对动态虚拟绘制组2进行管理和监控,所述虚拟绘制器3、组控服务器1分别为运行于PC环境中的系统进程,所述虚拟绘制器3构成虚拟机,虚拟绘制器3占有一部分的GPU运算资源,所述PC环境为一台PC机或者由多台PC机构成的PC集群,所述PC机上安装有CUDA架构的GPU显卡,特别地, PC机上安装有2块CUDA架构的GPU显卡,所述2块GPU显卡之间通过SLI接口连接。,所述虚拟绘制器3经过逻辑组合构成所述动态虚拟绘制组2,一个组控服务器1管理和控制一个动态虚拟绘制组2。
2)启动绘制任务。
3)按照sort-first方式对所述绘制任务进行细分,将细分后的绘制任务发送至组控服务器1。
4)所述组控服务器1依据所述细分后的绘制任务的计算量调整所述动态虚拟绘制组2的虚拟绘制器3的数量,组控服务器1还可以根据需要注销现有的动态虚拟绘制组2或者注册新的动态虚拟绘制组2,达到动态虚拟绘制组2的总体绘制能力和细分后的绘制任务计算量的平衡。
5)所述组控服务器1选择sort-first或者sort-last方式对所述细分后的绘制任务进行二次细分并将二次细分后的绘制任务分配至所属的虚拟绘制器3。
6)所述虚拟绘制器3并行地对二次细分后的绘制任务进行计算,并将计算结果返回所述组控服务器1。
7)所述组控服务器1将所述计算结果进行组合,这里的组合步骤需要依据步骤5中组控服务器1所选择的方式选择组合的方式:当所述步骤5中组控服务器1选择sort-first方式,虚拟绘制器3将其负责的屏幕子块的图像发送到组控服务器1,组控服务器1将所有的子块进行拼接组合成本动态虚拟绘制组的输出图像;或者当所述步骤5种组控服务器1选择sort-last方式,则所有虚拟绘制器参与图像深度合成过程,并由组控服务器1生成最终的合成图像。组内自适应切换的目的是选择更适应的当前绘制环境的绘制方式以提高并行绘制系统效率。组合完成后,组控服务器1根据所对应的屏幕位置和矫正参数,对组合后所得到的图像进行校正后显示在屏幕的相应位置上,最终在屏幕上得到所需要的图像。
对比试验
将实施例1与现有技术进行对比以观测具体的效果。为了能够准确的进行对比,在硬件结构上,都采用具有16个节点的并行绘制系统,这16个节点为安装有同样的GUDA架构的GPU的PC机,分别采用实施例1所述的技术方案和现有技术中的AnyGL、OpenRM+Chromium、Equalizer等并行绘制技术进行对比,在同样大小的显示屏上进行显示,所测试的数据集分别包括35-650百万个三角面片数不等,记录绘制结果如下表所示:
由上表可知,对于同样的并行节点数和同样的数据集,采用实施例1所述的并行绘制方法,具有较高的输出帧数,说明采用实施例1所述的方法后,对并行绘制系统中的CUDA-GPU集群的绘制性能有了显著的提升。
总之,以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所作的均等变化与修饰,皆应属本发明专利的涵盖范围。
Claims (4)
1.一种基于CUDA-GPU集群平台的混合式并行绘制方法,其特征在于,包括以下具体步骤:
1)初始化组控服务器(1),建立组控服务器(1)之间的联系,启动虚拟绘制器(3),建立动态虚拟绘制组(2),将虚拟绘制器(3)分配至动态虚拟绘制组(2),将动态虚拟绘制组(2)注册到组控服务器(1),所述虚拟绘制器(3)、组控服务器(1)分别为运行于PC环境中的进程,所述虚拟绘制器(3)构成虚拟机,所述PC环境为一台PC机或者由多台PC机构成的PC集群,所述PC机上安装有CUDA架构的GPU显卡,一个组控服务器(1)管理和控制一个动态虚拟绘制组(2);
2)启动绘制任务;
3)按照sort-first方式对所述绘制任务进行细分,将细分后的绘制任务发送至组控服务器(1);
4)所述组控服务器(1)依据所述细分后的绘制任务的计算量调整所述动态虚拟绘制组(2)的虚拟绘制器(3)的数量;
5)所述组控服务器(1)选择sort-first或者sort-last方式对所述细分后的绘制任务进行二次细分并将二次细分后的绘制任务分配至所属的虚拟绘制器(3);
6)所述虚拟绘制器(3)对二次细分后的绘制任务进行计算,并将计算结果返回所述组控服务器(1);
7)所述组控服务器将所述计算结果进行组合并显示在屏幕的相应位置上。
2.根据权利要求1所述的基于CUDA-GPU集群平台的混合式并行绘制方法,其特征在于,所述步骤4还包括注销现有的动态虚拟绘制组(2)或者注册新的动态虚拟绘制组(2)。
3.根据权利要求1所述的基于CUDA-GPU集群平台的混合式并行绘制方法,其特征在于,当所述步骤5中组控服务器(1)选择sort-first方式,则所述步骤7中的组合步骤为对所述计算结果进行拼接;或者当所述步骤5种组控服务器(1)选择sort-last方式,则所述步骤7中的组合步骤为对所述计算结果进行合成。
4.根据权利要求1所述的基于CUDA-GPU集群平台的混合式并行绘制方法,其特征在于, 所述PC机上安装2块CUDA架构的GPU显卡,所述2块GPU显卡之间通过SLI接口连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310026228.3A CN103077007B (zh) | 2013-01-24 | 2013-01-24 | 基于cuda-gpu集群平台的混合式并行绘制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310026228.3A CN103077007B (zh) | 2013-01-24 | 2013-01-24 | 基于cuda-gpu集群平台的混合式并行绘制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103077007A true CN103077007A (zh) | 2013-05-01 |
CN103077007B CN103077007B (zh) | 2015-12-02 |
Family
ID=48153546
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310026228.3A Expired - Fee Related CN103077007B (zh) | 2013-01-24 | 2013-01-24 | 基于cuda-gpu集群平台的混合式并行绘制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103077007B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105446683A (zh) * | 2015-11-18 | 2016-03-30 | 中国电子科技集团公司第二十八研究所 | 基于cuda的空中交通电子航图显示加速方法 |
CN105653350A (zh) * | 2015-12-30 | 2016-06-08 | 南京乐飞航空技术有限公司 | 一种用于飞行模拟器的气象雷达仿真渲染方法 |
CN116880737A (zh) * | 2023-09-06 | 2023-10-13 | 成都中科合迅科技有限公司 | 图形绘制控制方法和系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101739662A (zh) * | 2009-12-21 | 2010-06-16 | 浙江工商大学 | 并行图形绘制的混合式自适应体系结构设计 |
CN102376293A (zh) * | 2010-08-19 | 2012-03-14 | 上海济丽信息技术有限公司 | 一种基于fpga的图像拼接处理器及图像拼接方法 |
-
2013
- 2013-01-24 CN CN201310026228.3A patent/CN103077007B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101739662A (zh) * | 2009-12-21 | 2010-06-16 | 浙江工商大学 | 并行图形绘制的混合式自适应体系结构设计 |
CN102376293A (zh) * | 2010-08-19 | 2012-03-14 | 上海济丽信息技术有限公司 | 一种基于fpga的图像拼接处理器及图像拼接方法 |
Non-Patent Citations (1)
Title |
---|
彭浩宇: "基于PC集群机的并行图形绘制系统研究", 《信息科技辑》, 30 June 2007 (2007-06-30) * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105446683A (zh) * | 2015-11-18 | 2016-03-30 | 中国电子科技集团公司第二十八研究所 | 基于cuda的空中交通电子航图显示加速方法 |
CN105446683B (zh) * | 2015-11-18 | 2019-01-11 | 中国电子科技集团公司第二十八研究所 | 基于cuda的空中交通电子航图显示加速方法 |
CN105653350A (zh) * | 2015-12-30 | 2016-06-08 | 南京乐飞航空技术有限公司 | 一种用于飞行模拟器的气象雷达仿真渲染方法 |
CN105653350B (zh) * | 2015-12-30 | 2018-11-27 | 南京乐飞航空技术有限公司 | 一种用于飞行模拟器的气象雷达仿真渲染方法 |
CN116880737A (zh) * | 2023-09-06 | 2023-10-13 | 成都中科合迅科技有限公司 | 图形绘制控制方法和系统 |
CN116880737B (zh) * | 2023-09-06 | 2023-11-17 | 成都中科合迅科技有限公司 | 图形绘制控制方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN103077007B (zh) | 2015-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107766148B (zh) | 一种异构集群及任务处理方法和装置 | |
JP7029554B2 (ja) | 深層学習モデルをトレーニングするための方法及び装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム | |
CN102047241B (zh) | 本地与全局数据共享 | |
US9063793B2 (en) | Virtual server and virtual machine management method for supporting zero client by providing host interfaces from classified resource pools through emulation or direct connection modes | |
CN104737129B (zh) | 用于对来宾虚拟机的硬件资源进行虚拟化的专用虚拟机 | |
CN103049927B (zh) | 基于gpu集群的实时光线跟踪渲染方法 | |
CN102541618B (zh) | 一种通用图形处理器虚拟化的实现方法、系统及装置 | |
CN104102488A (zh) | 一种基于多线程并行化的3d引擎系统 | |
CN104123184B (zh) | 一种用于为构建过程中的任务分配资源的方法和系统 | |
CN103810047B (zh) | 动态改善逻辑分区的存储器亲和性 | |
CN112286645A (zh) | 一种gpu资源池调度系统及方法 | |
CN106600672B (zh) | 一种基于网络的分布式同步渲染系统和方法 | |
CN102118458A (zh) | 一种虚拟机热迁移的方法及系统 | |
CN106201413A (zh) | 一屏多窗口显示的触控分配方法、装置及液晶显示装置 | |
US9378533B2 (en) | Central processing unit, GPU simulation method thereof, and computing system including the same | |
CN112395736B (zh) | 一种分布交互仿真系统的并行仿真作业调度方法 | |
CN103558959A (zh) | 一种应用于Android平台的显示窗口的方法和装置 | |
CN103677970A (zh) | 实现终端本地桌面和远端虚拟桌面合并显示的系统和方法 | |
CN114356578B (zh) | 自然语言处理模型的并行计算方法、装置、设备及介质 | |
CN102622476A (zh) | 用于建筑算量领域的cad图纸整合系统 | |
CN106201259A (zh) | 一种虚拟现实系统中分享全景影像的方法和装置 | |
CN103294473A (zh) | 虚拟表面压实 | |
CN107077375A (zh) | 用于多操作系统的显示方法、装置和电子设备 | |
CN103077007B (zh) | 基于cuda-gpu集群平台的混合式并行绘制方法 | |
JP2020519979A (ja) | 設定可能な数のアクティブなコアを有する画像処理プロセッサおよびサポートする内部ネットワーク |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20151202 Termination date: 20190124 |
|
CF01 | Termination of patent right due to non-payment of annual fee |