CN107038679B - 用于管理多个图形卡的方法和系统 - Google Patents

用于管理多个图形卡的方法和系统 Download PDF

Info

Publication number
CN107038679B
CN107038679B CN201611273143.5A CN201611273143A CN107038679B CN 107038679 B CN107038679 B CN 107038679B CN 201611273143 A CN201611273143 A CN 201611273143A CN 107038679 B CN107038679 B CN 107038679B
Authority
CN
China
Prior art keywords
graphics
resource
data
abstract
card
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611273143.5A
Other languages
English (en)
Other versions
CN107038679A (zh
Inventor
N·琼
N·科隆贝
V·巴谢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dassault Systemes SE
Original Assignee
Dassault Systemes SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dassault Systemes SE filed Critical Dassault Systemes SE
Publication of CN107038679A publication Critical patent/CN107038679A/zh
Application granted granted Critical
Publication of CN107038679B publication Critical patent/CN107038679B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45504Abstract machines for programme code execution, e.g. Java virtual machine [JVM], interpreters, emulators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/005General purpose rendering architectures
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/363Graphics controllers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/28Indexing scheme for image data processing or generation, in general involving image processing hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/52Parallel processing
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2360/00Aspects of the architecture of display systems
    • G09G2360/06Use of more than one graphics processor to process data before displaying to one or more screens
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2360/00Aspects of the architecture of display systems
    • G09G2360/08Power processing, i.e. workload management for processors involved in display operations, such as CPUs or GPUs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Graphics (AREA)
  • Computer Hardware Design (AREA)
  • Human Computer Interaction (AREA)
  • Processing Or Creating Images (AREA)
  • Image Generation (AREA)

Abstract

本发明特别涉及一种用于修改用于渲染场景的多个图形卡的计算机实现的方法,图形卡包括一个或多个图形处理单元。该方法包括:提供已经被加载在渲染引擎中的场景,所述场景包括要用于渲染所述场景的视图的至少一个图形数据;修改用于所述至少一个图形数据的图形资源的抽象图形资源,所述抽象图形资源存储用于每个图形卡的所述图形资源的标识符,这是通过为每个新添加的图形卡添加所述图形资源的新标识符来实现的;在每个新添加的图形卡上传送已经存储在所述图形卡之一上的所述至少一个图形数据。

Description

用于管理多个图形卡的方法和系统
技术领域
本发明涉及计算机程序和系统领域,并且更具体地涉及用于管理多个图形卡的方法、系统和程序。
背景技术
用于渲染三维(3D)场景的计算机图形技术目的在于在诸如计算机屏幕、电视、投影仪等显示设备上绘制3D场景。渲染3D场景也被称为3D渲染。
用于3D渲染的计算机图形技术依赖于彼此交互的硬件和软件部件,并且这些部件形成专用于3D渲染的架构。该架构的主要硬件部件是图形卡(GC),图形卡是被设计为使得一些类型的计算更快的加速器。GC专门用于图形计算,诸如将三角形转换成像素。GC包括一个或多个图形处理单元(GPU);GPU是执行GC的图形计算的芯片。GC可以连接到显示3D渲染的结果的一个或若干显示设备。通过图形库(GL)将GC和GPU的指令发送给监视器,所述图形库是被设计为帮助渲染计算机图形的计算机程序库。GL由托管GC的计算机的中央处理单元(CPU)执行(或运行)。两个最著名的GL是
Figure GDA0003366488020000011
Figure GDA0003366488020000012
在实践中,GL不是由硬件制造商而是由第三方写入的,第三方将根据由硬件制造商提供的硬件规范来开发GL。渲染引擎(RE)是将3D场景作为输入并且使用一个或多个GC(在多图形卡渲染的情况下)将其绘制到屏幕的框架。3D场景由使用RE框架的应用程序创建。RE将由应用程序提供的信息转化成图形资源(GR)。GR是由GL供给的对象,在GR上可以执行诸如缓冲、贴图等操作。图形驱动器(GD)是提供接口以允许操作系统(OS)与GC之间的通信的计算机程序。在实践中,GD由GC制造商提供。
多GC渲染是应用程序使用插入在同一主板上的若干GC来渲染场景的能力。尽管多GC原理是最近的,但只有少数应用程序使用它,因为它涉及RE框架中的很多复杂性。
有两种常见的技术来实现多图形卡渲染。两者都依赖于图形驱动器工作而不是依赖于渲染引擎框架。第一个技术使用由nVIDIATM开发的SLITM或由AMDTM开发的CrossFireTM。基本上,当应用程序的RE正在渲染一个帧时,RE使用GL,好像计算机内部只有一个GC一样。RE不知道有若干GC。GD接收命令并将其传播到GC。这在图1上被图示,图1示出具有两个GC的计算机的示例,其中一个GC渲染屏幕的上部分,并且第二GC渲染底部分。RE从应用程序接收命令,该命令被转化成由GL接收的GR(例如,缓冲、贴图等),GL又为一个GC发送命令。管理两个卡(GC1,GC2)的GD使用SLITM/CrossFireTM技术为两个GC创建命令,以使每个GC(GC1的GPU1,GC2的GPU 2)的每个GPU都知道要处理什么信息。
第二个技术基于第一个,并且被称为Mosaic模式。Mosaic模式描述以较高分辨率、使用显示驱动器来渲染以将结果传播到多个屏幕的能力。Mosaic模式与上述第一个技术的组合为每个GC提供处理单独的显示的能力。
这第一个和第二个技术主要用于游戏应用程序中以提高性能或用于飞行模拟器中来以合理性能输出到多于一个显示器。
除了这两个技术之外,另一个技术通过由GL暴露渲染特征来提供具体的多GC。然而,该技术是实验性的,并且未被硬件和软件制造商利用。
多GC渲染的这些技术受若干缺点的影响。第一个是它们受限于具体场景:Mosaic模式用于多屏渲染,而SLITM/CrossFireTM用于视频游戏。实际上,这些技术依赖于向GC分派命令的GD能力;然而,GD不是每次都知道用于执行分派所需的所有信息,使得这些解决方案适用于应用程序开发者所保留的少数场景。例如,在未保留场景中,仅仅使用一个GC;应用程序不能受益于其它GC的计算资源。
另一个限制是这些技术限制于经渲染的3D场景上的一个视点。因此,不可能利用GPU的计算资源来并行计算若干视点,而利用GPU的计算资源来并行计算若干视点在视点改变时将改善3D场景的显示速度。
进一步的限制是不可能向特定GC寻址特定命令,并且不可能将该特定命令暴露给RE。如上所解释的,RE不知道有若干GC。
在该背景下,仍然需要对多个GC的改进的管理。值得注意的是,所述管理应该允许选择在渲染期间占用的一个或多个GC。
发明内容
因此提供一种用于修改用于渲染场景的多个图形卡的计算机实现的方法。图形卡包括一个或多个图形处理单元。该方法包括:提供已经被加载在渲染引擎中的场景,该场景包括将用于渲染场景的视图的至少一个图形数据;修改用于至少一个图形数据的图形资源的抽象图形资源,该抽象图形资源存储用于每个图形卡的图形资源的标识符,这是通过为每个新添加的图形卡添加所述图形资源的新标识符实现的;在每个新添加的图形卡上传送已经存储在图形卡之一上的所述至少一个图形数据。
该方法可以包括以下中的一个或多个:
-在每个新添加的图形卡上传送已经存储在图形卡之一上的所述至少一个图形数据包括:选择图形卡中的存储所述至少一个图形数据的图形卡;在选择的图形卡的GPU上检索所述至少一个图形数据的数据;并将从GPU获得的数据复制到每个新添加的图形卡;
-渲染引擎包括至少两个逻辑层,上层向应用程序提供对渲染引擎的访问,并且下层向渲染引擎提供对图形库的访问,并且其中抽象图形资源的修改由在上层和最低层之间包括的抽象层执行;
-传送进一步包括:在选择图形卡之一之后:由图形库请求所选择的图形卡的GPU上的数据;并且其中作为图形库的请求的结果,在所选择的图形卡的GPU上检索所述至少一个图形数据的数据;
-在抽象图形资源的修改之前:由下层在图形库上访问每个新添加的图形卡的标识符;并向抽象层提供每个新添加的图形卡的标识符;
-修改的抽象图形资源存储具有提供的(多个)标识符的图形资源的标识符;
-修改抽象图形资源的步骤进一步包括修改存储抽象图形资源的表;并且其中抽象图形资源的修改包括向渲染引擎提供对存储将被修改的抽象图形资源的表的访问。
进一步提供了包括用于执行上述内容的指令的渲染引擎计算机程序。
进一步提供了一种具有记录在其上的渲染引擎计算机程序的计算机可读存储介质。
进一步提供了一种包括耦合到存储器的处理电路的系统,存储器具有记录在其上的渲染引擎计算机程序。
附图说明
现在将通过非限制性示例并参考附图来描述本发明的实施例,在附图中:
-图1示出用于执行多GC显示的现有技术方法的流程图;
-图2示出本发明的示例的流程图;
-图3示出用于处理抽象图形资源的表的创建的示例;
-图4示出创建抽象图形资源的示例;
-图5示出用于抽象图形资源的管理的表的示例;
-图6示出在图形数据上执行的操作的示例;以及
-图7示出计算机系统的示例。
具体实施方式
参考图2的流程图,提出一种用于管理用于渲染场景的多个图形卡(GC)的计算机实现的方法。GC可以包括一个或多个图形处理单元(GPU)。该方法包括提供已经被加载在渲染引擎中的场景。该场景可以是三维(3D)场景。该场景包括用于渲染场景的视图的一个或多个图形数据。该方法进一步包括修改用于至少一个图形数据的抽象图形资源。抽象图形资源存储用于在3D场景的渲染中占用的每个图形卡的3D场景的给定图形资源的标识符。通过为每个新添加的图形卡添加图形资源的新标识符,执行抽象图形资源的修改。该方法还包括在每个新添加的图形卡上传送已经存储在图形卡之一上的所述一个或多个图形数据。
这种方法在使用当前图形库(GL)的同时改善对多个图形卡(GC)的管理。显著的是,本发明允许在应用程序正在运行时添加一个或多个其它图形卡。例如,如果应用程序从两个图形卡上的两个不同的视点绘制树,树的图形资源需要在这两个图形卡上。在第一个图形卡上,缓冲器将具有资源名称N1,而在第二个中具有资源名称N2。这引入很多复杂性,因为渲染引擎的每个部分都必须处理这种复杂性,并复制所有渲染命令以处理两个图形卡。现在,选取具有六个其它待渲染的视点的相同示例,其变得非常不易处理(i)为单个对象“树”管理六个资源名称,和(ii)添加参与渲染的六个其它图形卡。本发明为每个图形资源使用抽象图形资源,使得渲染引擎仅仅操纵图形数据的抽象图形资源,而不是操纵资源名称。因此,假设渲染引擎被给予对抽象图形资源的访问权,(例如,向渲染引擎请求具体显示的应用程序的)每个内部命令通过由其匹配的抽象句柄替换图形卡的具体资源名称来修改。渲染引擎不再处理上述复杂性,并且不再需要复制其接收的所有渲染命令。结果,添加新的图形卡并从一个图形卡切换到多个图形卡变得可行。下文中将讨论额外的优点。
该方法是计算机实现的。这意味着该方法的步骤(或者基本上所有步骤)由至少一个计算机或相似的任何系统执行。因而,该方法的步骤可能由计算机完全自动或半自动地执行。在示例中,可以通过用户-计算机交互来执行该方法的步骤中的至少一些的触发。所需的用户-计算机交互的级别可以取决于预见的自动化的水平,并且与实现用户的愿望的需要平衡。在示例中,该级别可以是用户定义的和/或预定义的。
该方法的计算机实现方式的典型示例是用适于该目的的系统来执行该方法。该系统可以包括耦合到存储器的处理器、以及多个图形卡。渲染引擎和表示场景的数据可以被存储在存储器上,并且渲染引擎可以在CPU上运行。更一般地,存储器可以具有在其上记录的计算机程序,包括用于执行该方法的指令。存储器还可以存储数据库。存储器是适于这样的存储的任何硬件,可能包括若干物理不同的部件(例如,一个用于程序,并且可能一个用于数据库)。“数据库”意味着被组织用于搜索和检索的数据(即信息)的任何集合(例如,例如基于预定的结构化语言的关系数据库,例如SQL)。当存储在存储器上时,数据库允许计算机进行快速搜索和检索。数据库实际上被结构化,以便于结合各种数据处理操作的数据的存储、检索、修改和删除。数据库可以由可以被分解成记录的文件或文件组组成,记录中的每一个由一个或多个字段组成。字段是数据存储的基本单位。用户可以主要通过查询来检索数据。使用关键字和排序命令,用户可以快速地搜索、重新排列、分组和选择许多记录中的字段,以根据正在使用的数据库管理系统的规则来检索或创建关于数据的特定聚合的报告。
该方法操纵图形数据,例如图形数据可以是建模对象。建模对象可以由不同种类的数据定义,例如CAD对象、PLM对象、PDM对象、CAE对象、CAM对象、CAD数据、PLM数据、PDM数据、CAM数据、CAE数据。图形数据是用于表示建模对象的任何数据。
例如,在通过使用CAD系统获得的3D场景的上下文中,建模对象典型地可以是3D建模对象,例如,表示诸如零件或零件的组件的产品,或者可能是产品的组件。“3D建模对象”意味着由允许其3D表示的数据来建模的任何对象。3D表示允许从所有角度查看零件。例如,当被3D表示时,3D建模对象可以被处理并围绕其任何轴或围绕上面显示该表示的屏幕中的任何轴旋转。这明显排除未被3D建模的2D图标。3D表示的显示便于设计(即,增大设计者在统计上完成他们的任务的速度)。这加速了工业中的制造过程,因为产品的设计是制造过程的部分。3D建模对象可以表示在完成其虚拟设计之后将在真实世界中制造的产品的几何结构,完成虚拟设计利用例如CAD软件解决方案或CAD系统,3D建模对象例如是(例如机械)零件或零件的组件,或者更一般地是任何刚性体部件(例如移动机构)。CAD软件解决方案允许在各种且无限的工业领域中设计产品,包括:航空航天、建筑、结构、消费品、高科技设备、工业装置、运输、海洋和/或海洋石油/天然气生产或运输。由该方法设计的3D建模对象因而可以表示工业产品,其可以是任何机械零件,例如陆地交通工具(例如包括汽车和轻型卡车装置、赛车、摩托车、卡车和汽车装置、卡车和公共汽车、火车)的零件、空中交通工具(例如包括机身装置、航空航天装置、推进装置、国防产品、航空装置、空间装置)的零件、海洋交通工具(例如包括海军装置、商用船只、海上装置、游艇和工作船、海洋装置)的零件、一般机械零件(例如包括工业制造机械、重型移动机械或装置、安装装置、工业装置产品、金属制品、轮胎制品)、机电或电子零件(例如包括消费电子产品、安全和/或控制和/或仪器产品、计算和通信装置、半导体、医疗设备和装置)、消费品(例如包括家具、家用和花园产品、休闲用品、时尚产品、硬质商品零售商产品、软质商品零售商产品)、包装(例如包括食品和饮料及烟草、美容和个人护理、家务产品包装)。
PLM另外意味着适于对表示物理制品(或待制造的产品)的建模对象的管理的任何系统。在PLM系统中,建模对象因而由适合于物理对象的制造的数据来定义。这些典型地可以是尺寸值和/或公差值。为了正确地制造对象,实际上最好具有这样的值。
CAM另外意味着适于管理产品的制造数据的任何解决方案、硬件的软件。制造数据一般包括与制造的产品、制造过程和所需的资源相关的数据。CAM解决方案用于计划和优化产品的整个制造过程。例如,其可以给CAM用户提供可以在制造过程的具体步骤中使用的关于可行性、制造过程的持续时间或诸如具体机器人的资源的数量的信息;并且因而允许关于管理或所需投资的决定。CAM是在CAD过程和潜在CAE过程之后的后续过程。这样的CAM解决方案由商标
Figure GDA0003366488020000071
下的Dassault Systèmes提供。
CAE另外意味着适于对建模对象的物理行为的分析的任何解决方案、硬件的软件。公知且广泛使用的CAE技术是有限元方法(FEM),其典型地包含将建模对象划分成可以通过方程式计算和模拟其物理行为的元素。这样的CAE解决方案由商标
Figure GDA0003366488020000072
下的Dassault Systèmes提供。另一个成长的CAE技术包含对由来自不同物理领域的多个分量组成而无需CAD几何结构数据的复杂系统的建模和分析。CAE解决方案允许仿真,并且因而允许对制造的产品的优化、改进和验证。这样的CAE解决方案由商标
Figure GDA0003366488020000073
下的Dassault Systèmes提供。
PDM代表产品数据管理。PDM解决方案意味着适于管理与特定产品相关的所有类型的数据的任何解决方案、硬件的软件。PDM解决方案可以由包含在产品的生命周期中的所有参与者使用:主要是工程师,但也包括项目经理、财务人员、销售人员和购买者。PDM解决方案一般基于面向产品的数据库。它允许参与者共享关于其产品的一致数据,并且因此防止参与者使用发散数据。这样的PDM解决方案由商标
Figure GDA0003366488020000074
下的Dassault Systèmes提供。
图7示出系统的示例;该系统是计算机系统,例如用户的工作站。
示例的系统包括连接到内部通信总线1000的中央处理单元(CPU)1010、也连接到总线的随机存取存储器(RAM)1070。系统进一步提供有与连接到总线的视频随机存取存储器1100相关联的图形处理单元(GPU)1110。视频RAM 1100在本领域中也被称为帧缓冲器。大容量存储设备控制器1020管理对大容量存储器设备(诸如硬盘驱动器1030)的访问。适合于有形地体现计算机程序指令和数据的大容量存储器设备包括所有形式的非易失性存储器,例如包括:半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘和可移除盘;磁光盘;以及CD-ROM盘1040。任何前述内容可以由专门设计的ASIC(专用集成电路)补充或并入其中。网络适配器1050管理对网络1060的访问。系统还可以包括触觉设备1090,例如光标控制设备、键盘等。在系统中使用光标控制设备以允许用户将光标选择性地定位在显示器1080上的任何期望位置。另外,光标控制设备允许用户选择各种命令并输入控制信号。光标控制设备包括用于向系统输入控制信号的许多信号生成设备。典型地,光标控制设备可以是鼠标、正用于生成信号的鼠标的按钮。替代地或另外,系统可以包括敏感垫和/或敏感屏幕。
计算机程序可以包括可由计算机(例如图7的系统)执行的指令。计算机程序的指令使以上系统执行该方法。程序可以是可记录在任何数据存储介质上,包括系统的存储器。程序例如可以在数字电子电路中、或在计算机硬件、固件、软件中或者在它们的组合中实现。程序可以被实现为装置,例如有形地体现在用于由可编程处理器执行的机器可读存储设备中的产品。方法步骤可以由可编程处理器执行,可编程处理器执行指令的程序以通过对输入数据进行操作并生成输出来执行方法的功能。处理器因而可以是可编程的并且被耦合以从数据存储系统、至少一个输入设备和至少一个输出设备接收数据和指令,并且向数据存储系统、至少一个输入设备和至少一个输出设备发送数据和指令。应用程序可以以高级过程或面向对象的编程语言、或者如果期望的话以汇编或机器语言来实现。在任何情况下,语言可以是编译或解释语言。程序可以是完全安装程序或更新程序。程序在系统上的应用在任何情况下导致用于执行该方法的指令。
返回参考图2的流程图,图2讨论根据本发明的用于管理多个图形卡的计算机实现的方法的示例。
在步骤S200处,提供三维(3D)场景;3D场景被加载在渲染引擎(RE)中。3D场景包括将用于渲染3D场景的视图的至少一个图形数据。渲染引擎是在应用程序请求时生成待显示的图像的框架。例如,CAD系统的CAD应用程序向渲染引擎提供3D建模对象的3D场景作为输入,并且渲染引擎使用CAD系统的一个或多个图形卡将3D场景绘制到屏幕。该框架被实现为软件部件,该软件部件采用应用程序请求显示的数据作为输入,并且输出可以显示的图像。
典型的渲染引擎包含用于隐藏渲染引擎的实现方式细节的若干逻辑层代码,如本领域中已知的。每个层提供用于与其它层、系统的硬件部件或由系统执行的应用程序通信的一组功能和接口。逻辑层的数量可以变化。上层n依赖于层n-1,等等。层n-1比层n更靠近硬件。
在发明的示例中,渲染引擎包括至少三个逻辑层;即上层、下层和抽象层。上层目的在于向应用程序(例如,CAD应用程序)提供对渲染引擎的访问,例如,上层包括诸如API的接口。上层可以由应用程序本身访问以提供3D场景。下层向渲染引擎提供对图形库的访问,图形库是被设计成帮助将计算机图形渲染到显示器的计算机程序库,如本领域中已知的。抽象层在上层和下层之间,并且目的在于管理创建的抽象图形资源。仅仅最低层有权访问图形资源的资源名称,并且仅仅上层处理(多个)抽象图形资源。
渲染引擎典型地是被称为渲染引擎计算机程序的计算机程序。因此当执行方法的步骤时执行渲染引擎。
在渲染引擎中加载3D场景意味着表示3D场景的数据(例如,文件)被提供给渲染引擎,也就是说,渲染引擎可以访问数据并在其上执行计算。表现3D场景意味着在其中放置至少一个3D模型的3D空间。对于系统立场,场景是包括将用于渲染3D场景的视图的至少一个图形数据的文件。
现在参考图3,现在讨论抽象图形资源的创建。
一旦已经在渲染引擎中加载了3D场景(S300),就为在步骤S300处加载的3D场景的至少一个图形数据创建抽象图形资源(S310)。创建可由先前讨论的抽象层执行。抽象图形资源存储图形卡中的至少一个的图形资源的标识符。图形资源是可由图形卡显示的数据:它由图形库根据先前加载的图形数据计算而来。如本领域中已知的那样执行图形数据到图形资源的变换。图形数据典型地是存储将显示的几何结构的二进制资产,并且其可以进一步包括用于描述该几何结构(例如纹理、缓冲、照明、阴影信息、视点等等)的可选参数。从图形库的立场,图形资源可以是但不限于几何结构、缓冲器、纹理、帧缓冲器、采样器、着色器、视点等等。该场景包括将用于渲染场景的视图的至少一个图形数据,要理解:典型的场景一般包括数千个图形数据。
从而,步骤S310包括针对系统的每个图形卡执行对(加载的场景的图形数据的)相同图形资源的识别,并且这组识别的图形资源本身用充当所述图形资源的唯一标识符的抽象图形资源来识别。
步骤S310处创建的抽象图形资源存储系统的每个图形卡上的图形资源的唯一标识符。在实践中,抽象图形资源可以进一步存储用于系统的每个图形卡的标识符,一个标识符用于一个图形卡。因此,抽象图形资源处理图形资源的标识符连同在其上加载图形资源的图形卡的标识符。标识符可以是但不限于数字、字母数字字符等等。例如,每个图形卡可以被限定为被实现为整数的密钥:其数值对于图形卡1是1,对于图形卡2是2,对于图形卡n是n,等等。
在查询图形库上的渲染引擎时获得图形资源的标识符。在示例中,渲染引擎的下层访问已经创建了图形资源的图形库,并且图形库在系统的图形卡之一上提供图形资源的标识符。一旦下层已经获得标识符,它就被提供给抽象层。优选地,给定图形资源的所有标识符被立即查询,用于改善抽象图形资源的创建速度。
在实践中,图形卡上的图形资源的标识符也被称为资源名称。由图形库在图形数据被变换成图形资源时创建资源名称。
接下来,在步骤S320处,抽象图形资源被存储在表中。该表被存储在系统的存储器上。表可以是已经存在的;在该情况下,用新的抽象图形资源完成表。如果没有表存在的话,则首先创建表(即,表在存储器中可用),并且然后用新的抽象图形资源完成表。在实践中,渲染引擎是在被执行时被加载到存储器中的软件,并且执行的渲染引擎与用于存储抽象图形资源的表一起供给。从而,将向渲染引擎提供对表的访问(S140),该表存储作为加载3D场景的结果而创建的抽象图形资源。通过这种方式,渲染引擎能够处理(或管理)3D场景的图形数据。
然后,在步骤S330处,在系统的每个图形卡上复制图形资源(现在通过抽象图形资源而在系统的每个图形卡上识别它)。将理解的是:复制在图形卡上的信息可以由所述图形卡利用,也就是说,图形资源是由图形库供给的对象,操作在该图形库上可以由图形卡的至少一个图形处理单元执行。如本领域中已知的那样执行图形资源到图形卡的复制,例如图形资源被存储在图形卡的存储器上。并且在步骤S340处,渲染引擎可以访问表,该表存储作为加载3D场景的结果而创建的抽象图形资源。
现在参考图4至6,讨论当渲染引擎接收应用程序的命令时步骤S300至S330的示例。渲染引擎命令是渲染引擎必须执行的命令。命令例如可以是用具体颜色绘制几何结构或清除屏幕。命令可以来自使用渲染引擎的用户(例如,通过执行显示请求的应用程序)或直接来自渲染引擎,这取决于渲染引擎的构造。在常见的渲染引擎中,命令典型地由动作(绘制、清除等等)和识别图形资源(例如将绘制的几何结构图形资源)的一个或多个资源名称组成。在本发明中,渲染引擎的抽象层在待执行的命令中用关联到图形资源的抽象图形资源替换图形资源的资源名称。将根据系统的图形卡的数量而执行该命令。例如,如果系统包括八个图形卡,则该命令将被执行八次;一次执行针对一个图形卡。
在图4中,表示了抽象图形资源、资源名称和图形卡之间的关系。在应用程序的请求时,在渲染引擎上已经加载了图形数据(当加载3D场景时)。已经作为加载图形数据的结果创建了抽象图形资源。抽象图形资源表示计算机系统的两个图形卡(图形卡1和图形卡2)上的图形资源(由图形库根据加载的图形数据计算)。每个图形资源具有也被称为资源名称的唯一标识符;这里,图形资源在图形卡1上具有资源名称1,并且在图形卡2上具有资源名称2。将理解的是:可能在创建抽象图形资源之前执行图形资源在图形卡上的复制;即,在步骤S310之前执行步骤S330。在步骤S330之前执行步骤S310改善图形卡上的图形资源的关联,并且还改善抽象图形资源的创建和管理。
图6示出当图形数据被加载到渲染引擎时执行的步骤。创建的抽象图形资源表示图形资源的n个资源名称,每个资源名称与n个图形卡中的一个相关联。图形资源被复制在图形卡上。一旦完成复制(步骤S330),先前创建的抽象图形资源(步骤S320)就被返回到应用程序。使用抽象图形资源而不是资源名称对于不知道抽象图形资源表示多于一个图形资源的应用程序是透明的。因而不需修改应用程序,抽象图形资源的创建/管理正由渲染引擎的抽象层执行。抽象层可以被配置成向上层提供所创建的抽象图形资源。通过这种方式,应用程序可以经由应用程序可以访问的上层而被直接通知新的抽象图形资源的创建。这允许隐藏图形卡管理和工作的复杂性,好像系统中只有一个图形卡一样。
现在参考图5,现在描绘用于存储和管理所创建的抽象图形资源的架构的示例。该示例的架构类似于具有用于搜索表的良好的行的抽象图形资源的复式表,并且图形卡标识符(也被称为用于图形卡的密钥)用于搜索表的良好的列。例如,抽象句柄40允许识别表的行42,行42包括若干列42a-42c,每列存储一个图形卡标识符。现在,根据列,可能获得图形资源的所有资源名称(即每个图形卡上的资源名称)。在实践中,资源名称可以连同图形卡的标识符被存储在表中,例如在行42a-42c上。
现在讨论用于用两个不同视点显示3D场景的抽象图形资源创建和使用的示例。在该示例中,系统包括两个图形卡,并且每个图形卡将负责用一个视点显示3D场景。在应用程序请求渲染引擎用两个不同视点显示3D场景之后,图形库命令(也称为图形库动作)由渲染引擎接收。如先前所看到的,场景上的视点是图形资源,其是由图形库供给并且可以在其上执行操作的对象。并且该视点图形资源可以由应用程序通过向渲染引擎发送命令来请求。在讨论的示例中,应用程序发送请求相同场景上的两个视点的命令。渲染引擎的上层典型地负责接收应用程序的命令;否则,应用程序有权经由上层访问渲染引擎。一旦已经接收命令,渲染引擎就识别该命令关注的抽象图形资源,例如在抽象图形资源是在表中进行搜索。在实践中,这变得可能,因为渲染引擎已经向应用程序提供关联到加载的图形数据的抽象图形资源。遍历抽象图形资源的表行,以便获得所有图形卡上的资源名称:图形资源是已知的,命令可以通过在命令中由相应的资源名称替换抽象图形资源来执行。将理解的是:利用每个图形卡上存储的图形资源的资源名称来为所述每个图形卡执行命令。
以类似的方式执行抽象图形资源的删除。应用程序向渲染引擎发送删除图形数据的命令。命令(或动作)由渲染引擎接收,因为应用程序可以访问所述渲染引擎,例如通过渲染引擎的上层。命令被寻址到抽象图形资源,因为应用程序用抽象图形资源识别图形数据(作为图形资源被复制在图形卡上)。渲染引擎然后查询抽象图形资源表,并且识别系统的图形卡上的图形资源的标识符。现在可以通过由表中找到的图形资源替换抽象图形资源来修改该命令,已经为与抽象图形资源相关联的每个图形资源创建了新命令。结果,可以执行删除命令,并且擦除图形卡存储器的图形资源。
参考回到图2的流程图,在步骤S210处,提供用于每个新添加的图形卡的标识符。如先前已经讨论的,图形卡的标识符可以是但不限于数字、字母数字字符,并且在图形库上的渲染引擎的查询时获得图形资源的标识符。
表达新的图形卡意味着一个或多个其它图形卡在计算机(例如图7的系统)上可用;其它图形卡是在3D场景的当前渲染中不占用的图形卡。
可以以若干方式添加新的图形卡。例如,可以使用图形卡的逻辑激活,例如在一条代码的动作时激活图形卡。作为另一个示例,可以执行物理激活,例如图形卡被插入到托管GC的系统。
可以在使用渲染引擎的应用程序的请求时执行步骤S210。例如,由应用程序请求3D场景的其它视点,该应用程序知道新的图形卡可以用于渲染这些其它视点。替代地,应用程序不知道新的图形卡是可用的,但是渲染引擎知道,并且其可以提出使应用程序利用这些新的图形卡。应用程序和/或渲染引擎可以具有用于逻辑上激活一个或多个新的图形卡的能力。
然后,在步骤S220处选择一个或多个新的图形卡。根据应用程序的需求和要求执行对(多个)新的图形卡的选择。例如,如果必须渲染三个新的视点,则将选择三个新的图形卡。因而,对新的图形卡的选择可以包括:根据要渲染的新视点的数量选择新的图形卡的数量。对(多个)新的图形卡的选择可以根据每个新的图形卡的硬件能力来执行(或者被另外执行),例如将选择具有更强大的GPU或最大存储器的GC。
当新的图形卡被选择并且将被使用时,由应用程序通过使用对渲染引擎进行配置的具体命令来通知渲染引擎。因而,本发明允许显著地改善对多图形卡系统的管理,并且因而动态地改善场景的渲染。
一旦已经选择一个或多个图形卡,就通过为每个新添加的图形卡添加图形资源的新标识符来修改3D场景的每个图形数据的抽象图形资源(S230)。将理解的是:新添加的图形卡是在步骤S220处选择的图形卡。如参考图5和6所讨论的那样执行为每个新添加的图形卡上的每个图形资源创建新标识符。
既然通过抽象图形资源为每个新的GC识别3D场景的图形资源,在每个新添加的图形卡上传送已经存储在GC上的图形数据(S240)。术语传送意味着图形数据的复制被存储在每个新添加的图形卡上。
可以根据图形库的能力而从由应用程序提供的原始图形数据执行传送,如本领域中已知的。
替代地,可以通过将已经存储在图形卡之一上的图形数据从该图形卡复制到所有新的图形卡(在步骤S220处选择的图形卡)来执行传送。在该情况下,执行对图形卡中的已经存储场景的图形数据的图形卡的选择。执行传送的方式可以取决于图形数据的类型而变化。在作为最通用的场景(大多数图形数据可以使用该场景来传送)的第一示例中,从选择的图形卡的GPU检索图形数据。在实践中,这意味着图形数据被存储在GPU的存储器中,并且它们从该存储器被复制到新的图形卡的存储器。该操作通过使用由图形库提供的专用功能来完成,如本领域中已知的。结果,在每个新添加的图形卡上创建了物理资源。在第二示例中,不可以如在前一个示例中那样直接从GPU检索图形数据;例如,图形数据是缓冲或纹理。使用这种类型的图形数据,图形库的特定功能用于得到数据:具体图形库调用用于从GPU存储器检索数据。例如,图形库中的功能允许用户将所选择的图形卡的视频存储器的内容复制到中央存储器,这反过来允许用户将数据复制到另一个图形卡。可以选择其它方法,这取决于图形库的能力。
已经考虑到新的图形资源的创建来讨论渲染引擎的层之间的交互,如图3至6的示例中所图示。在本发明中,当一个或多个补充图形卡用于渲染3D场景时,抽象图形资源已经存在并被修改。渲染引擎的层之间的交互是相同的。因此,每个新添加的图形卡的标识符通过使用图形库来获得,该图形库是通过渲染引擎的下层来访问的。然后将标识符提供给抽象层。渲染引擎的抽象层存储并管理抽象图形资源。例如,抽象图形资源的修改涉及:修改存储抽象图形资源的表,并且渲染引擎有权访问存储待修改的抽象图形资源的表。

Claims (9)

1.一种用于修改用于渲染场景的多个图形卡的计算机实现的方法,图形卡包括一个或多个图形处理单元,所述方法包括:
提供已经被加载在渲染引擎中的场景,所述场景包括要用于渲染所述场景的视图的至少一个图形数据;
激活一个或多个新添加的图形卡,所述一个或多个新添加的图形卡在所述场景的当前渲染中未被占用;
选择所述一个或多个新添加的图形卡,并且修改用于所述至少一个图形数据的图形资源的抽象图形资源,所述抽象图形资源存储用于每个图形卡的所述图形资源的标识符,这是通过为每个新添加的图形卡添加所述图形资源的新标识符来实现的;
在每个新添加的图形卡上传送已经存储在所述图形卡之一上的所述至少一个图形数据。
2.根据权利要求1所述的计算机实现的方法,其中在每个新添加的图形卡上传送已经存储在所述图形卡之一上的所述至少一个图形数据包括:
选择存储所述至少一个图形数据的所述图形卡之一;
在所选择的图形卡的GPU上检索所述至少一个图形数据的数据;以及
将从所述GPU获得的所述数据复制到每个新添加的图形卡。
3.根据权利要求2所述的计算机实现的方法,其中所述渲染引擎包括至少两个逻辑层,上层向应用程序提供对所述渲染引擎的访问并且下层向所述渲染引擎提供对图形库的访问,并且其中所述抽象图形资源的修改由包括在所述上层和所述下层之间的抽象层执行。
4.根据权利要求3所述的计算机实现的方法,其中传送进一步包括:在所述图形卡之一的选择之后:
由所述图形库请求所选择的图形卡的所述GPU上的数据;
并且其中,作为所述图形库的请求的结果,在所选择的图形卡的所述GPU上检索所述至少一个图形数据的数据。
5.根据权利要求4所述的计算机实现的方法,进一步包括:在所述抽象图形资源的修改之前:
由所述下层在所述图形库上访问每个新添加的图形卡的标识符;以及
向所述抽象层提供每个新添加的图形卡的所述标识符。
6.如权利要求5所述的计算机实现的方法,其中修改的抽象图形资源存储具有所提供的标识符的所述图形资源的标识符。
7.如权利要求1至6之一所述的计算机实现的方法,其中修改所述抽象图形资源的步骤进一步包括对存储所述抽象图形资源的表进行修改;以及
其中所述抽象图形资源的修改包括向所述渲染引擎提供对存储要被修改的所述抽象图形资源的所述表的访问。
8.一种计算机可读存储介质,具有记录在其上的用于执行如权利要求1至7中任一项所述的方法的指令。
9.一种包括耦合到存储器的处理电路的系统,所述存储器具有记录在其上的用于执行如权利要求1至7中任一项所述的方法的指令。
CN201611273143.5A 2015-12-29 2016-12-28 用于管理多个图形卡的方法和系统 Active CN107038679B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP15307165.9A EP3188013B1 (en) 2015-12-29 2015-12-29 Management of a plurality of graphic cards
EP15307165.9 2015-12-29

Publications (2)

Publication Number Publication Date
CN107038679A CN107038679A (zh) 2017-08-11
CN107038679B true CN107038679B (zh) 2022-04-01

Family

ID=55168110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611273143.5A Active CN107038679B (zh) 2015-12-29 2016-12-28 用于管理多个图形卡的方法和系统

Country Status (4)

Country Link
US (1) US10163186B2 (zh)
EP (1) EP3188013B1 (zh)
JP (1) JP6981754B2 (zh)
CN (1) CN107038679B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334317A (zh) * 2018-01-25 2018-07-27 阿里巴巴集团控股有限公司 图形引擎、图形引擎构建方法、更新方法及装置
CN112057852B (zh) * 2020-09-02 2021-07-13 北京蔚领时代科技有限公司 一种基于多显卡的游戏画面渲染方法和系统
CN113407281B (zh) * 2021-06-23 2022-11-11 重庆卡歌科技有限公司 一种基于数据应用的陆海新通道业务动态可视化立体展示方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080211816A1 (en) * 2003-07-15 2008-09-04 Alienware Labs. Corp. Multiple parallel processor computer graphics system
US8553040B2 (en) * 2009-06-30 2013-10-08 Apple Inc. Fingerprinting of fragment shaders and use of same to perform shader concatenation
US8723877B2 (en) * 2010-05-20 2014-05-13 Apple Inc. Subbuffer objects
US20120001925A1 (en) * 2010-06-30 2012-01-05 Ati Technologies, Ulc Dynamic Feedback Load Balancing
JP5699755B2 (ja) * 2011-03-31 2015-04-15 富士通株式会社 割当方法、割当装置、および割当プログラム
US9672583B2 (en) * 2011-12-21 2017-06-06 Intel Corporation GPU accelerated address translation for graphics virtualization
US8941670B2 (en) * 2012-01-17 2015-01-27 Microsoft Corporation Para-virtualized high-performance computing and GDI acceleration
US9697579B2 (en) * 2013-06-07 2017-07-04 Apple Inc. Multi-processor graphics rendering
EP3188014B1 (en) * 2015-12-29 2022-07-13 Dassault Systèmes Management of a plurality of graphic cards

Also Published As

Publication number Publication date
EP3188013A1 (en) 2017-07-05
JP2017126331A (ja) 2017-07-20
EP3188013B1 (en) 2022-07-13
CN107038679A (zh) 2017-08-11
US20170186130A1 (en) 2017-06-29
US10163186B2 (en) 2018-12-25
JP6981754B2 (ja) 2021-12-17

Similar Documents

Publication Publication Date Title
US11733851B2 (en) Generation of a color of an object displayed on a GUI
US11087052B2 (en) Automatic partitioning of a 3D scene into a plurality of zones processed by a computing resource
US8812272B2 (en) Designing a modeled object within a session of a computer-aided design system interacting with a database
KR100921357B1 (ko) 사용자 인터액티브 그래픽 툴을 가지는 제품 편집 및시뮬레이션 데이터베이스 시스템
KR101264924B1 (ko) 제품 수명주기 관리 데이터베이스를 이용하여 뷰내에서 오브젝트를 렌더링하는 프로세스 및 시스템
US9305403B2 (en) Creation of a playable scene with an authoring system
JP6721332B2 (ja) 3dモデル化されたアセンブリ上で境界ボックスを生成すること
US10417803B2 (en) Multiple-pass rendering of a digital three-dimensional model of a structure
US20180137118A1 (en) Querying A Database Based On A Parametric View Function
KR20160024825A (ko) 순차적 업데이트의 실행
CN107038679B (zh) 用于管理多个图形卡的方法和系统
JP6721330B2 (ja) マルチフィジックスシステムの設計
CN107067364B (zh) 用于管理多个图形卡的方法和系统
JP2019153280A (ja) 製品の部品の組み立て方法
JP7071810B2 (ja) 並列に動作する演算リソースの集合を用いて3dシーンをシミュレートするための方法、プログラム、及びシステム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant