CN103942825A - 光线跟踪系统架构和方法 - Google Patents
光线跟踪系统架构和方法 Download PDFInfo
- Publication number
- CN103942825A CN103942825A CN201410189251.9A CN201410189251A CN103942825A CN 103942825 A CN103942825 A CN 103942825A CN 201410189251 A CN201410189251 A CN 201410189251A CN 103942825 A CN103942825 A CN 103942825A
- Authority
- CN
- China
- Prior art keywords
- light
- data element
- test
- data
- computing units
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/06—Ray-tracing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/60—Memory management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/08—Volume rendering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/50—Lighting effects
- G06T15/80—Shading
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2215/00—Indexing scheme for image rendering
- G06T2215/12—Shadow map, environment map
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G2360/00—Aspects of the architecture of display systems
- G09G2360/12—Frame memory handling
- G09G2360/121—Frame memory handling using a cache memory
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G2370/00—Aspects of data communication
- G09G2370/10—Use of a protocol of communication by packets in interfaces along the display data pipeline
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G5/00—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
- G09G5/003—Details of a display terminal, the details relating to the control arrangement of the display terminal and to the interfaces thereto
- G09G5/006—Details of the interface to the display terminal
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G5/00—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
- G09G5/36—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
- G09G5/39—Control of the bit-mapped memory
- G09G5/393—Arrangements for updating the contents of the bit-mapped memory
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- Image Generation (AREA)
Abstract
本发明的多个方面包括根据示例性架构的实现光线跟踪功能的系统。在一个例子中,针对加速结构的元素将光线收集到集合中,在一些例子中,这些元素与构成进行光线跟踪的场景的对象相关联。还可以在输出缓存器中收集检测到的光线相交的指示,并且在一些例子中,该输出缓存器可以包括多个部分,每个部分与一个场景对象相关联,或者该输出缓存器可以包括要在描影期间知悉的代码的公共部分。可以按块读取方式访问缓存器内容。相交描影资源可以载入数据以用于对标识出的光线的相交进行描影并在本地存储该数据以供对这些相交进行描影。
Description
本申请是国际申请日2009年09月09日提交的、于2011年5月9日进入中国国家阶段的、申请号为200980144557.X、发明名称为“光线跟踪系统架构和方法”的分案申请。
相关申请的交叉引用
本申请要求2008年9月10日提交的名称为“用于光线跟踪再现的并行相交测试和描影”的美国临时专利申请第61/095,890号、名称均为“光线跟踪系统架构和方法”的2009年7月28日提交的美国临时申请第61/229,258号和2009年7月29日提交的美国临时申请第61/229,705号、以及2009年9月8日提交的名称为“光线跟踪系统架构和方法”的美国专利申请第12/555,766号的优先权,出于全部目的,以引证方式将以上引用的所有申请的全部内容合并于此。
技术领域
以下涉及利用光线跟踪再现由形状构成的三维场景的二维表示,更具体而言,涉及在三维场景中对光线进行相交测试的系统、方法和装置。
背景技术
在计算机图形学技术中,利用光线跟踪从三维场景描述再现照片真实二维图像是公知的。光线跟踪通常涉及获得由几何形状构成的场景描述,该几何形状描述了场景中结构的表面并且可以称为基元(primitive)。常见的基元形状是三角形。
从视点(“摄像机”)跟踪可见的光线到场景中;各光线被发出并穿过在二维表示中该光线能够影响到的相应像素。利用场景基元来测试光线的相交以识别各光线的第一相交基元(如果存在的话)。
在识别出给定光线的相交后,与该基元相关联的描影器(shader)确定接下来进行何种操作。例如,如果该基元是镜(mirror)的一部分,则发出反射光线以确定光是否从光源射到该相交点,或者在更复杂的情况下,可以模拟亚表面(subsurface)反射和散射,这会导致对发出的即将相交的不同光线进行测试。在另外的例子中,如果一个对象的表面是粗糙的而非光滑的,则该对象的描影器发出光线来模拟该表面上的漫反射。
这样,由于仍需要确定何种光照在基元上,因此在借助于给定光线确定光能是否可以到达像素以及何种光能可以到达像素时,第一步是找到光线与基元之间的交点。
因此,最常规的算法随意地创建当光线对场景进行跟踪时的光线树,在该场景中该树沿着各分支持续直到其离开该场景或者射到不发出新光线的光源。因此,对于射到发光对象的那些分支而言,这些分支在基元交点累积(roll up),从而确定了沿着该路径各基元交点对射到该基元交点的光的影响。最后,可以确定最初发出的摄像机光线的光的颜色和强度并存储在缓存器中。
通过提供对要再现的二维场景的像素的不同部分进行操作的处理资源,能够直观地使光线跟踪并行化。然而,仅提供更多的计算能力并不一定能够使光线跟踪速度和效率成适当比例地增大。其中的一个原因是,这种并行化无法解释数据是如何构成场景,或者无法解释能够以有效方式访问使得跟踪效率增大的加速结构。仍需对光线跟踪架构进行多种改进。
发明内容
在一个方面中,光线跟踪系统包括:输入部,其用于接收光线信息,其中已发现该光线信息与构成正进行光线跟踪的三维场景的基元相交。该系统还包括多个缓存器。排序器耦合至所述输入部和所述多个缓存器。所述排序器被配置为通过使用一个或更多个公共描影器代码和公共描影器数据,在相应缓存器中将希望进行描影的光线的信息组合在一起而在所述多个缓存器之间划分所接收的信息。该系统还包括:输出部,其用于将所选择的缓存器的内容输出至计算资源,该计算资源被配置为对所选择的缓存器中存储有其信息的光线的相交进行描影。在一个实施方式中,各光线的所述信息包括该光线的标识符。除了光线识别信息以外,可以与潜在相交的光线的标识信息相关联地存储可能相交的一个或更多个基元的标识信息。以最接近的检测到的相交的特征的其他信息,还可以在缓存器中存储或者在进行缓存器选择时从存储器检索得到。根据情况,输出部可以从缓存器提供信息作为流,例如光线标识符以及与这些光线标识符相关联的其他信息的流。
在一些实施方式中,与给定光线潜在相交的基元可以具有相应的标识符。这些标识符用于确定这些基元作为其一部分的对象。进而,可以使用该对象的共性来推断在对涉及不同光线的相交进行描影时使用的一个或更多个描影器代码和描影器数据的共性。在一些实施方式中,对象可以与离散描影器代码模块相关联,并且在一些实施方式中,各基元可以与描影器代码模块或部分描影器代码模块相关联。
根据上述实施方式和多个方面的光线跟踪系统还可以包括被配置为对光线相交进行描影的计算资源,该计算资源被配置为在对来自所选择的缓存器的光线的所指示的相交进行描影期间,对检索得到的描影数据在高速缓存中的存储进行设置以供本地访问。被配置为对相交进行描影的计算资源还可以被配置为执行多个标识出的基元的最终相交测试以标识出要进行描影的给定光线的真实相交,该多个标识出的基元可能已经与给定光线相交。还可以通过介于相交测试与描影之间的计算资源来实现这种功能。任意这种光线跟踪系统可以通过将光线标识符从所选择的缓存器流传输至用于对其相应的相交进行描影的计算资源而输出光线信息。
示例性光线跟踪系统的其他方面可以包括具有相交测试输出部的相交测试资源,该相交测试输入部用于接收要在所述相交测试资源中开始相交测试的光线的标识符。这种光线标识符可以从多个描影器代码模块接收,并且可以成块地输出以开始对这些光线标识符所标识的光线进行相交测试,优选的是,同时对这些光线标识符所标识的光线进行相交测试。这种同时测试可以由包括具有多个测试单元的相交测试资源的系统来执行,并且该系统被配置为在所述测试单元之间分派光线标识符块以同时测试所标识的光线。输入部被配置为采集从所述多个测试单元输出的光线的标识符作为所述光线信息。
其他方面包括光线跟踪方法。该方法的一个例子包括:提供对包括三维场景的对象进行定义的数据,该数据构成基元的定义数据,该基元包括所述对象;该方法还包括:定义要处理的多个光线,对各光线的处理包括利用所述基元对如果存在的各最接近相交进行标识,以及通过执行一个或更多个代码模块对这种相交进行描影。该方法还包括以下步骤:输出已标识出最接近相交的分组光线信息,在对标识出的光线的相交进行描影期间基于一个或更多个的代码模块的期望共性和要使用的数据的期望共性而形成所述多组。在一些这样的方法中,该输出步骤包括:在供输出的缓存器中存储所述多组的光线信息。该光线信息可以包括光线标识符、各标识出的光线所相交的一个或更多个基元的标识符、以及在一些实施方式中仅包括各光线首先且实际相交的基元。
在这样的方法中,标识出相应的最接近相交的步骤可以包括:生成所相交的基元的标识符与这些基元相交的光线的标识符之间的关联。基元的标识符可以用于确定要对涉及这些基元的相交进行描影时所执行的代码模块的期望共性。
这种示例性方法还可以进一步包括:在分布式存储器中存储所述多个光线的定义数据,并标识出多个测试单元中所述多个光线的相应最接近相交。各个测试单元具有所分配的至所述分布式存储器的端口。所述分布式存储器还存储了数据,以用于标识出各个光线的当前最接近的检测到的相交。
在系统和相对应的方法中,控制器可以制作光线的集合,至少一些集合与构成三维场景的相应场景对象相关联。可以针对相交测试和描影二者形成所述集合。在一些例子中,所形成的用于描影的集合可以仅限于已标识出实际相交的光线。在其他例子中,可以由加速结构的叶节点形成集合,其中已将这些叶节点定义为包围公共场景对象的基元(还可以基于所确定的一个或更多个描影器代码和描影器数据的共性而定义这种叶节点)。
其他方面包括提供光线跟踪系统的方法,该方法包括:提供相交测试资源,该相交测试资源可操作用于对三维场景中的多个光线同时进行相交测试,从而对所述多个光线中的至少一些光线的检测到的有效相交进行标识。该方法还包括:提供相交描影资源,并提供相交测试资源与相交描影资源之间的通信,该相交描影资源被配置为运行描影代码以对检测到的有效光线相交进行描影。可以通过输出检测到的相交的一组或更多组信息而实现所述通信,其中,基于利用一个或更多个公共描影代码和公共描影数据对各组的各个相交进行描影这一预期而确定所述多组。可以通过基于光线所相交的各基元的标识信息对这些光线进行排序而形成所述多组。该方法还包括以下步骤:提供从描影资源到相交测试资源的新光线数据的缓存。该新光线数据的缓存包括:从多个描影器代码模块收集新光线数据以开始对这些新光线同时进行相交测试。这种方法还可以包括:提供诸如控制模块功能之类的功能以对一个或更多个线程进行调度作为用于执行公共描影代码的描影资源。
可以使用从计算机可读介质获得的计算机可执行代码来实现上述系统和方法。可以在用于实现上述系统部件和其他方面的功能模块中提供这样的代码,除了配置通用处理器以外,这样的代码还可以在硬件中具体实现,该硬件包括专用电路、可编程门阵列和其他定制或半定制逻辑。
另一种示例性系统包括多个相交测试器,各相交测试器可操作用于测试光线与形状的相交,该形状由为其提供的形状数据定义。各相交测试器要测试的光线由该相交测试器可本地访问的数据定义。该系统包括控制器,该控制器用于从相交测试器收集包围该三维场景的基元的加速结构的元素与已经确定与各元素相交的光线的标识符之间的关联。
该系统还包括控制器与该多个相交测试器之间的接口。该接口可以接收待测试光线的一组标识符,并基于相交测试器能够本地访问的各光线的定义数据而使光线标识符分散在相交测试器之间。这种接口能够从控制器提取多个测试器,使得测试器不需要知晓其测试的数据的来源或本质。类似地,由接口从测试单元提取结果,使得控制器不需要向特定的测试单元轮询或查询特定测试的结果。
此外,这种系统可以包括用于对光线与购车三维场景的基元之间的相交进行描影的计算资源。该描影可能导致对新光线进行相交测试。该系统还可以包括第二接口,该第二接口从描影计算资源提取控制器和所述多个测试器。该第二接口可操作用于接收新光线的定义数据,并为新光线指派相应的标识符,借助于该标识符在跟踪期间对各新光线进行标识。
在一些实施方式中,可以将这种系统的测试单元组织成子集以形成多个测试区域。每个测试区域可以包括私有存储器,该私有存储器用于存储正在进行与三维场景的对象进行相交测试的光线的定义数据的相应子集。第一接口可以操作用于从控制器接收包括多个光线标识符的分组。各光线标识符可映射至这些光线中在测试区域的私有存储器中存储有定义数据的一个光线,并用于确定哪个测试区域包括在该分组中标识出的各光线的定义数据。
另一方面包括一种查询系统,该查询系统利用强制分级加速结构向数据库查询信息,该强制分级加速结构具有信息的将元素分组的子集。该系统包括输入缓存器和用于存储数据库中满足要求的数据定义测试请求的存储器。该系统还包括测试逻辑,该测试逻辑用于同时测试离散查询(即当提交时不知晓彼此关系的查询),即查询加速结构的元素是否符合该查询所定义的准则。基于测试的输出将离散查询收集到集合中。可以通过对待测试的集合进行调度而对测试资源进行调度以供进一步查询,使得能够不按照提交的顺序而满足离散查询。这种查询的一个结果是基于该查询中定义的一个或更多个参数而执行对代码模块的标识。该结果还包括对执行该代码模块期间使用的其他数据进行标识。在一些情况下,代码模块的执行可能导致对数据库的进一步查询。
其他方面包括在三维场景中对光线进行跟踪的方法。该方法包括:将该场景中跟踪的光线分散到分级加速结构的多个元素之间。每个元素包围了该三维场景的相应字部分,从而形成了已确定与各元素相交的光线的相应集合。该方法还包括:选择要进一步分散的光线,其中,通过选择这些光线作为成员的集合而实现该操作。该选择操作的目的是为了选择集合中相应数量的光线以及该集合所关联的分级加速结构中的元素的相应位置。
这些系统和上述系统中实现的方法可以借助于维持表示发送给遍历单元的光线(更广义上将,查询)的数量和从该遍历单元返回其结果的光线的数量的分数,通过规定的接口工作。该分数可以用于确定何时向遍历单元发送新光线(查询)。
这种系统或其他系统中可以使用的其他方法方面包括:在基于软件的驱动器中分配存储器部分用于存储光线定义信息。可以基于可维持相交测试状态的光线的总数来确定要分配的存储器部分的大小。该方法还包括:接受来自相交测试控制器的命令以从更大的等待相交测试的光线池提供更多光线来存储在该存储器部分中,该相交测试控制器维持存储在所分配的存储器部分中的光线的状态。
可以在这种系统或其他系统中使用的或者与这种系统和其他系统一起使用的其他构成方法包括建立用于相交测试的加速结构的方法。该方法包括:响应于大小比阈值更大的元素,利用第一数量比特表示加速结构的元素的定义数据。该方法还包括:响应于大小比该阈值更小或等于该阈值的元素,利用比该第一数量更大的第二数量的比特表示该定义数据。在相交测试器中,如果该元素的大小比阈值小,则利用更高的精确度格式进行该测试;如果该元素的大小大于或等于阈值,则利用更低精确度格式对光线进行测试。
附图说明
图1示出了具有摄像机的简化玩具场景,该摄像机发出进行相交测试的光线,并且这种相交使得描影器执行,从而发出用于进行相交测试的另外的光线;
图2示出了示例性系统架构,在该系统架构中例示了相交测试资源、用于执行描影器的计算资源及其互连的例子;
图3例示了示例性相交测试架构和对该架构的部件的用途进行管理的控制逻辑;
图4示出了示例性相交测试架构,该架构例示了实现上述架构的各个方面的进一步的细节;
图5示出了如何利用在描影的范围内有意义的光线标识符提取并通过光线跟踪来执行相交处理(描影)和相交测试(跟踪)的一个例子;
图6示出了在系统中提供光线跟踪功能的示例性架构的进一步细节;
图7示出了可以从根据图6的分组单元发送并由仲裁器(arbiter)用来触发对该分组所标识的光线进行相交测试的分组的示例性组织形式;
图8示出了可在光线相交测试中使用的测试器的多个方面,可以由图6的仲裁器从该测试器的控制器提取该测试器;
图9示出了可以在图6中所示的分组单元中实现的相交测试结果处理流;
图10A和10B示出了分组包含过量光线标识符以供光线相交测试器资源使用的例子的多个方面;
图11示出了可在所公开的例子中使用的示例性相交测试器架构;
图12示出了用于描述可以在光线跟踪架构中实现的其他方面的加速结构;
图13示出了在分组单元可检测的不同条件下如何选择分组单元维持的集合以进行测试的多个方面;
图14示出了与描影器或相交的对象收集相交光线有关的多个方面的细节,该描影器或相交的对象是可在光线跟踪架构中实现的部件;
图15示出了与基于相交对象和更具颗粒感的描影代码部件来收集光线并对其进行描影的数据流方面;以及
图16示出了在实现针对前面的图公开的光线跟踪的多个方面时可以使用的系统的部件。
具体实施方式
给出以下说明以使得本领域普通技术人员能够制造和使用本发明的各个方面。仅作为例子而给出具体技术、实现和应用的说明。对此处描述的例子的各种修改对于本领域技术人员而言是显而易见的,并且在不脱离本发明的范围的情况下,此处定义的一般原理可以适用于其他的例子和应用。
为了描述清楚起见,例如基元(如三角形的三个顶点的坐标)之类的特定类型对象的数据通常被简单地描述为该对象本身,而不是指代该对象的数据。例如,当指代“光线”时,应理解为表示指代该光线的数据,以及场景中的光线概念。
图1例示了简化的场景布置,在该场景布置中,二维平面175设置在摄像机105与场景150之间,该场景布置包括对象110、115以及灯120。摄像机光线130从光线105发出(其使用描述摄像机特性的程序代码)。通过相交测试确定光线130与对象110相交。光线131从与对象110相关联的测试(例如,描述对象或表面的特性的程序代码和数据)发出。例如,对象110可以具有镜像表面,因而其测试将以光线130在对象110上的入射角生成要进行测试反射的光线131。然后,确定光线131射到对象115上。为了简化起见,与对象115相关联的测试示出为具有与对象110的测试的特性相似的特性,发出光线132以测试光是否以在光线131的路径上传播的角度入射到对象115上。光线132被确定为与光120相交。
图1的例子根据需要而进行了粗略的简化。对更实际的光线跟踪场景增加了计算开销的许多因素包括:要再现的二维表示的分辨率可能非常高,例如是1920x1080像素(超过二百万个像素)的全高清(fullHD)分辨率。该场景的各个像素可以具有从与之相关联的摄像机发出的许多光线。因此,这种场景的再现可能涉及:初始地单独对数百万摄像机光线进行测试,然后对从基于与摄像机光线的对象相交而标识出的描影器发出的更多数量的光线进行测试,进而对描影器发出的光线进行测试。
描影器可能涉及大量计算并发出对多种条件进行测试的其他光线。例如,描影器能够执行诸如蒙特卡洛漫射发光的漫射发光测试(diffuse lighting test),其涉及发出用于对环境发光状况进行测试的多条光线。描影器可以发出光线来测试对于场景中已有的光源而言相交点是否被另一对象遮蔽。描影器还能够模拟复杂的材料特性,如皮肤的亚表面散射、反射、折射等。这些功能中的每一个可能涉及发出需要在场景中进行相交测试的光线。因此,复杂场景的全高清高分辨率二维表示可能涉及对数百万或更多的光线进行相交测试。
因此,为了此处的目的,该例子示出了在场景中对光线进行相交测试。如果发现与对象(例如,基元)相交,则可以识别并执行与该对象相关联的描影器。该描影器进而可以发出更多光线进行相交测试。描影器发出的光线的数量和类型通常既取决于相交光线的特性,又取决于描影器实现的效果。
虽然有如此多的光线需要进行相交测试,但不能同时对所有的光线进行相交测试。此外,当考虑再现从开始进行到结束的场景时,在任意给定的时间,由于场景再现本身决定了要对何种光线进行测试,因此,并非要进行跟踪以完成该再现的所有光线都已经被定义。
图2例示了利用光线跟踪技术再现场景时使用的示例性系统200。系统200包括主存储器205,该主存储器205中存储有用于相交描影(intersection shading)(例如描影器码、纹理、过程几何等)的数据206、原始和加速形状元素(例如三角形、三角带、顶点、包围球面(bounding sphere)、轴对准包围盒或k-d树定义等等)以及定义了场景中当前进行相交测试的光线的原本(master copy)数据208。主存储器205与相交处理资源202通信,在相交处理资源202中能够运行所识别出的光线/基元相交的描影器。所示的存储器205与相交处理资源202之间的通信包括用于从存储器205提供相交明暗处理数据206的链路221和用于从存储器205提供基元数据的链路222。
相交处理资源202操作为对相交测试资源210识别出的相交进行描影。相交测试资源210被指令借助于控制器203对光线进行测试。控制器203经由链路225向相交测试资源210提供待测试光线的指示;优选地,控制器203通过提供标识符而指示待测试光线,该标识符可以与存储有对驻留在高速缓存211中的光线进行定义的数据的存储器位置相关。在该优选情形中,从光线定义高速缓存211经由链路228获得/接收待测试光线的定义数据。当前最接近的检测到的基元相交的中间测试结果可以与光线定义数据一起存储在高速缓存211中(即,在一些实现中,光学可能与基元相交,但如果没有按照光线经过该场景的顺序对这些光线进行测试,则在检测到真实的、最接近的相交(其通常是感兴趣的唯一相交)之前,能够检测到较远的相交)。经由链路224向控制器203指示最接近的可能检测到的相交(如果存在的话)(例如,如果光线不与可以通过链路224或者不可以通过链路指示该光线的任何场景对象相交)。相交测试资源210通过链路220从存储器205接收原始和加速形状数据。
控制器203设置为在相交处理资源202中处理这些可能的最接近的所指示的相交。控制器203接收对由在资源202上执行的描影器创建的要进行相交测试的光线进行定义的数据。在图2中,链路226被示出为接收这种新光线数据,而链路227被示出为提供用于例示对已从链路224提供的特定相交进行描影的信息。链路227可以包括:提供或取得(fetch)代码和定义了描影器的数据,或者指示相交处理资源从存储器205执行这种取得操作。
控制器203还对存储在存储器205中的原本光线定义数据208进行管理,并且还经由链路223在存储器205中存储定义了新光线的数据。存储在存储器205中并对已完成相交测试的光线进行定义的数据由对描影器例示的新光线进行定义的数据代替。
相交测试资源210和相交处理资源202可以在处理平台201上实现,并且可以包括在多线程处理器上执行的线程,或者包括在多核处理器的独立核上执行的线程,或者包括在物理上独立的处理器(各处理器潜在地具有多核)。各线程可以执行来自于从存储器205或从另一个源获得的计算机可执行代码的指令。类似地,存储器205可以实现为可由处理器201通过存储器控制器(未单独例示)访问的动态RAM。可以在多种层级实现高速缓存211,例如由多核处理器中的一个或更多个核拥有的私有或半私有L1高速缓存,以及可以在多个核和/或多个处理器之间共享的L1高速缓存和L3高速缓存。优选地,存储在高速缓存211中的光线定义数据受到保护而不被正常的高速缓存管理算法(例如最近最少使用算法等)盖写。而是,优选地,控制器203对存储在高速缓存211中的光线定义数据进行管理,作为原本光线定义数据208的子集。可以经由链路229从原本数据208更新存储在高速缓存211中的这种光线定义数据。
可以基于高速缓存211、存储器205、相交测试资源210和相交处理资源210的实现来实现所例示的链路220-229。
通常,相交测试资源210执行更固定功能类型的计算,因为其针对形状(通常是原始形状或加速形状元素)对光线进行相交测试,该形状包围了对场景进行定义的基元的所选择的一部分。作为对比,在(相交处理资源202上进行)描影其间要执行的计算类型更为通用,这是因为描影器可以执行多种计算、访问,操控并创建多种数据等。因此,在一些情况下,相交测试资源210可以有利地实现为具有更固定功能的处理,而常常可以在更通用的计算平台上有利地实现资源202。因此,在一些情况下,可以提供相交测试资源210作为具有固定功能的或者能够被编程使得在场景再现其间该编程不经常改变的加速功能、附加卡、协同处理器等。
根据本公开的实现不一定具有示例性系统200中示出的所有特征。例如,在系统200中,通过向相交测试资源210提供与定义了光线的数据分离的光线标识符而指示要进行相交测试的光线,这是可选的。在另外的例子中,取决于具体的实现,并不一定必须或期望实现所例示的多种链路中的所有这些链路。而是,图2示出了能够提供用于进行相交测试的计算资源的系统,因此,这些计算资源生成了检测到的相交的指示。这些相交测试资源能够与对检测到的相交执行描影器的计算资源同时工作。描影器发出用于相交测试的新光线,这些新光线被相交测试资源用于进行测试。
图3包括具有多个测试单元310a-310n以及340a-340n的相交测试资源210的一个例子的框图。加速结构元素被示出为来自于存储部207。加速结构的元件可以由包含在存储器中的定义数据来定义,该存储器还包含定义了场景的基元的数据。
ITU303还包括集合管理逻辑303和集合缓存器361。集合缓存器361和光线数据211可以存储在(例如)能够从存储器139接收光线数据的存储器340中。集合缓存器361维持与GAD元素相关联的光线参考(ray reference)。集合管理逻辑303基于来自测试单元的相交信息而维持这些集合。集合管理逻辑303还发起从存储器207取得用于光线集合测试的基元和GAD元素。
ITU303返回所识别出的相交的指示,该指示可以缓存在输出缓存器375中以经由结果接口225最终提供给相交处理资源202。该指示可以包括足以在给定准确度内识别出光线以及被确定为该光线所相交的形状(例如基元)的信息。该准确度可以包括找到了包围一个或更多个基元的给定包围元素与一个或更多个光线相交,但各基元最终尚未执行与这些光线的相交测试。
ITU303可以视为可通过控制过程或驱动器来调用的功能或工具,该控制过程或驱动为ITU303提供光线和要执行与该光线的相交测试的几何形状。例如,可以通过驱动器向ITU303馈送信息,该驱动器一方面可以视为将ITU303与其他再现进程(例如描影)以及初始光线生成功能进行接口连接的进程。从ITU303的角度来看,ITU303不需要知晓提供给它的信息的来源,因为其能够使用提供给它的或者它基于提供给它的其他信息而获得的光线、GAD和基元(或者更普遍的,场景对象)执行相交测试。
如上所述,ITU303可以控制如何向它提供数据、何时向它提供数据以及向它提供何种数据,使得ITU303不是被动的,而是例如可以根据进行相交测试的需要而去的光线或几何数据、或者加速数据。例如,可以与足以识别出其中要对光线进行测试的场景的信息一起向ITU303提供要进行相交测试的大量光线。例如,在给定时间可以向ITU303提供多于一万(10000)个光线进行相交测试,并且当对这些光线的测试结束时,可以提供(由相交处理资源202提供的)新的光线以使得在ITU303中正在处理的光线数量大约保持在初始数量,如下所述。随后,在(光线集合缓存器361(参见图3)中的)处理期间,ITU303可以(在逻辑303中)控制光线的临时存储,并且还可以在该处理期间根据需要发起取得GAD的基元和元素。
如上所述,与光线相比,GAD元素和基元在ITU303中是瞬变的,因为光线标识符维持在缓存器361中并针对GAD元素进行组织,并且还维持定义了光线的数据(光线数据211)以供测试单元310a-310n以及340a-340n使用。在存储器340中可以维持各个缓存器361和光线数据211,该存储器340可以用多种方式物理地实现,例如一组或更多组SRAM高速缓存。
如上所述,逻辑303对存储在存储器340中的光线集合的状态进行跟踪,并确定那些集合准备好进行处理。如图3所示,逻辑303以可通信方式耦合至存储器340,并且能够发起将带测试光线传递至各个所连接的测试单元。
在特定GAD元素可以包围其他GAD元素和基元二者的情况下,ITU303可以具有用于将其他GAD元素和基元二者提供给各测试单元的数据通道,使得逻辑303能够在测试资源中设置测试光线集合。在这种示例中,由于在GAD元素与基元之间(例如,球形相对于三角形)通常存在形状差异,因此可以从逻辑303提供用于切换测试逻辑或者加载针对测试形状而优化的相交测试算法的指示。
逻辑303可以直接地或者间接地导致向测试单元310a-310n和测试单元340a-340n提供信息。在直接提供的情况下,逻辑303可以向各测试单元提供信息,使得各测试单元可以发起从存储器340取得用于测试的光线数据。虽然逻辑303被例示为与存储器340分离,但出于描述简化的目的,由于逻辑303执行的管理功能大多与存储在存储器340中的数据有关,因此逻辑303可以实现在存储器340的电路内。
此处描述的一些方面的一个优点是能够提高相交测试资源对存储器340的并行访问。由此,增加对存储器340的访问端口数量(优选的是,增加至每测试单元至少一个访问端口)是有利的。下面进一步说明了与这种并行化有关的示例性组织方式。
此外,ITU303能够与为其提供输入数据或从其接收输出的单元异步地工作。这里,“异步”可以包括在针对先前接收的光线继续进行相交测试期间ITU可以接收另外的光线并开始进行相交测试。此外,“异步”可以包括不需要按照ITU303对光线的接收顺序来完成对这些光线的相交测试。异步还可以包括ITU303中的相交测试资源可用于在不针对光线在三维场景中的位置或者叠置于该场景上的调度网格的情况下指派或调度相交测试,或者仅测试具有两代间关系的光线,例如父光线和产生于少量父光线的子光线,或者特定代光线(例如摄像机光线或辅助光线)。
输出缓存器375可以接收所识别出的基元与该基元可能相交的光线的相交的指示。在一个例子中,该指示包括对基元以及与该基元成对的足以识别出该基元所相交的光线的信息的指示。光线的指示信息可以包括对光线列表中的特定光线进行标识的引用(例如索引)。例如,运行在主机上的驱动器可以维持该列表,或者在存储器205中维持该列表。优选的是,存储器205还可以包括存储器340中的所有光线的光线定义数据。然而,该光线识别信息还可以包括在存储器205不包含这种信息的情况下足以重新构建光线的信息(例如光线的来源和方向)。
图4示出了此处能够对系统进行设计和组织的示例性架构的多个方面。示出的架构包括多个相交测试资源(“相交测试器”)405a-405n,各相交测试资源与相应的高速缓存465a-465n耦合,在高速缓存465a-465n中分别存储有光线定义数据466a-466n。相交测试器405a-405n通过数据线460接收要进行相交测试的场景对象,可以通过集合管理器475发起的存储器访问来馈送场景对象。在存储器(例如队列或缓存器)440中可以存储形状以供相交测试器405a-405n使用。
因此,相交测试器405a-405n在本地访问相应存储器中的光线定义数据,并被指示通过从相应的输入缓存器421a-421n接收光线标识符来获得和使用部分这种光线定义数据。可以在实现了决策点413-415的分配逻辑480中提供输入缓存器421a-421n,或者由实现了决策点413-415的分配逻辑480为输入缓存器421a-421n提供服务,在决策点413-415中做出与是否应当向输入缓存器421a-421n中的任意一个添加从集合管理475提供的光线标识符有关的决策。
各个相交测试器405a-405n生成能够提供给集合管理475的结果(如通过结果通道450a-450n所示)。在一些例子中,当这些结果用于光线与加速结构的元素(即,GAD元素)之间的相交时,由集合管理处理这些结果,而如果这些结果用于基元与光线之间的相交时,则可以由集合管理475输出或者转发这些结果。集合管理475维持光线ID与包围接下来将要测试的对象(在相交测试器405a-405n可访问的缓存器440中为该对象提供数据)的相应GAD元素之间的关联。
在一些例子中,缓存器440被集合管理475从主存储器(例如存储器205)发起的DMA事务(transaction)填充。例如,在分级加速结构(hierarchical acceleration structure)的情况下,可以使缓存器440存储作为父加速元素的孩子的形状,针对该父加速元素已经累积了光线集合。当给定集合的光线在高速缓存466a-466n中相等地分配时,实现了最高吞吐量。
当一个高速缓存中存在给定集合的多个光线时,其他的相交测试器可以延后(stall),或者这些相交测试器可以测试下一集合的光线。需要注意的其他方面是,在任意一个队列421a,421b,421c(如集合447所示)中可以存储给定光线集合的多于一个光线ID。在这样的情况下,该队列的ITR可以对这些光线进行测试,并且当结果可用时输出这些结果用于第二次测试(或者另外用于许多后续测试)。
当在相交测试器(例如相交测试器405b)之一中测试了给定集合的多个光线的情况下,该集合的其余结果可以等待一个集合的所有结果汇合起来(assemble),或者当“掉队的”结果可用时对该“掉队的”结果进行传播,而由这些测试器执行其余的测试器。在一些实现中,如下所述,在要求再次进行集合测试同步之前,可以容纳(或设计)最大数量的无序测试。
总之,图4例示了使得与一个或更多个形状相关联的一组光线标识符能够分配到多个测试资源的队列中的系统组织形式,各队列存储有光线数据的子集。各测试资源取得由针对载入到测试资源的形状的各光线标识符而标识出的光线数据。优选的是,可以同时通过所有测试资源顺序的流传输这些形状。这些形状可以标识为从主存储器中的一个地址开始的孩子序列。因此,图4例示了通常针对多个层同时测试的形状的系统组织形式。
图5与其他功能一起示出了在图2-4所示的架构方面的另选透视图。图5的一个高级方面是,相交处理202可以通过提取层501与相交测试210通信。在一些情况下,在提取层501中,执行相交处理的描影器可以实例化要进行相交测试的新光线。可以由在执行描影器的处理资源的上下文中有意义的标识符来标识这些新光线。为了方便起见,这些标识符称为“软件标识符”或“SW标识符”。可以将这些SW标识符与待测试光线的定义数据一起提供给SW ID到HW ID映射器515,该SW ID到HW ID映射器515可以针对这些光线中的每一个生成相应的标识符,该标识符能够用于在对这些光线进行相交测试期间对光线进行标识。光线的SW标识符可以与光线定义数据一起存储,并且当要报告给定光线的相交结果时,可以与相交信息一起报告该光线的SW标识符。可以利用HW ID到SW ID映射器520针对特定HW标识符来标识SW标识符。在其他的例子中,SW ID可以与光线定义数据一起存储在RAM211中,并且在其他例子中,HW ID可以是SWID的比特子集,或者可以基于SW ID的算法变换。
然而,在与图4类似的根据架构的系统的上下文中,优选的是,HW光线ID是可选择的,使得相交测试资源能够灵活地确定将特定光线的光线定义数据存储在何处。可以利用该确定操作在存储光线定义数据的不同存储器之间实现负载均衡。根据本例的独立光线标识符策略使得能够针对不同的目的适当地改变光线标识符的大小。例如,可以维持主光线存储器,并在相交测试210中主动地完成对这些光线的子集的相交测试。因此,主存储器中的光线数量可能比正在主动测试的光线数量大许多倍,从而使得标识符能够更长时间地在主存储器中唯一地标识各光线。
该光线标识符方法还提供了一种示例性架构选择,其接受用于存储给定数量光线的更大的总存储器占用(footprint),以获得如下的有益效果,即用于对给定光线分别进行相交测试的总数据移动相对较小。
再参照图5,可以向相交处理(例如描影)和相交测试(即加速结构遍历(traversal)和/或原始相交测试)二者提供几何和加速形状数据207。
从相交测试210返回到相交处理202的结果可以包括对检测到的光线与一个或更多个基元及加速元素的相交的指示。在一些实现中,可以在相交测试的输出(例如输出缓存器375)处收集或缓存光线。缓存可以按多种方式实现,并且可以包括基于多种公共属性对光线进行排序。如前所述,光线可以收集在基于加速元素的集合中,并且还公开了可以使加速元素包围特定的场景对象。在一些例子中,随后可以基于场景对象来收集光线。在一些实现中,该收集策略还使得能够针对公共的描影器来执行光线的收集。
如针对输出缓存器375所示,光线缓存可以实现为使得能够针对公共描影代码执行光线收集。此外,通过在输出缓存器375中收集光线可以在本地(in locality)增加要使用的数据元素,使得顶点属性数据511、纹理数据512和/或均一性数据513可用于给定对象在紧凑的时间帧中对一些光线进行描影。在一些方面中,在收集了与使用这些种类数据的对象相交的光线之后,可以在高速缓存514中载入这样的数据。例如,可以取得更大集合的顶点属性并存储在高速缓存514中用于与一些光线相交的对象。
图6示出了相交测试器(例如,相交测试210)的实现的其他方面。如针对图4所示,可以提供多个相交测试器405a-405n。各测试器可以与相应的缓存器421a-421n接口连接。这些缓存器可以包含光线标识符以及与这些光线标识符所标识的光线的相交测试的对象有关的信息。可以从就绪分组列表(ready packet list)612提供光线标识符,(经由控制631)从分组单元608控制就绪分组列表612。就绪分组列表612可以包含要针对该分组中(由索引或由所包括的数据)标识出的一个或更多个形状进行相交测试的光线标识符的列表。提取点620从就绪分组列表612接收这种分组,并基于哪个本地存储器231a-231n包含各个所标识出的光线的定义数据,在缓存器421a-421n之间分派(split)光线标识符。在一些实现中,提取点620可以基于光线标识符与本地存储器231a-231n中的存储器地址位置的相关性(例如通过掩蔽各光线标识符的特定比特以利用该特定光线的光线定义数据标识出相交测试器)来分派数据(当然,多于一个本地存储器可以存储给定光线的数据)。分组可以引用要进行相交测试的加速数据的元素或基元,通常,首先在分组中引用光线以针对加速元素进行测试,并且最终标识出基元以进行测试。
分组单元608使用系统接口616传送过另一个提取点605,以接收要进行分组和相交测试的其他光线。分组单元608还可以与DRAM681接口连接,以基于与分组一起包含在就绪列表612中的引用来调度存储器事务,将形状数据传递到相交测试器。
分组单元608在相对于加速结构中的形状维持光线标识符的集合时可以使用集合存储器606,并且在一些情况下,集合存储器606可以被细分为用于存储给定数量光线标识符的固定大小的位置。在集合存储器606可以具有已知大小或可显现(discoverable)大小或可配置大小的情况下,可以容纳并引用已知数量的集合。因此,可以在自由位置列表610中维持对各个这种位置的引用。当从结果列表614中读取结果时,分组单元608将这些结果处理为与所相交的各加速结构元素相关联的集合。这种处理可以包括从返回分组检索得到各个加速元素的标识符,或者由一个或更多个相交测试器405a-405n提供的其他信息。在一些实现中,相交测试器405a-405n可以传送分组以收集给定加速元素的光线相交结果,在其他例子中,各相交测试器可以聚合许多加速元素与一个光线的测试结果,或者一个光线与许多加速元素的测试结果。
因此,相交测试结果经过提取点620传播到结果列表614,而在缓存器421a-421n之间分配在就绪分组列表612中标识出的其他集合的光线。各相交测试器405a-405n可以操作为当能够对另一光线进行相交测试时从其缓存器进行读取。在一些例子中,各缓存器的各条目(entry)可以利用标识出的形状来标识要进行相交测试的光线。如参照图4所公开的,可以从DRAM提供形状数据,并且可以由分组单元608发起提供这种数据。
图7示出了可以存储在就绪分组列表612中的分组705的示例性格式,并且其组成包括分组ID、位置、多个光线标识符、以及形状标识符。优选的是,形状标识符标识出被确定为与分组705的各光线相交的形状,随后,针对标识出与相交的形状(例如加速数据层级的孩子节点)有关的对象,对各标识出的光线进行测试。
当确定分组705开始进行相交测试时,可以针对基于标识出的形状而标识出的各个对象形成单独的分组,并且可以将每个这样的分组提供给各个缓存器421a-421n。在其他例子中,可以将定义了待测试对象的数据提供给相交测试器405a-405n,可以借助于分组中提供的标识符将这些对象中的每一个表示为需要进行测试(例如,标识符中的一些比特可以保持不变,使得只要特定数量的比特(例如有效位)匹配,则可以将给定对象标识为另一对象的孩子)。
已经参照图6和其他图描述了,分组单元608或其他实体管理集合数据能够在确定利用形状数据测试标识出的一组光线时发起向测试器提供该形状数据。图8例示了由相交测试器405a-405n示例性构成,其中,工作存储器810能够操作用于接收并存储这种形状数据。工作存储器810可以高速缓存这种形状数据用于例如当给定分组标识出了两个或更多个光线(该两个或更多个光线在存储器中被存储为用于一个测试器的光线定义数据)时,利用不同的光线重复地进行测试(参见以上针对图4的讨论)。
如下所述,在实现与利用光线标识符触发在分散的相交测试器中进行光线测试有关的其他方面时,可以使用这种形状数据的存储。
图8例示了测试单元405a的一个例子,该测试单元405a可以包括工作存储器810和测试逻辑820。工作存储器810可以是若干个寄存器,该若干个寄存器包含足以对线段进行与表面的相交测试的信息,或者在其他的实现中工作存储器810可以更复杂。例如,工作存储器810可以存储用于将测试逻辑820配置为对接收的特定形状进行相交测试的指令,并且可以基于接收的数据来检测接收到何种数据。工作存储器810还可以高速缓存检测到的照射(hit),其中,各测试单元被配置为针对几何形状测试光线序列,或者相反;随后,被高速缓存的照射可以作为一个组而输出,如下进一步的说明。例如在根据针对图10A至10B给出的例子的实现中,工作存储器还可以从例如主存储器(205)的存储部接收进入形状数据,并将其存储以供使用。
然而,首先针对图9说明与如何能够对结果进行处理有关的进一步解释。图9示出了包括分组标识符、光线标识符(Rid)和一个或更多个形状命中比特(shape hit bit)的分组格式901。分组格式902示出了分组ID、加速树位置指示符(位置)、光线标识符(rid)和多个形状标识符以及各光线标识符的相应命中/不中信息的指示。
如果用于给出结果的分组格式是根据格式901,则可以实现可选的对与分组ID相关联的形状的查找(903)。例如,当确定开始测试就绪列表612中的分组时,可以使用该分组中指示的形状来标识多个相关(例如孩子)的形状,并且当标识出这些相关的形状时,可以由分组单元608或者由另一个功能单元保留这些相关形状的标识信息。然后,当以类似于分组格式901的格式返回结果时,可以对该仓库进行索引以标识出相关形状。
另选的是,如果例如通过类似于格式902的格式明确的地标识出了这些形状,则可以略过查找操作(903)。在这两种情况中的任意一种情况下,获得了多个形状标识符(905)。各形状标识符可以进行散列操作(hashed)(910),并且可以使用来自散列值的一些比特来索引集合存储器606以标识出与该形状ID相关联的光线集合的多个候选位置。例如,可以将集合存储器606实现为多路交织高速缓存,因此,索引操作能够为与给定散列值相关联的集合提供多个候选位置。然后,可以将形状ID整体与存储在各候选位置的形状ID进行比较以确定该位置是否存储了该形状ID的集合。如果存在匹配的形状ID,则确定该集合是否有空位(free slot),并且如果有空位,则将分组的ridID添加至该位置。本例是针对具有固定大小的集合(其是优选实现),但也可以可变地改变集合的大小。
如果不存在空位,则回收(evict)集合中被标识为匹配位置之一的一个集合,并且在刚刚驱赶出且现在空余的位置处创建形状ID的集合。
如果不匹配(918),则确定候选位置中的任意一个是否为开放的(923),并且如果候选位置中的任意一个是开放的,则集合在该位置开始(924)。如果不存在空余位置,则回收一个集合(922),并且在该位置开始该新形状ID的集合。因此,在一些示例性方面中,可以基于散列存储器606的标识符的散列值按固定大小的块(chunk)来管理集合存储器606,在该固定大小的块中,集合可以存储在可用集合位置的子集中。可以实现回收策略以确保形状将能够具有针对该形状收集的光线。该回收操作的结果是集合标识信息被置于就绪列表612中。
在一些实现中,可以将回收策略定制为用于实现在场景中对跟踪/遍历光线时可能相关的多个目的。例如,可以实现可采用一个或更多个不同集合选择策略(926)的过载(override)模式925。以下提供了这种策略的例子。过载模式可以使用特定次数,或者响应于特定条件使用过载模式。在其他例子中,不一定明确地决定要改变集合选择模式,而是可以采用一组集合试探法,该组集合试探法包括要在过载模式和正常模式下实现的目的。图10A、10B和图11的多个方面与集合选择策略有关,因此首先对此加以说明。
图10A示出了分组流动格式,期中,时隙T1...T5可用。本例中的新光线分组1001在各时隙中可以标识出多达40个光线,而相交测试资源可以在各时隙中测试多达32个光线,如光线测试1005所示。图10A示出了在时隙T1-T4中提供一系列完整的完全分组1002-1005进行测试的情形。由于该完整的完全分组包含40个光线,因此对4个由40个光线组成的分组进行相交测试要求5个时隙。因此,在时隙5中,没有新光线开始相交测试。
在相交测试的输出具有更深缓存器(例如缓存器421a-421n)的情况下,在相交测试必须开始跟上光线分组接收之前能够接收更多的光线分组。然而,在其他实现中,在使相交测试资源保持饱和的同时,希望光线标识符发送能力相对于光线相交测试容量多余的部分主要用于实现非完全集合的发送。在维持饱和的同时进行非完全集合的发送使得能够实现在相交测试进行期间可以动态改变集合选择/回收策略。
要注意的是,图10A是从提取点620的角度示出的,使得通过提取点620提供分组,但分组单元608不能看到哪些光线是否测试过或者给定集合的各光线分配给了哪个相交测试器。
在图10B中示出了这样的例子,其中示出了同样的5个时隙。在T1中,发送一个40光线分组,并对32个光线进行测试而其余8个光线未测试。图10B进一步例示了可以在T2时隙中接收23光线分组,而对32个光线进行测试。因此,在可测试的40个光线中,可以测试32个而其余8个未测试。在T3中,接收24光线分组,使得32个光线可用于测试,可以在T3中测试所有这些光线。在T4和T5中,接收40光线分组,而在各时隙中测试32个光线,使得可以留下16个光线用于在后续时隙中进行测试。实际上,缓存可以比此处描述的更深,使得即使接收了一些大部分为空的分组,各测试单元的缓存器(例如参见图6)也具有足够的光线标识符进行测试。
图11示出了相交测试器820(图8)的进一步的示例性细节。在所示例子中,相交测试器820可以包括多个测试器1102a-1102n,每个测试器访问工作存储器810,该工作存储器810存储有定义了多个形状825、826和833的数据。这些形状存储在工作存储器810中作为分组单元608发起的存储器取数据的结果。缓存器421a存储已从通过提取点620分配的多个分组接收的光线标识符。图11进一步示出了由这种光线标识符的选定部分标识出的光线从光线定义数据存储部231a载入各测试器1102a-1102n。如所示,不同测试器1102a-1102n可以针对不同形状测试不同分组的光线。
在一些情况下,各测试器1102a-1102n可以实现为在计算单元上执行的线程。虽然各测试器1102a-1102n可以针对不同形状测试不同光线,但任意测试器1102a-1102n中可以测试的形状和光线优选地基于给定相交测试器(例如405a-405n)是否能够本地访问特定光线的定义数据。此外,由于特定光线通过集合与要进行相交测试的对象相关联,因此可用的光线标识符和形状最终均由分组单元608确定。作为对比,在独立调度的工作上自由执行的一些计算单元将以更随机的方式和更低的效率访问主存储器。
如上所述,根据图4或图6的例子的架构使得能够异步地控制何时提出要进行相交测试的光线,使得实质上增大测试光线所针对的对象数据的本地性(10cality),在分组经常可以被填充的相交测试中可能存在这种情况,因为这些示例性架构提供了相交测试光线的延迟(deferral),并且在这些情况下,对象数据经常从主存储器进行流传输,因为可以针对大量对象来测试大量光线。然而,有时希望能够对不完全分组的测试进行调度。
例如,相交测试器可以设计为适应给定大小的集合存储部,这隐含的意思是,例如可以在给定时间存储最大或近似最大的集合,或者可以在更快的存储器中维持最大数量的活动集合。如所述,可以针对加速结构(例如层级结构)的元素来收集光线。在一些实现中,在这种结构中的任意点,可能存在相对高的扇出(fan out)。例如,该结构中的给定节点可以具有接下来要进行相交测试的8、10、16、24或者甚至32个子节点。进而,这些节点的每一个可以具有其自己的子节点。虽然通常希望使光线分散在许多不同的集合中,以增大光线分集(ray diversity)并标识出可以针对公共对象(例如加速元素)测试的更多光线,但这种分散还可能导致创建了要对每一个进行跟踪的过多的集合。
更具体地并参照图12,可以假设针对根节点的孩子(标识为节点1.0-1.n)对许多光线进行相交测试,其中节点1.2被示出为通过边1202连接至根节点,类似地,边1203将节点1.n连接至根节点。图12还示出了加速结构可以是非均质的(heterogeneous),使得直接包围基元的元素可以是其他元素(例如元素1244)的兄弟姐妹。离根节点越近,经常的情况是节点扇出越广泛,如所示,节点1.0具有子节点p.1-p.n,而节点1.n具有子节点q.1-q.n(可以存在许多中间连接节点)。最终,离包围基元的节点越近,加速结构1200越窄。
在本例中,提供了对象节点1210,该对象节点1210包围定义了与不同场景对象相关联的各网格的基元(例如,节点r.1可以包围与一个对象相关联的基元,而节点r.2可以包围与不同对象相关联的基元)。进而,另外地加速元素可以包围给定对象的基元的子集(例如节点r.1的叶1),直到最终到达直接包围这种基元的叶节点(例如叶节点1-T)。
在这种加速结构中,可能希望控制对哪个集合进行相交测试以控制需要形成为这种测试的结果的多个新集合(所述部件集合增长无效)。在一个例子中,可以通过选择离叶节点更近的集合(即使这些集合比离根节点更近的集合更不完全)进行测试来实现这种控制。已经说明了一些分组格式可以包含与在加速结构中对象所关联的内容所在位置有关的信息在一些情况下,该信息可以是根据该集合中累积的光线确定的反弹计数(bounce count)。在其他例子中,该信息可以包括对象标识符信息,其中可以对对象标识符进行计数,使得该数字在加速结构内有意义。然后,可以使用这些数据确定加速结构中的位置,并因此而确定与之相关联的集合是否具有更接近测试完成的光线。
因此,通过选择接近完成的测试集合,相交测试单元能够控制在对树进行遍历期间的扇出度(degree of fan out),并促进集合空间在存储器中的填充(completion)和释放。由于分组可以过度供应相交测试单元,因此在相交测试仍然完全饱和时也可以选择非完全分组(less-than-full packets)。
图13示出了用于实现这种光线跟踪方法的方面的多个方面。图13示出了相交指示处理1302与集合就绪处理1303通信。相交指示处理1302对返回的光线和加速元素的相交的指示进行处理,并且例如可以在分组单元608中实现相交指示处理1302。参照图9也说明了这种处理的示例性方面,并且这种处理的示例性方面包括,在光线标识符的集合之间分配被指示为与加速元素相交的光线。集合就绪处理1303包括,例如通过逐一地和/或聚合地收集与存储器使用有关的统计信息和/或集合的完全度(fullness),可以监视(1304)集合的状态。可以做出与集合存储器是否受到约束(1305)有关的决策,并且如果在未确定约束条件的情况下,可以主要基于集合完全度来测试集合选择1306(虽然并不要求只能仅基于此做出这样的决策)。在检测到约束条件的情况下,还可以基于哪些集合更接近遍历完成来实现集合,在一些例子中包括,集合更接近叶节点,或者更接近感兴趣的加速结构中的另一位置。
随后,任意这样标识出或选择的集合可以被回收或者标记为测试就绪,并且在图8的例子中,可以存储在就绪列表812中。
图14示出了包括光线遍历、光线排序和描影准备的方法的一个方面。图14示出了可以通过加速结构(例如图12的加速结构)来遍历光线。图14还示出了,在一个实现中可以通过可被认为是完成了遍历的包围单元(例如叶节点)对集合的光线进行相交测试。这种元素可以是叶节点,或者可以是加速结构中的另一节点(例如,包围与对象相关联的基元的节点)。在这两种情况的任一情况下,可以基于当前可能最接近的检测到的该光线的相交以及包含该可能的最接近的检测到的相交的对象,对光线进行排序。
应注意的是,由于本说明书包括在最终原始相交测试之前停止遍历的方法,因此尽可能指示出该最接近的相交,因为可能的情形是,光线最终可能错过与加速元素包围的基元相交(即使该光线与该元素相交)。
在1406中,可以确定排序准则。在一个例子中,这种排序准则包括使用语各基元相关联的标识符。在另一个例子中,这种排序准则可以包括,在对相交进行描影时使用和/或执行公共描影器或描影器代码模块的一部分,更一般地,使用和/或执行待访问的公共数据和/或代码。随后,在对相交进行排序时,可以使用该排序准则。还可以采用利用光线标识符来查找光线相交的基元(三角形标识符(TriangleIDentifier,TID))的功能1432,使得可以为光线标识符提供光线相交测试与排序逻辑之间的数据通道,并且可以根据需要提供存储器查找功能以获得所标识出的光线的相交信息。可以从光线定义数据存储部211中进行该查找,该光线定义数据存储部211可以分布在多个相交测试区(例如参见图6)。
在这两种情况的任一情况下,可以基于随后可用的相交(实际和/或可能的相交)在对象关联的缓存器中对相交(或可能的相交)进行排序(1407),可以由排序器实现该排序。缓存器1408、1410和1412被示出为用于接收按对象排序后的相交信息的示例性缓存器,并且这种缓存器可以实现为FIFO、环形缓存器、链表等。其他的实现可以基于与特定代码段(例如描影器)的关联在缓存器中对光线进行排序。在一些实现中,可以使用上述光线跟踪延迟方面来实现在与特定描影器或特定对象相关联的缓存器中对光线进行排序(1407)。在一些情况下,可以为各基元赋予唯一编号,该唯一编号的某部分标识出该基元所属的场景对象,并且可以基于与光线相关联的基元标识符或者基于该编号的场景对象标识部在多种缓存器中队光线进行排序。
缓存器选择器1418可以控制从哪个缓存器得到用于执行描影操作的光线相交信息。缓存器选择器1418可以通过从缓存器1408、1410和1412中选择更完全或最完全缓存器而工作。在一些情况下,缓存器选择器1418可以选择具有其中收集了多于最少数量光线的任意缓存器(收集光线优选地是指收集光线标识符,但也可以包括在缓存器中收集光线的定义数据)。在一些例子中,可以为缓存器1408-1412存储光线标识符(而不是存储用来标识特定相交的所有数据,如原始标识符)的实现方式提供光线结果查找功能1430。
在一个例子中,光线可以由对象收集,并且例如可以在高速缓存1419中加载(1420)和存储与该对象相关联的描影器代码。描影器进一步可以加载(1422)从所选择的缓存器读取的数据中标识出的光线的定义数据。可以在存储器中对与来自所选择的缓存器的光线相关联的对象的顶点属性数据进行分页(1424)。此外,在执行所载入的对象的描影器代码期间,可以采集对光线相交进行描影有用的纹理数据和其他数据。在缓存器1408、1410、1412中维持的集合可以更大,并且在一些情况下,比针对加速结构的节点维持的集合大得多。例如,各缓存器可以存有256、512、1024、1096、2048个或者更多或更少的光线相交指示。
缓存方法可以包括,包含大小相对较小的缓存器段并根据需要将这些较小缓存器段链接成更大的缓存器。其他方法还可以包括,具有多个缓存器大小,并基于构成了要与该缓存器相关联的形状的基元的数量,选择缓存器大小。例如,与1M基元的形状相比,与250K个基元相关联的形状可以与较小的缓存器相关联。可以基于对场景及构成该场景的对象的分析来构造缓存器大小。例如,如果场景分布了许多较小的对象,则可以分配更多的较小缓存器;相反,如果在场景中较大对象比较少,则可以分配更少的较大缓存器。
虽然以上说明了缓存方法,但此处描述的光线排序和收集的多个方面不一定要求这样的缓存。例如,可以在相交测试后不进行中间的缓存就输出已执行了相交确定的多组光线信息。例如,在一些情况下,相交测试资源可以同时测试32、64或更多个光线与基元中所选择的可能涉及同一场景对象(或部分场景对象)的基元的相交。可以将所找到的在该同时测试中相交的任意光线输出为一组而不进行缓存(例如进行缓存以等待与同一对象相交的更多光线)。在其他实现中,可以利用缓存来聚合数百个甚至数千个光线以输出用于描影。
在一些情况下,系统实现可以包括软件或硬件实现的功能,该功能使得能够查找给定光线与何种三角形相交。对于提供这种功能的实现,缓存器不需要与光线或光线标识符一起存储三角形标识符,而是,可以在准备好对光线进行描影时使用光线标识符执行查找。
在上述方面中,优选的是,在使用部分分页顶点数据(和其他数据)对一些光线相交进行描影时,以相对较大的顶点属性片段进行分页并在高速缓存中维持该数据。
上图示出了根据本说明书的系统的方法和结构元素的功能元素。例如,可以借助于根据图2-5的例子的结构和系统来实现测试1404。
图15示出了如何基于对象相交信息或者基于所执行的描影器代码的一部分在更粗(granular)的水平对光线集合进行分组的其他例子。图15示出了相交处理资源202和高速缓存层级1515,该相交处理资源202可以包括多个执行核心(线程)1510a-1510n,而该高速缓存层级1515可以包括多个高速缓存存储器。在本例中,高速缓存层级1515可以包括位于芯片上和/或位于执行核心1510a-1510n所在模块中的多个高速缓存。可以离片(off-chip)地访问其他的存储器1517。相交处理资源202可以在执行核心1510a-1510n中执行描影器代码,并且在该特定例子中示出了作为同一描影器的不同实例的描影器实例1520a和1520b。描影器实例1521也被示出为不同描影器的描影器代码的实例。
调度器1507可以创建聚合点,为了有利于对其他光线集合的描影,在聚合点处可以收集光线以延迟其描影。集合点1522示出了描影调度器1507可以聚合光线以等待执行两个所示描影器实例1520a和1520b(示出了这种描影器代码的入口点)的逻辑图。因此,由于光线被延迟,这些光线被收集到与集合点1522相关联的集合中。当要对所收集的光线进行描影时,可以将在描影时有用的数据分页到高速缓存层级1515中(如参照图14所示)。
图15还示出了描影器可以包括多段代码,并且还可以分支到(branch)和调用其他代码模块。例如,代码1525被示出为在执行描影器实例1520a(而非描影器实例1520b)期间分支到描影器实例1520a的代码。模块1531和1532是诸如可以由描影器调用的漫射发光模块之类的模块的例子。可以由调度器1507来提供集合点,用于收集已经调用了这种模块的描影器实例的光线。例如,集合点1530代表了收集已经调用了模块1532的光线。
如所示,这种调用可以来自于不同描影器代码的实例(此处为实例1520b和实例1521)。一旦针对在集合点1530收集的光线执行了模块1532,描影器就在其正常描影路径上继续进行描影。例如,在完成了模块1532之后,从模块1532收集的光线可以返回执行代码1535,并调用模块1536。类似地,描影器1520a具有两个所采取的支路,在这两个支路中对一些光线执行模块1531,而对其他光线执行模块1532。集合点1530仅适用于模块1532,使得对于取模块1531支路的那些相交,执行代码1533,并最终会合于模块1537处的同一代码路径,对于取模块1532并在会合于1537之前执行代码1534的那些相交而言也是如此。图15仅示例性示出了在调度器1507处可以基于对所提供的模块的调用、基于对存储器中已加载了某些对象或对象的一部分的对象数据的定义区域的访问等,在描影器模块中提供多种集合点。在一个优选的方面中,可以在漫射发光计算的开始就手机光线相交处理,使得能够针对与同一对象的若干部分相交的一些光线继续进行漫射发光计算,并且在其他例子中,可以收集如下的光线,该光线与相同或不同对象的若干部分相交并且其描影器使用漫射发光调用。
以上例子解释了响应于对与基元的相交的检测来排序(一个例子)。除了基于检测到的相交进行排序,在未检测到相交的情况下,各光线还可以与要在其中进行排序的缺省存储仓(bin)或缓存器相关联。该指定存储器仓或缓存器可以是同样与一个或更多个基元或对象或特定代码模块相关联的存储器仓或缓存器,使得一些光线借助于其相应的缺省指派(assignment)而在该处结束,而其他光线由于检测到使得该光线在该处存储或缓存的相交而在该处结束。因此,虽然原型例子是基于检测到的相交进行排序/缓存/进仓,但多个例子也可以提供使得各个光线能够指定缺省指派的功能。API调用使得能够进行光线发射以接受该缺省指派。
这两个例子的方法的组合可以在一个系统中实现。这两个例子的方法的组合可以在一个系统中实现。在图16中示出了可以实现这些方面的系统的例子。
进一步总结如下,根据这些例子的系统能够更广泛地工作以将驱动相交测试间的资源分配到场景结构的其他区域中,并生成更多种类的光线,开始新的摄像机光线。最终,希望测试由所执行的描影器发出的所有光线,但执行顺序可能对再现期间的存储器的使用具有重要影响。
可以在多种计算资源中实现此处描述的任意功能、特征和其他逻辑。计算资源的例子包括线程、核心、处理器一组处理器、虚拟机、固定功能处理单元等。因此,描述了多种途径、方法的多个方面、处理部件等,这种计算功能可以提供用于实现这些功能的装置。此外,可以提供或实现在实现这些实施方式时可以使用的其他功能作为属于一个计算资源或分布在多个计算资源间的进程、线程或任务(例如分布在多个物理计算机资源间的多个线程)。
作为特定例子,用于相交测试的计算资源还可以具有其他进程,例如用于对检测到的相交进行描影的描影进程。作为其他例子,如果一个核心可以支持多线程,则一个进程可以专用于描影而另一个线程可以专用于相交处理。
如上所述,从所定义的优势点角度看来,所述例子可以用于将三维场景转换为其二维表示。该三维场景可以包括物理对象的数据表示。光线相交测试的其他结果可以包括可用于多种应用的对象可视性确定。其他变换包括通过存储根据所定义的方法确定的数据而将计算机可读介质转换为不同状态。
用于准备再现以及再现本身的上述工作流和方法的例子可以在系统1600中实现,该系统1600可以包括多个计算资源1604-1607。计算资源1604-1607可以包括多个处理核心、处理器中的任意一个或更多个,该多个处理核心、处理器中的每一个可以包括固定功能和/或可编程单元。计算资源1604-1607例如还可以包括多线程处理器上的多线程计算。每个计算资源1604-1607可以对与其计算资源集成或分离的相应L1高速缓存1625a-1625n进行读和写访问。可以提供多个L2高速缓存,例如L2高速缓存1630和L2高速缓存1635,并且可以在计算资源之间共享或自用该多个L2高速缓存。可以提供共享的L3高速缓存和/或主工作存储器1640。在该例子中,光线数据1610和形状数据1615可以存储在L3/主存储器1640中,该示例性系统1600可以在一个或更多个应用及场景构建器工作流(例如应用/构建器865)上执行。计算资源可以通过共享总线1601、或使用点对点连接、或通过L2高速缓存1630和1635或L3/主存储器1640中的共享存储器空间彼此通信。
在一个应用中,这些系统和方法可以用在对三维场景的表现的再现中,以供全息成像系统使用。在用于全息成像系统的一个示例性方法中,对给定场景的多个图像进行再现,每个图像来自于一个不同的立体图。在对这些图像进行再现时,每个立体图可以视为要进行相交测试的光线的一个来源。可以将各个立体图的光线收集在一起(而不管其来源,而是针对要执行的相交测试和/或描影的共性)进行相交测试,例如将不同来源的光线及其子孙收集在一起。允许从多个这种来源收集光线使得系统和方法能够一次性建立三维场景,使得这种场景建立分摊到大量的图像再现上。此外,将来自不同来源的待跟踪光线组合起来可以允许更大的相干性和总的处理器利用率。因此,在上面的例子中,在根据本公开形成、输出或处理了了光线集合的情况下,这些光线是来自于多个摄像机位置。例如,可以针对公共加速结构的父节点的子节点测试给定集合的光线。
这些公开内容的另一应用包括确定第一类型数据元素之间的映射,该第一类型数据元素可以在对第二类型数据元素执行计算机实现的进程期间定义,该第二类型数据元素包括可以使用在执行该进程期间在第一类型元素中提供的信息的代码模块。换言之,由于在对多个离散的潜在代码模块的多个离散的潜在输入之间,一个应用包括基于该潜在输入的特性和代码模块的特性来确定哪个代码模块接收哪个输入。在这样的应用中,代码模块可以生成要再次执行确定的其他的潜在输入。因此,在一些这样的应用中,在执行应用本身期间发展或演变出待处理的完整数据集。
通过对比,一些种类的进程可以具有这些进程开始之前指定要采取的全部可能的动作;例如,可以指定如下的代码模块,在执行使用该代码模块的程序或处理之前,接受在该代码模块中用作输入的数据元素的代码模块。然而,在该情况下,在启动该进程之前,甚至在执行该进程期间的任意给定点,要采取哪些动作(或在一个更具体的例子中,要执行的代码模块)以及在何种情况下采取那些动作可能是不确定的。从而,在进程执行的迭代期间,确定这些信息。这样,在一些例子中,在进程开始时,在执行该进程期间使用的全部数据集可以是不确定的。此外,该进程的哪些代码模块(或功能模块)将使用数据集的哪些部分可能是不确定的。在编译时难以对这些进程的并行执行进行细化,这是因为代码模块的执行顺序以及哪些代码模块可以使用哪些输入在该时刻是未知的。
因此,如下的系统和方法是有利的,该系统和方法可以确定和调度对部分数据集的处理,该处理随着进程的执行过程而演进以更好地利用可用的并行化的优点。在一个具体的进程类中,可能有一种类型的数据元素,其中该数据元素的不同实例可以具有不同参数,各参数可以具有不同值。即使存在一个超集,并且可以从该超集中选择与任意给定数据元素相关联的参数,不同的数据元素也可以具有不同的参数。
这些数据元素可以用作代码模块的输入,该代码模块可以使用这些数据元素的参数作为输入,并且这些数据元素还可以实例化新的数据元素作为执行的输出。在实例化数据元素时,通过确定这些数据元素未执行其他代码可以使这些数据元素闭合(closed),或者标识出(并且取决于如何定义该闭合而执行)针对这些数据元素中的每一个要运行的代码的适当部分。
用于执行该进程的初步建立操作包括:建立n维空间,在该n维空间中通过将代码部分(例如一个模块的代码模块或代码部分)与该n维空间结构中的一个或更多个点或位置相关联来使这些代码部分互连或对这些代码部分进行组织(这些代码部分还可以与n维空间中的定义区域相关联,但优选的是,与点相关联,并且说明书中使用本例而无任何限制)。
该n维空间可以细分为包括多个元素的加速结构,其中每个元素建立一个超曲面(为了方便起见,与三维结构中一样,称作表面),该超曲面包围与各代码部分相关联的所选择的相应点。在一些例子中,该加速结构是分级的,即父元素具有子元素(为了便于说明,下面将使用本例,但不要求加速结构中的层级)。通常,父加速元素包围了其孩子所包围的点的超集,但不一定包围子元素本身的所有表面。
定义(或者得到)了多个数据元素,并且可能需要对这些数据元素进行处理。在n维空间中进行搜索以确定为了关闭这些数据元素的处理而要运行的一个或更多个代码模块(在一些更一般的情况下,确定是否针对给定元素执行任意处理)。基于数据元素中指定的准则执行检索,该准则包括一个或更多个参数,这些参数的允许值范围在n维空间中定义了路径或区域。例如,在光线作为数据元素的情况下,参数可以包括在三维空间中指定的来源和方向,该来源和方向在三维空间中定义了直线。类似地,参数可以定义三维对象,例如球体。其他的例子包括点通过空间的任意路径,或二维表面的挤压(extrusion)。超维区域可以借助于n维空间中规则或不规则的边界来定义。该区域可以是连续的或不连续的,例如该区域可以包括n维空间中多个不相交部分的结合。因此,数据元素定义了n维空间中的空间范围,其中n可以是2或更大;该空间范围取决于针对规定数据元素定义的参数和参数的值(此处使用“空间”一词是为了更便于理解,而不是限于工作空间中的维数)。
为了确定要针对给定数据元素运行哪些代码部分(如果存在的话),在由加速结构的元素定义了表面(超表面)的n维空间中对该数据元素的空间范围进行相交测试。由于找到了与加速元素的表面相交的数据元素,因此将这些数据元素收集到与这些加速元素相关联的集合中。
可以在包括能够对不同数据元素与给定表面(作为一个例子)的相交进行测试的多个测试元素(例如线程或专用测试单元)的计算资源中完成该搜索。该计算资源的限制在于其不能同时执行必须要完成的所有相交测试,因此要对该计算资源进行调度。对用于测试的计算资源的分配是基于在集合池中对要执行进一步测试的数据元素的集合进行调度。并非按照数据元素的定义顺序或以往开始测试的顺序对这些数据元素进行测试,而是基于从该池中选择的集合中的成员对数据元素进行测试。数据元素可以同时存在于多个集合中,并且即使在作为一个集合中的成员的测试被延迟的情况下,也可以作为另一个集合的成员进行测试。
一些集合相对于其他集合的延迟提供了要便利的更多集合来加入到具有非完全集合的加速结构内的集合中,使得在通常情况下,能够同时测试来自相对更完全集合的数据元素(集合调度的试探可以包括在一些情况下选择具有其他特性的集合)。在分级加速结构的情况下,接下来利用一个数据元素的集合所关联的加速元素的子加速元素来测试给定数据元素集合。
在进行光线相交测试的情况下,相交结果通常是来自正在测试的光线的来源的最接近相交。然而,对于更一般情况下的由(n维空间中的)数据元素中的参数定义所限定的空间范围的相交测试,可以返回多个结果、所选择的结果、或结果的排序。这样,结果被返回,并且通过提供可对数据元素查询进行格式化的格式,可以指定结果的格式。
这种测试的输出可以包括使用哪些数据元素作为哪些代码部分的输出(或要执行的触发器)的指示。这些数据元素还可以输出为一个集合,使得可以对不同数据元素提供相同或相关代码部分的一些实例。进而,代码部分的输出可以包括要进行规定搜索的其他数据元素。
除了以上说明或与以上说明分离地,对执行代码部分本身的调度可以包括对不同数据元素并行地执行代码部分,使得可以对不同的数据元素同时执行代码的公共部分。此外,可以获取这些代码部分所使用的其他数据(例如除了数据元素本身中可以包括的数据意外的数据)并高速缓存以供使用。
因此,根据上述例子的系统可以实现以下方法,在该方法中,可以对包括多个参数(这些参数的值定义了n维空间中的一个区域)的数据元素与包围了空间中与要执行的代码模块相关联的点(或区域)的超表面进行测试相交。所找到的与这些超表面相交的数据元素可以具有如下数据,该数据可以用作所相交的表面包围的一个或更多个代码模块的输入。在一些例子中,系统可以执行进一步测试以建立给定数据元素定义的区域与给定代码模块所关联的点之间的规定精确度的接近度或相交。优选的是,通过延迟各个数据元素的进一步测试以累积发现与给定超表面相交的一些数据元素,并在所提供的系统资源上调度要测试的其他累积数据元素,从而同时执行对多个数据元素的测试。
可以提供计算机代码和相关联的数据以实现此处说明的方法和其他方面。计算机代码可以包括计算机可执行指令,该计算机可执行指令例如可以是二进制指令、中间格式指令(如汇编语言、固件或源代码)。该代码可以配置或者被配置通用计算机、专用计算机或专用处理设备来执行特定功能或功能组。
任何这样的代码可以存储在计算机可读介质(如固态存储器、硬驱动器、CD-ROM和其他光学存储装置)中,瞬时存储在易失性存储器(例如DRAM)中,或非瞬时存储在SRAM中。
可以提供多种实现,该多种实现可包括互操作硬件、固件和/或软件,该互操作硬件、固件和/或软件也可以具体实现在多种形成因素和设备的任意一种中,包括膝上型计算机、智能电话、小型个人计算机、个人数字助理等。此处描述的功能也可以具体实现在外围卡或附加卡中。作为另一个例子,这种功能还可以实现在单个设备上执行的不同芯片或不同进程之间的电路板上。
例如,根据这些例子的机器可以包括具有特定的固定目的测试单元的相交测试资源,和/或配置有来自计算机可读介质的计算机可读指令的通用计算机,以执行所述的特定相交测试,并对测试的结果进行解释。其他的机器部件包括用于为测试资源提供加速结构并接收测试结果的通信链路。相交测试的机器可以是包括其他输入和输出设备的更大系统的部件,例如用于读取场景描述数据的驱动器、以及用于输出再现场景的显示器或计算机可读介质。例如,该计算机可读介质可以是DVD,并且各场景可以是运动图片的一帧。
在所有的上述例子中,再现的三维场景可以表示真实世界场景的提取或模型,测试的光线还可以表示从位于场景中的灯发出的光能。类似地,使用摄像机还可以表示场景的观察者的优势点(vantagepoint)。在确定光如何影响场景并最终影响其他应用可消耗的输出时的相交测试结果的输出可以存储在计算机可读介质中,并可以显示给用户。
虽然使用了多种例子和其他信息来说明所附权利要求书范围内的多个方面,但这些例子中的具体特征或布置并未隐含对权利要求书的限制,因为本领域普通技术人员能够使用这些例子得到广泛的应用。此外,虽然以结构特征和/或方法步骤的例子专用的语言描述了一些主题,但应理解的是,所附权利要求书中限定的主题不一定限于这些描述的特征或动作。例如,这样的功能可以分布在与除了此处所述部件以外的部件、附加的部件或更少的部件中,或在与除了此处所述部件以外的部件、附加的部件或更少的部件中执行。而是,公开所述特征和步骤作为所附权利要求书范围内的系统和方法的部件的例子。
Claims (16)
1.一种使用光线跟踪的三维图形处理系统,包括:
多个计算单元,其共同能够使用数据元素的集合执行一系列的光线跟踪操作,所述光学跟踪操作包括要在加速结构遍历和基元相交测试中的一个或多个的期间执行的操作;
输入缓存器;
用于所述多个计算单元的控制器,其耦合至所述输入缓存器,所述控制器可操作地确定要被输入到所述多个计算单元的数据元素的集合的序列;其中
输入数据元素的每个集合从在所述输入缓存器接收的数据元素中选择,
所述输入缓存器与所述多个计算单元异步地操作,以接收要被所述多个计算单元处理的数据元素的组合,
所述组合潜在地具有不同数目的数据元素,以及
所述控制器可操作地将来自不同时间接收的组合中的数据元素收集到要向所述多个计算单元提供的所述数据元素的集合之一中,并且基于从所述多个计算单元接收的、针对数据元素的那些集合所执行的光线跟踪操作的结果,通过确定所述结果指示要针对集合中的一些数据元素执行的后续操作不同于所述集合的其它数据元素,来从数据元素的不同集合收集数据元素。
2.根据权利要求1所述的使用光线跟踪的三维图形处理系统,其中所述控制器可操作地将准备开始处理的数据元素的集合排队成就绪队列。
3.根据权利要求1所述的使用光线跟踪的三维图形处理系统,其中所述控制器可操作地将数据元素增加到数据元素的每个集合,直至指示了就绪条件。
4.根据权利要求3所述的使用光线跟踪的三维图形处理系统,其中所述就绪条件包括已经被增加到所述集合的数据元素的最大数目。
5.根据权利要求3所述的使用光线跟踪的三维图形处理系统,其中所述就绪条件包括指示数据元素的特定集合要开始处理的就绪试探。
6.一种用于三维图形处理的系统,包括:
多个计算单元,其共同能够使用数据元素的集合执行一系列的操作,并且输出针对数据元素的每个集合的相应结果;
输入缓存器,其被配置成接收要由所述多个计算单元处理的数据元素;
用于所述多个计算单元的控制器,其耦合至所述输入缓存器,所述控制器可操作地确定要被输入到所述多个计算单元的数据元素的集合的序列,其中
数据元素的每个集合从在所述输入缓存器接收的数据元素和之前在所述输入缓存器接收的数据元素中选择,以及所述之前接收的数据元素已经被增加到集合中并且针对其所述多个计算单元已经输出了结果,以及
所述控制器可操作地将在不同时间接收的数据元素收集到要向所述多个计算单元提供的所述数据元素的集合之一中,并且在对所述输入缓存器接收的数据元素的每个组合进行处理时提供最大延迟。
7.根据权利要求6所述的用于三维图形处理的系统,其中所述数据元素的每个数据元素指示要被所述多个计算单元处理的光线和形状中的一个或多个。
8.根据权利要求6所述的用于三维图形处理的系统,其中所述多个计算单元可操作地并行处理最大数目的数据元素,以及所述输入缓存器能够组合具有最大数目比所述多个计算单元能够并行处理的数据元素的最大数目更多的数据元素,以及所述控制器可操作地延迟所接收的一些数据元素的开始处理并且将那些数据元素与后面所接收的数据元素结合,以形成所述数据元素的集合之一。
9.一种在计算系统中执行的图形计算方法,包括:
按时钟表输出要被执行的计算的说明的组合,所述组合中的多个说明与在时钟表的截止期限之前可用于被组合的计算的多个说明相关;
将输入缓存器所输出的组合接收到多个计算单元;
重新组织来自所述输入缓存器所接收的多个组合的数据元素,以产生要被所述多个计算单元处理的规则化尺寸的组合;以及
在所述多个计算单元中处理来自所述规则化尺寸的组合中的数据元素。
10.根据权利要求9所述的在计算系统中执行的图形计算方法,其中所述多个计算单元包括在一个或多个核芯上执行的多个计算线程中的一个或多个,以及被设计用于执行处理的固定功能单元。
11.根据权利要求10所述的在计算系统中执行的图形计算方法,其中所述固定功能单元被设计用于执行来自多个预定处理中的一个处理。
12.根据权利要求11所述的在计算系统中执行的图形计算方法,其中所述固定功能单元与存储配置数据的非瞬时性存储器耦合,所述配置数据用于配置所述固定功能单元以执行所述多个预定处理中的每个处理。
13.根据权利要求9所述的在计算系统中执行的图形计算方法,其中所述组合的输出包括:识别并且组合指示要对不同数据元素执行的相同处理的计算说明。
14.一种用于三维图形处理的系统,包括:
多个计算单元,其共同能够使用数据元素的集合执行一系列的操作并且输出针对数据元素的每个集合的相应结果;
输入缓存器,其被配置用于接收要被所述多个计算单元处理的数据元素;
用于所述多个计算单元的控制器,其耦合至所述输入缓存器,所述控制器可操作地确定要被输入到所述多个计算单元的数据元素的集合的序列,其中,
数据元素的每个集合从在所述输入缓存器接收的数据元素以及之前在所述输入缓存器接收的数据元素中选择,以及所述之前接收的数据元素已经被增加到集合中并且针对其所述多个计算单元已经输出了结果;以及
所述控制器可操作地将来自不同时间接收的组合中的数据元素收集到要向所述多个计算单元提供的数据元素的集合之一中,
其中所述多个计算单元可操作地并行处理最大数目的数据元素,并且所述输入缓存器能够组合具有最大数目比所述多个计算单元能够并行处理的数据元素的最大数目更多的数据元素,以及所述控制器可操作地延迟所接收的一些数据元素的开始处理并且将那些数据元素与后面所接收的数据元素结合,以形成所述数据元素的集合之一。
15.根据权利要求14所述的用于三维图形处理的系统,其中所述数据元素的每个数据元素指示要被所述多个计算单元处理的光线和形状中的一个或多个。
16.根据权利要求14所述的用于三维图形处理的系统,其中所述控制器被配置成在对在所述输入缓存器接收的数据元素的每个组合进行处理时提供最大延迟。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US9589008P | 2008-09-10 | 2008-09-10 | |
US61/095,890 | 2008-09-10 | ||
US22925809P | 2009-07-28 | 2009-07-28 | |
US61/229,258 | 2009-07-28 | ||
US22970509P | 2009-07-29 | 2009-07-29 | |
US61/229,705 | 2009-07-29 | ||
US12/555,766 | 2009-09-08 | ||
US12/555,766 US8018457B2 (en) | 2006-09-19 | 2009-09-08 | Ray tracing system architectures and methods |
CN200980144557.XA CN102282591B (zh) | 2008-09-10 | 2009-09-09 | 光线跟踪系统架构和方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980144557.XA Division CN102282591B (zh) | 2008-09-10 | 2009-09-09 | 光线跟踪系统架构和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103942825A true CN103942825A (zh) | 2014-07-23 |
CN103942825B CN103942825B (zh) | 2017-10-10 |
Family
ID=41226411
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980144557.XA Active CN102282591B (zh) | 2008-09-10 | 2009-09-09 | 光线跟踪系统架构和方法 |
CN201410189251.9A Active CN103942825B (zh) | 2008-09-10 | 2009-09-09 | 光线跟踪系统架构和方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980144557.XA Active CN102282591B (zh) | 2008-09-10 | 2009-09-09 | 光线跟踪系统架构和方法 |
Country Status (5)
Country | Link |
---|---|
US (4) | US8018457B2 (zh) |
EP (3) | EP3680862A1 (zh) |
JP (1) | JP5291798B2 (zh) |
CN (2) | CN102282591B (zh) |
WO (1) | WO2010030693A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109509138A (zh) * | 2017-09-15 | 2019-03-22 | 想象技术有限公司 | 针对射线跟踪系统的减小的加速结构 |
CN112907717A (zh) * | 2019-11-15 | 2021-06-04 | 畅想科技有限公司 | 光线跟踪系统中的多精度水平相交测试 |
CN113344766A (zh) * | 2021-06-07 | 2021-09-03 | 中天恒星(上海)科技有限公司 | 光线追踪处理器、处理器芯片、设备终端以及光线追踪方法 |
CN115115761A (zh) * | 2021-03-23 | 2022-09-27 | 想象技术有限公司 | 光线跟踪系统中的相交测试 |
Families Citing this family (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8018453B2 (en) * | 2007-02-09 | 2011-09-13 | International Business Machines Corporation | Deferred acceleration data structure optimization for improved performance |
US8284195B2 (en) * | 2007-09-13 | 2012-10-09 | International Business Machines Corporation | Cooperative utilization of spatial indices between application and rendering hardware |
US8449144B2 (en) * | 2008-05-16 | 2013-05-28 | Musco Corporation | Apparatus, method, and system for highly controlled light distribution using multiple light sources |
US8356916B2 (en) * | 2008-05-16 | 2013-01-22 | Musco Corporation | Method, system and apparatus for highly controlled light distribution from light fixture using multiple light sources (LEDS) |
US8622569B1 (en) | 2009-07-17 | 2014-01-07 | Musco Corporation | Method, system and apparatus for controlling light distribution using swivel-mount led light sources |
US9068707B1 (en) | 2010-04-06 | 2015-06-30 | Musco Corporation | Compact LED light source and lighting system |
US20110283059A1 (en) * | 2010-05-11 | 2011-11-17 | Progeniq Pte Ltd | Techniques for accelerating computations using field programmable gate array processors |
KR101705581B1 (ko) | 2010-09-30 | 2017-02-22 | 삼성전자주식회사 | 데이터 처리 장치 및 방법 |
GB2486485B (en) | 2010-12-16 | 2012-12-19 | Imagination Tech Ltd | Method and apparatus for scheduling the issue of instructions in a microprocessor using multiple phases of execution |
CN103392094B (zh) | 2011-02-25 | 2016-12-21 | 玛斯柯有限公司 | 紧凑可调的led照明装置以及长期运行的方法和系统 |
DE112012002465T5 (de) * | 2011-06-16 | 2014-03-20 | Caustic Graphics, Inc. | Grafikprozessor mit nicht blockierender gleichzeitiger Architektur |
DE112012003243T5 (de) * | 2011-08-05 | 2014-04-30 | Caustic Graphics, Inc. | Systeme und Verfahren für die Erzeugung und Aktualisierung für 3D-Szenenbeschleunigungsstrukturen |
US9595074B2 (en) | 2011-09-16 | 2017-03-14 | Imagination Technologies Limited | Multistage collector for outputs in multiprocessor systems |
US9424685B2 (en) | 2012-07-31 | 2016-08-23 | Imagination Technologies Limited | Unified rasterization and ray tracing rendering environments |
KR20140023615A (ko) * | 2012-08-16 | 2014-02-27 | 삼성전자주식회사 | 병렬 파이프라인을 사용하는 그래픽 처리 방법 및 장치 |
JP6386217B2 (ja) | 2012-09-12 | 2018-09-05 | センシティ システムズ インコーポレイテッド | 感知応用のためのネットワーク接続された照明インフラストラクチャ |
US9582671B2 (en) | 2014-03-06 | 2017-02-28 | Sensity Systems Inc. | Security and data privacy for lighting sensory networks |
KR102080851B1 (ko) | 2012-09-17 | 2020-02-24 | 삼성전자주식회사 | 레이 추적의 스케쥴링을 위한 장치 및 방법 |
DE112013005255T5 (de) * | 2012-11-02 | 2015-09-24 | Imagination Technologies Ltd. | Bedarfsweise Geometrie- und Beschleunigungsstrukturerzeugung |
US10970912B2 (en) | 2013-03-14 | 2021-04-06 | Imagination Technologies Limited | 3-D graphics rendering with implicit geometry |
GB2541505B (en) * | 2013-03-14 | 2017-08-02 | Imagination Tech Ltd | Determining closest intersections during ray-tracing |
GB2513698B (en) | 2013-03-15 | 2017-01-11 | Imagination Tech Ltd | Rendering with point sampling and pre-computed light transport information |
US9933297B2 (en) | 2013-03-26 | 2018-04-03 | Sensity Systems Inc. | System and method for planning and monitoring a light sensory network |
WO2014160708A1 (en) | 2013-03-26 | 2014-10-02 | Sensity Systems, Inc. | Sensor nodes with multicast transmissions in lighting sensory network |
KR102110819B1 (ko) | 2013-05-08 | 2020-05-15 | 삼성전자주식회사 | 영상 처리 장치 및 방법 |
CN104516831B (zh) * | 2013-09-26 | 2019-02-22 | 想象技术有限公司 | 原子存储器更新单元和方法 |
US11257271B2 (en) | 2013-09-26 | 2022-02-22 | Imagination Technologies Limited | Atomic memory update unit and methods |
KR102161742B1 (ko) * | 2013-10-11 | 2020-10-05 | 삼성전자주식회사 | 피드백 경로를 포함하는 파이프 라인 시스템 및 그 동작방법 |
KR102193684B1 (ko) * | 2013-11-04 | 2020-12-21 | 삼성전자주식회사 | 레이 트레이싱 처리 장치 및 방법 |
US8947447B1 (en) | 2014-02-13 | 2015-02-03 | Raycast Systems, Inc. | Computer hardware architecture and data structures for ray binning to support incoherent ray traversal |
US9746370B2 (en) | 2014-02-26 | 2017-08-29 | Sensity Systems Inc. | Method and apparatus for measuring illumination characteristics of a luminaire |
US10417570B2 (en) | 2014-03-06 | 2019-09-17 | Verizon Patent And Licensing Inc. | Systems and methods for probabilistic semantic sensing in a sensory network |
US10362112B2 (en) | 2014-03-06 | 2019-07-23 | Verizon Patent And Licensing Inc. | Application environment for lighting sensory networks |
US10083541B2 (en) * | 2014-03-13 | 2018-09-25 | Imagination Technologies Limited | Object illumination in hybrid rasterization and ray traced 3-D rendering |
US9734624B2 (en) * | 2014-04-30 | 2017-08-15 | Lucasfilm Entertainment Company Ltd. | Deep image data compression |
KR102201834B1 (ko) * | 2014-05-02 | 2021-01-12 | 삼성전자주식회사 | 렌더링 시스템 및 이의 레이 생성 방법 |
WO2015167159A1 (en) | 2014-05-02 | 2015-11-05 | Samsung Electronics Co., Ltd. | Rendering system and method for generating ray |
KR102219289B1 (ko) | 2014-05-27 | 2021-02-23 | 삼성전자 주식회사 | 레이 트레이싱 시스템에서의 가속 구조 탐색 장치 및 그 탐색 방법 |
US10679407B2 (en) * | 2014-06-27 | 2020-06-09 | The University Of North Carolina At Chapel Hill | Methods, systems, and computer readable media for modeling interactive diffuse reflections and higher-order diffraction in virtual environment scenes |
US9977644B2 (en) | 2014-07-29 | 2018-05-22 | The University Of North Carolina At Chapel Hill | Methods, systems, and computer readable media for conducting interactive sound propagation and rendering for a plurality of sound sources in a virtual environment scene |
GB2554587B (en) | 2015-03-05 | 2018-09-19 | Imagination Tech Ltd | Systems and methods for distributed scalable ray processing |
US9984492B2 (en) * | 2015-04-02 | 2018-05-29 | Qualcomm Incorporated | Efficient hierarchy traversal in ray tracing applications |
TWI566229B (zh) * | 2015-06-03 | 2017-01-11 | 友達光電股份有限公司 | 顯示裝置之時序控制器及其操作方法 |
CN105117533B (zh) * | 2015-08-03 | 2018-05-22 | 常州赞云软件科技有限公司 | 家装设计软件中光线跟踪算法的加速方法 |
KR102493461B1 (ko) | 2015-08-31 | 2023-01-30 | 삼성전자 주식회사 | 렌더링 시스템 및 방법 |
US10579812B2 (en) * | 2016-02-19 | 2020-03-03 | Adobe Inc. | 3D digital content interaction and control |
US10332303B2 (en) | 2016-04-26 | 2019-06-25 | Imagination Technologies Limited | Dedicated ray memory for ray tracing in graphics systems |
US10282890B2 (en) | 2016-09-29 | 2019-05-07 | Intel Corporation | Method and apparatus for the proper ordering and enumeration of multiple successive ray-surface intersections within a ray tracing architecture |
KR20180050124A (ko) | 2016-11-04 | 2018-05-14 | 삼성전자주식회사 | 가속 구조를 생성하는 방법 및 장치 |
US10248744B2 (en) | 2017-02-16 | 2019-04-02 | The University Of North Carolina At Chapel Hill | Methods, systems, and computer readable media for acoustic classification and optimization for multi-modal rendering of real-world scenes |
US11064173B2 (en) * | 2017-12-14 | 2021-07-13 | International Business Machines Corporation | Photographic directional light reference for articulating devices |
US11157414B2 (en) * | 2018-08-10 | 2021-10-26 | Nvidia Corporation | Method for efficient grouping of cache requests for datapath scheduling |
CN110412828A (zh) * | 2018-09-07 | 2019-11-05 | 广东优世联合控股集团股份有限公司 | 一种三维光迹影像的打印方法及系统 |
US20200211259A1 (en) | 2018-12-28 | 2020-07-02 | Intel Corporation | Apparatus and method for acceleration data structure refit |
JP2020177074A (ja) * | 2019-04-16 | 2020-10-29 | 株式会社デンソー | 車両用装置、車両用装置の制御方法 |
US11276224B2 (en) | 2020-04-17 | 2022-03-15 | Samsung Electronics Co., Ltd. | Method for ray intersection sorting |
US11521343B2 (en) | 2020-07-30 | 2022-12-06 | Apple Inc. | Graphics memory space for shader core |
US11367242B2 (en) * | 2020-07-30 | 2022-06-21 | Apple Inc. | Ray intersect circuitry with parallel ray testing |
GB2592285B8 (en) | 2020-08-21 | 2022-11-30 | Imagination Tech Ltd | Coherency gathering for ray tracing |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050198644A1 (en) * | 2003-12-31 | 2005-09-08 | Hong Jiang | Visual and graphical data processing using a multi-threaded architecture |
WO2007070456A2 (en) * | 2005-12-12 | 2007-06-21 | Intel Corporation | Method and apparatus for binary image classification and segmentation |
CN201034947Y (zh) * | 2007-05-23 | 2008-03-12 | 孙忠诚 | 螺旋焊缝x射线实时数字成像检测与自动跟踪装置 |
Family Cites Families (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US750948A (en) | 1904-02-02 | Demand-discount meter | ||
US4625289A (en) * | 1985-01-09 | 1986-11-25 | Evans & Sutherland Computer Corp. | Computer graphics system of general surface rendering by exhaustive sampling |
EP0459761A3 (en) | 1990-05-31 | 1993-07-14 | Hewlett-Packard Company | Three dimensional computer graphics employing ray tracking to compute form factors in radiosity |
US6559843B1 (en) | 1993-10-01 | 2003-05-06 | Compaq Computer Corporation | Segmented ray casting data parallel volume rendering |
GB9424273D0 (en) * | 1994-12-01 | 1995-01-18 | Wrigley Adrian M T | Improvements in and relating to image constrcution |
US5973699A (en) * | 1996-09-19 | 1999-10-26 | Platinum Technology Ip, Inc. | System and method for increasing the performance for real-time rendering of three-dimensional polygonal data |
US6111582A (en) | 1996-12-20 | 2000-08-29 | Jenkins; Barry L. | System and method of image generation and encoding using primitive reprojection |
US6023279A (en) | 1997-01-09 | 2000-02-08 | The Boeing Company | Method and apparatus for rapidly rendering computer generated images of complex structures |
US6028608A (en) | 1997-05-09 | 2000-02-22 | Jenkins; Barry | System and method of perception-based image generation and encoding |
JP3889195B2 (ja) * | 1999-02-03 | 2007-03-07 | 株式会社東芝 | 画像処理装置、画像処理システムおよび画像処理方法 |
US6489955B1 (en) | 1999-06-07 | 2002-12-03 | Intel Corporation | Ray intersection reduction using directionally classified target lists |
US6556200B1 (en) | 1999-09-01 | 2003-04-29 | Mitsubishi Electric Research Laboratories, Inc. | Temporal and spatial coherent ray tracing for rendering scenes with sampled and geometry data |
EP1264281A4 (en) * | 2000-02-25 | 2007-07-11 | Univ New York State Res Found | ARRANGEMENT AND METHOD FOR PROCESSING AND PLAYING A VOLUME |
US6344837B1 (en) | 2000-06-16 | 2002-02-05 | Andrew H. Gelsey | Three-dimensional image display with picture elements formed from directionally modulated pixels |
US7184042B2 (en) | 2000-06-19 | 2007-02-27 | Mental Images Gmbh | Computer graphic system and computer-implemented method for generating images using a ray tracing methodology that makes use of a ray tree generated using low-discrepancy sequences and ray tracer for use therewith |
US7499053B2 (en) | 2000-06-19 | 2009-03-03 | Mental Images Gmbh | Real-time precision ray tracing |
AU2002245076A1 (en) | 2000-12-06 | 2002-07-16 | Sun Microsystems, Inc. | Using ancillary geometry for visibility determination |
US20030151604A1 (en) * | 2001-11-21 | 2003-08-14 | Research Foundation Of State University Of New York | Volume rendering with contouring texture hulls |
US7009608B2 (en) | 2002-06-06 | 2006-03-07 | Nvidia Corporation | System and method of using multiple representations per object in computer graphics |
US7362332B2 (en) | 2002-06-20 | 2008-04-22 | Nvidia Corporation | System and method of simulating motion blur efficiently |
US6853377B2 (en) | 2002-06-26 | 2005-02-08 | Nvidia Corporation | System and method of improved calculation of diffusely reflected light |
DE10239672B4 (de) | 2002-08-26 | 2005-08-11 | Universität des Saarlandes | Verfahren und Vorrichtung zur Erzeugung einer zweidimensionalen Abbildung einer dreidimensionalen Struktur |
US7012604B1 (en) | 2002-09-12 | 2006-03-14 | Advanced Micro Devices, Inc. | System architecture for high speed ray tracing |
CN1410948A (zh) * | 2002-09-23 | 2003-04-16 | 清华大学 | 平面和球面非线性折射和反射的实时光线跟踪方法 |
EP1576545A4 (en) | 2002-11-15 | 2010-03-24 | Sunfish Studio Llc | SYSTEM AND METHOD FOR VISIBLE SURFACE DETERMINATION, USED IN INFOGRAPHY, USING INTERVAL ANALYSIS |
JP4516957B2 (ja) | 2003-01-25 | 2010-08-04 | パーデュー リサーチ ファンデーション | 3次元オブジェクトについて検索を行なうための方法、システムおよびデータ構造 |
US7098907B2 (en) | 2003-01-30 | 2006-08-29 | Frantic Films Corporation | Method for converting explicitly represented geometric surfaces into accurate level sets |
US7212207B2 (en) | 2003-08-20 | 2007-05-01 | Sony Computer Entertainment Inc. | Method and apparatus for real-time global illumination incorporating stream processor based hybrid ray tracing |
US7483024B2 (en) | 2003-12-31 | 2009-01-27 | Autodesk, Inc. | Accelerated ray-object intersection |
WO2005081683A2 (en) * | 2004-02-12 | 2005-09-09 | Pixar | Method and apparatus for multiresolution geometry caching based on ray differentials |
US20060098009A1 (en) | 2004-10-28 | 2006-05-11 | Miguel Zuniga | Method and apparatus for ray and range queries using wide object isolation techniques |
US7969437B2 (en) | 2004-12-28 | 2011-06-28 | Intel Corporation | Method and apparatus for triangle representation |
US7348975B2 (en) | 2004-12-28 | 2008-03-25 | Intel Corporation | Applications of interval arithmetic for reduction of number of computations in ray tracing problems |
US7973790B2 (en) | 2005-08-11 | 2011-07-05 | Realtime Technology Ag | Method for hybrid rasterization and raytracing with consistent programmable shading |
FR2896895B1 (fr) * | 2006-02-01 | 2008-09-26 | Redway Soc Par Actions Simplifiee | Procede de synthese d'une image virtuelle par lancer de faisceaux |
US20080024489A1 (en) | 2006-07-28 | 2008-01-31 | Robert Allen Shearer | Cache Utilization Optimized Ray Traversal Algorithm with Minimized Memory Bandwidth Requirements |
US7864174B2 (en) | 2006-08-24 | 2011-01-04 | International Business Machines Corporation | Methods and systems for reducing the number of rays passed between processing elements in a distributed ray tracing system |
US7830379B2 (en) | 2006-09-19 | 2010-11-09 | Caustic Graphics, Inc. | Architectures for parallelized intersection testing and shading for ray-tracing rendering |
US7688320B2 (en) | 2006-09-27 | 2010-03-30 | International Business Machines Corporation | Methods and systems for texture prefetching based on a most recently hit primitive algorithm |
US7884819B2 (en) | 2006-09-27 | 2011-02-08 | International Business Machines Corporation | Pixel color accumulation in a ray tracing image processing system |
US7940266B2 (en) | 2006-10-13 | 2011-05-10 | International Business Machines Corporation | Dynamic reallocation of processing cores for balanced ray tracing graphics workload |
US20080088619A1 (en) * | 2006-10-17 | 2008-04-17 | Robert Allen Shearer | Branch Prediction for Acceleration Data Structure Traversal |
US7782318B2 (en) | 2006-11-22 | 2010-08-24 | International Business Machines Corporation | Method for reducing network bandwidth by delaying shadow ray generation |
US8139060B2 (en) | 2006-11-28 | 2012-03-20 | International Business Machines Corporation | Ray tracing image processing system |
US7852336B2 (en) * | 2006-11-28 | 2010-12-14 | International Business Machines Corporation | Dynamic determination of optimal spatial index mapping to processor thread resources |
WO2008067483A1 (en) | 2006-11-29 | 2008-06-05 | University Of Utah Research Foundation | Ray tracing a three dimensional scene using a grid |
KR100889602B1 (ko) | 2006-12-05 | 2009-03-20 | 한국전자통신연구원 | 광선 추적을 위한 광선-삼각형 충돌 처리 방법 및 장치 |
US8022950B2 (en) * | 2007-01-26 | 2011-09-20 | International Business Machines Corporation | Stochastic culling of rays with increased depth of recursion |
US8085267B2 (en) | 2007-01-30 | 2011-12-27 | International Business Machines Corporation | Stochastic addition of rays in a ray tracing image processing system |
US8237711B2 (en) | 2007-11-19 | 2012-08-07 | Caustic Graphics, Inc. | Tracing of shader-generated ray groups using coupled intersection testing |
US9043801B2 (en) | 2008-01-15 | 2015-05-26 | International Business Machines Corporation | Two-tiered dynamic load balancing using sets of distributed thread pools |
-
2009
- 2009-09-08 US US12/555,766 patent/US8018457B2/en active Active
- 2009-09-09 EP EP20160476.6A patent/EP3680862A1/en active Pending
- 2009-09-09 CN CN200980144557.XA patent/CN102282591B/zh active Active
- 2009-09-09 JP JP2011526945A patent/JP5291798B2/ja active Active
- 2009-09-09 EP EP09792379.1A patent/EP2335223B1/en active Active
- 2009-09-09 EP EP18189407.2A patent/EP3428886B1/en active Active
- 2009-09-09 WO PCT/US2009/056395 patent/WO2010030693A1/en active Application Filing
- 2009-09-09 CN CN201410189251.9A patent/CN103942825B/zh active Active
-
2011
- 2011-09-09 US US13/229,566 patent/US8300049B2/en active Active
-
2012
- 2012-09-11 US US13/610,651 patent/US8619079B2/en active Active
-
2013
- 2013-12-28 US US14/142,831 patent/US9183668B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050198644A1 (en) * | 2003-12-31 | 2005-09-08 | Hong Jiang | Visual and graphical data processing using a multi-threaded architecture |
CN101147126A (zh) * | 2003-12-31 | 2008-03-19 | 英特尔公司 | 使用多线程架构的视觉和图形数据处理 |
WO2007070456A2 (en) * | 2005-12-12 | 2007-06-21 | Intel Corporation | Method and apparatus for binary image classification and segmentation |
CN201034947Y (zh) * | 2007-05-23 | 2008-03-12 | 孙忠诚 | 螺旋焊缝x射线实时数字成像检测与自动跟踪装置 |
Non-Patent Citations (1)
Title |
---|
WILFRID LEFER ET AL: ""An efficient parallel ray tracing scheme for distributed memory parallel computers"", 《PARALLEL RENDERING SYMPOSIUM》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109509138A (zh) * | 2017-09-15 | 2019-03-22 | 想象技术有限公司 | 针对射线跟踪系统的减小的加速结构 |
CN109509138B (zh) * | 2017-09-15 | 2023-09-12 | 想象技术有限公司 | 针对射线跟踪系统的减小的加速结构 |
CN112907717A (zh) * | 2019-11-15 | 2021-06-04 | 畅想科技有限公司 | 光线跟踪系统中的多精度水平相交测试 |
CN112907717B (zh) * | 2019-11-15 | 2023-08-25 | 畅想科技有限公司 | 光线跟踪系统中的多精度水平相交测试 |
CN115115761A (zh) * | 2021-03-23 | 2022-09-27 | 想象技术有限公司 | 光线跟踪系统中的相交测试 |
CN115115761B (zh) * | 2021-03-23 | 2023-10-17 | 想象技术有限公司 | 确定光线是否与三维轴对齐框相交的方法、装置和介质 |
CN113344766A (zh) * | 2021-06-07 | 2021-09-03 | 中天恒星(上海)科技有限公司 | 光线追踪处理器、处理器芯片、设备终端以及光线追踪方法 |
Also Published As
Publication number | Publication date |
---|---|
US8018457B2 (en) | 2011-09-13 |
EP2335223A1 (en) | 2011-06-22 |
JP5291798B2 (ja) | 2013-09-18 |
US20130002672A1 (en) | 2013-01-03 |
EP3428886A1 (en) | 2019-01-16 |
CN103942825B (zh) | 2017-10-10 |
US20120001912A1 (en) | 2012-01-05 |
US8619079B2 (en) | 2013-12-31 |
US8300049B2 (en) | 2012-10-30 |
US9183668B2 (en) | 2015-11-10 |
WO2010030693A1 (en) | 2010-03-18 |
US20090322752A1 (en) | 2009-12-31 |
CN102282591B (zh) | 2014-06-11 |
EP3680862A1 (en) | 2020-07-15 |
US20140232720A1 (en) | 2014-08-21 |
EP2335223B1 (en) | 2018-11-07 |
EP3428886B1 (en) | 2020-04-01 |
CN102282591A (zh) | 2011-12-14 |
JP2012502395A (ja) | 2012-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102282591B (zh) | 光线跟踪系统架构和方法 | |
US10789758B2 (en) | Ray tracing in computer graphics using intersection testing at selective resolution | |
CN102037497B (zh) | 用于光线追踪渲染的并行相交测试及着色的架构 | |
US9940687B2 (en) | Dynamic graphics rendering scheduling | |
US8237711B2 (en) | Tracing of shader-generated ray groups using coupled intersection testing | |
KR20210119899A (ko) | 그래픽 프로세싱 | |
US8952961B2 (en) | Systems and methods for photon map querying | |
US20240062452A1 (en) | Ray Tracing System Architectures and Methods | |
KR20220164441A (ko) | 그래픽 프로세싱 | |
US20240078741A1 (en) | Graphics processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
ASS | Succession or assignment of patent right |
Owner name: ENVISION TECHNOLOGIES GMBH Free format text: FORMER OWNER: CAUSTIC GRAPHICS INC. Effective date: 20150430 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20150430 Address after: Hertfordshire Applicant after: Imagination Technologies Limited Address before: American California Applicant before: Caustic Graphics Inc. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |