CN108520489B

CN108520489B - Gpu中一种实现命令解析和顶点获取并行的装置和方法

Info

Publication number: CN108520489B
Application number: CN201810328262.9A
Authority: CN
Inventors: 焦永
Original assignee: Changsha Jingmei Integrated Circuit Design Co ltd
Current assignee: Changsha Jingmei Integrated Circuit Design Co ltd
Priority date: 2018-04-12
Filing date: 2018-04-12
Publication date: 2022-12-06
Anticipated expiration: 2038-04-12
Also published as: CN108520489A

Abstract

本发明公开了GPU中一种实现命令解析和顶点获取并行的装置和方法，该装置包括：接收命令缓冲区，命令预解析模块，两个内部缓冲区FIFO，命令解析模块，顶点仲裁、读取模块和顶点缓冲区FIFO几个部分，实现方法是：通过将绘制命令设计成参数配置、顶点配置和绘制命令三种，接收到命令字后进行预解析，将参数配置命令和绘制命令交由命令解析模块处理，顶点配置命令交由顶点获取模块处理，绘制命令解析完毕直接从顶点缓冲区FIFO得到顶点数据输出至顶点处理单元，实现了命令处理和顶点获取的并行。

Description

GPU中一种实现命令解析和顶点获取并行的装置和方法

技术领域

本发明主要涉及到GPU设计领域，特指GPU中命令解析和顶点获取处理领域。

背景技术

GPU的第一个处理步骤就是接收绘制命令，一般的处理方式是预先定义好命令格式，接收到绘制命令后按照预先定义的格式进行命令解析，解析出命令中的参数、绘制图元类型和顶点属性的配置信息，然后按照顶点配置从存储器读取顶点数据，将顶点数据发送到顶点处理单元进行后续处理。

这种处理方式是一种串行方式，解析出哪种命令执行哪种命令操作，由于访存操作往往是GPU的瓶颈，大部分时间花在读取顶点的过程中，效率比较低。

发明内容

本发明要解决的问题就在于：提供了一种命令处理和顶点获取并行的操作方式，通过将绘制命令设计成参数配置、顶点配置和绘制命令三种，接收到命令字后进行预解析，将参数配置命令和绘制命令交由命令解析模块处理，顶点配置命令交由顶点获取模块处理，绘制命令解析完毕直接从顶点获取模块得到顶点数据输出至顶点处理单元，从而实现了命令处理和顶点获取的并行。

发明内容：

本发明公开了GPU中一种实现命令解析和顶点获取并行的装置，包含以下模块：

(1)接收命令模块：该模块为一个缓冲区FIFO，用于接收CPU通过总线发送的GPU命令；

(2)命令预解析模块：该模块完成命令的分类，将GPU命令分成参数配置命令、顶点配置命令和图形绘制命令三种；

(3)缓冲区FIFO模块：两个缓冲区FIFO，其中FIFO A用于缓存参数配置命令和图形绘制命令，FIFO B用于缓存顶点配置命令；

(4)顶点仲裁、读取模块：用于将顶点配置命令中提取的信息转化成各顶点属性的读取命令，向存储器发出读取请求，其中的请求仲裁也由本模块完成；

(5)命令解析模块：负责解析FIFO A中的命令，其中解析绘图命令需要得到顶点数据，这些数据需要从顶点缓冲区FIFO中读取；

(6)顶点缓冲区模块：用于接收顶点仲裁、读取模块得到的顶点数据，向命令解析模块提供顶点数据；

本发明还公开了GPU中一种实现命令解析和顶点获取并行的方法，将GPU的绘图命令设计成三种类型：参数配置命令、顶点配置命令和图形绘制命令，设每个顶点的坐标和属性为P₀、P₁、P₂、……P_n，其中n＞＝3且为自然数，坐标和属性均为单精度浮点数，为了使命令解析操作和顶点获取操作并行执行，本发明按照以下步骤执行：

步骤1：接收CPU发出的GPU命令；

步骤2：接收到命令之后首先进行预解析，按照命令类型标志进行分类，将参数配置命令和绘制命令存储在一个FIFO A，将顶点配置命令保存在一个FIFO B；

步骤3：命令解析模块读取FIFO A，得到参数配置命令和绘制命令，这些由命令解析模块执行，参数配置的结果直接发送给对应功能模块，绘制命令解析得到顶点属性各分量的数量信息，然后按照各分量的个数直接从FIFO中获取相应的顶点数据发送给下一级模块处理；同时，顶点获取模块读取FIFO B，根据顶点配置命令得到各个顶点属性分量的地址、数目、跨度信息，访存模块按P₀、P₁、P₂、……P_n的顺序发出各个分量对存储器的访问，由请求仲裁模块负责发出访存请求和返回数据的处理，处理完成的返回数据保存在顶点FIFO中；利用顶点FIFO实现顶点仲裁、读取写顶点FIFO，命令解析读顶点FIFO的并行操作；

对于本发明实现方法的进一步限定，所述步骤3中的请求仲裁模块，其仲裁方式为：设当前顶点配置命令有m个顶点，m为自然数，P₀、P₁、P₂、……P_n属性配置的地址分别为Addr_P0、Addr_P1、Addr_P2、……Addr_Pn，每个属性的跨度信息分别为Burst_P0、Burst_P1、Burst_P2、……Burst_Pn，分为以下两个同步执行过程：

1)依次将P₀、P₁、P₂、……P_n属性的访存地址和跨度信息

写入请求FIFO，其中i∈[1，n]，本次所有请求写出后，顶点数目m变为m-1，若此时顶点数目不为0则将各属性地址Addr_Pi变为Addr_Pi+Burst_Pi，再次依次写请求FIFO，如此重复操作，直到顶点数目为0则该组配置命令处理完毕，读FIFOB获取下一组配置命令执行该过程；

2)请求FIFO非空时，由请求仲裁模块读取请求FIFO，根据读取的FIFO数据向存储器发出读请求，返回的数据写入顶点FIFO。

本发明的优点就在于：该实现方法将命令处理和顶点获取操作并行执行，提高了效率。

附图说明

图1是定义的一种命令格式；

图2是本发明GPU中一种命令处理和顶点获取并行的实现结构图；

图3是顶点各属性访问的仲裁实现。

具体实施方式

以下将结合附图和具体实施例对本发明做进一步详细说明。

如图1所示，将GPU的绘图命令设计成三种类型，参数配置命令(命令字中类别码为00)、顶点配置命令(命令字中类别码为10)和图形绘制命令(命令字中类别码为01)，设每个顶点的属性为P₀、P₁、P₂、……P_n，其中n＞＝3且为自然数，顶点坐标和属性均为单精度浮点数；

如图2所示为命令解析和顶点获取并行实现的结构图：包含以下模块：

具体的实施方式为：按照以下步骤执行：

步骤1：接收CPU发出的GPU命令；

步骤2：接收到命令之后首先进行预解析，按照命令类型标志进行分类，将参数配置命令和绘制命令存储在一个FIFOA，将顶点配置命令保存在一个FIFO B；

步骤3：命令解析模块读取FIFO A，得到参数配置命令和绘制命令，这些由命令解析模块执行，参数配置的结果直接发送给对应功能模块，绘制命令解析得到顶点属性各分量的数量信息，然后按照各分量的个数直接从FIFO中获取相应的顶点数据发送给下一级模块处理；同时，顶点获取模块读取FIFO B，根据顶点配置命令得到各个顶点属性分量的地址、数目、跨度信息，访存模块按P₀、P₁、P₂、……P_n的顺序发出各个分量对存储器的访问，由请求仲裁模块负责发出访存请求和返回数据的处理，采用如图3所示的仲裁方法，处理完成的返回数据保存在顶点FIFO中；

如图3所示为顶点仲裁、读取模块的结构，设当前配置命令有m个顶点，m为自然数，P₀、P₁、P₂、……P_n属性配置的地址分别为Addr_P0、Addr_P1、Addr_P2、……Addr_Pn，每个属性的跨度信息分别为Burst_P0、Burst_P1、Burst_P2、……Burst_Pn，分为以下两个同步过程：

1)依次将P₀、P₁、P₂、……P_n属性的访存地址和跨度信息

写入请求FIFO，其中i∈[1，n]，本次所有请求写出后，顶点数目m变为m-1，若此时顶点数目不为0则将各属性地址Addr_Pi变为Addr_Pi+Burst_Pi，再次依次写请求FIFO，如此重复操作，直到顶点数目为0则该组配置命令处理完毕，读FIFO B获取下一组配置命令执行该过程；

Claims

1.GPU中一种实现命令解析和顶点获取并行的装置，其特征为：包含以下模块：

接收命令模块：该模块为一个缓冲区FIFO，用于接收CPU通过总线发送的GPU命令；

命令预解析模块：该模块完成命令的分类，将GPU命令分成参数配置命令、顶点配置命令和图形绘制命令三种；

缓冲区FIFO模块：两个缓冲区FIFO，其中FIFO A用于缓存参数配置命令和图形绘制命令，FIFO B用于缓存顶点配置命令；

顶点仲裁、读取模块：用于将顶点配置命令中提取的信息转化成各顶点属性的读取命令，向存储器发出读取请求，其中的请求仲裁也由本模块完成；

命令解析模块：负责解析FIFO A中的命令，其中解析绘图命令需要得到顶点数据，这些数据需要从顶点缓冲区FIFO中读取；

顶点缓冲区模块：用于接收顶点仲裁、读取模块得到的顶点数据，向命令解析模块提供顶点数据。

2.GPU中一种实现命令解析和顶点获取并行的方法，其特征为：将GPU的绘图命令设计成三种类型：参数配置命令、顶点配置命令和图形绘制命令，设每个顶点的坐标和属性为P₀、P₁、P₂、……P_n，其中n>＝3且为自然数，坐标和属性均为单精度浮点数，为了使命令解析操作和顶点获取操作并行执行，按照以下步骤执行：

步骤1：接收CPU发出的GPU命令；

步骤3：命令解析模块读取FIFO A，得到参数配置命令和绘制命令，这些由命令解析模块执行，参数配置的结果直接发送给对应功能模块，绘制命令解析得到顶点属性各分量的数量信息，然后按照各分量的个数直接从FIFO中获取相应的顶点数据发送给下一级模块处理；同时，顶点获取模块读取FIFO B，根据顶点配置命令得到各个顶点属性分量的地址、数目、跨度信息，访存模块按P₀、P₁、P₂、……P_n的顺序发出各个分量对存储器的访问，由请求仲裁模块负责发出访存请求和返回数据的处理，处理完成的返回数据保存在顶点FIFO中；利用顶点FIFO实现顶点仲裁、读取写顶点FIFO，命令解析读顶点FIFO的并行操作。

3.根据权利要求2所述的GPU中一种实现命令解析和顶点获取并行的方法，其特征为：所述的步骤3中的请求仲裁模块，其实现的仲裁方式为：设当前顶点配置命令有m个顶点，m为自然数，P₀、P₁、P₂、……P_n属性配置的地址分别为Addr_P0、Addr_P1、Addr_P2、……Addr_Pn，每个属性的跨度信息分别为Burst_P0、Burst_P1、Burst_P2、……Burst_Pn，分为以下两个同步执行过程：

1)依次将P₀、P₁、P₂、……P_n属性的访存地址和跨度信息

写入请求FIFO，其中i∈[1,n]，本次所有请求写出后，顶点数目m变为m-1，若此时顶点数目不为0则将各属性地址Addr_Pi变为Addr_Pi+Burst_Pi，再次依次写请求FIFO，如此重复操作，直到顶点数目为0则该组配置命令处理完毕，读FIFO B获取下一组配置命令执行该过程；