CN104156910A

CN104156910A - 一种高效顶点处理装置及处理方法

Info

Publication number: CN104156910A
Application number: CN201410414904.9A
Authority: CN
Inventors: 孙涛; 周莉; 刘泊志; 曹成; 章元智
Original assignee: University of Jinan
Current assignee: University of Jinan
Priority date: 2014-08-22
Filing date: 2014-08-22
Publication date: 2014-11-19

Abstract

本发明公开了一种高效顶点处理装置，包括变换矩阵存储器、顶点存储器和投影矩阵存储器，其特征是：所述变换矩阵存储器连接变换矩阵载入先进先出存储单元，所述顶点存储器连接顶点输入先进先出存储单元，所述投影矩阵存储器连接投影矩阵载入单元，所述变换矩阵载入先进先出存储单元连接变换矩阵生成单元，所述顶点输入先进先出存储单元连接坐标变换单元，所述投影矩阵载入单元连接投影单元，所述变换矩阵生成单元连接所述坐标变换单元，所述坐标变换单元连接所述投影单元，所述投影单元连接顶点输出先进先出存储单元。本发明能够减少顶点变换所需要的硬件资源，从而优化GPU的结构，减少完成顶点变换所需要的时间。

Description

一种高效顶点处理装置及处理方法

技术领域

本发明涉及GPU图形处理中的顶点变换处理领域，具体地讲，涉及一种高效顶点处理装置及处理方法。

背景技术

随着材料技术、半导体技术和计算机科学的迅猛发展，图形显示技术也有2D的平面模型显示发展到今天得富有真实感的3D图形显示。在计算机中实现显示世界的场景称为真实感绘制。真实感绘制的主要任务是模拟真实物体的形状、光学特征、表面纹理和粗糙程度，以及物体之间的相对位置、遮挡关系等等。在图形处理发展的初期，图形绘制工作全部由计算机的CPU完成，但是由于图形绘制的运算量极大，CPU的处理速度无法跟上图形显示的要求。随着技术的发展，图形处理单元的出现使图形绘制的概念彻底发生了变化，使实时绘制成为了可能，然而实时绘制对图形处理单元的运算有效性及运算速度的改进又提出了要求。

3D图形绘制是真实感图形绘制的基础，作用是将一个3D的场景绘制在一个2D的屏幕中。一个3D图形绘制系统一般由三大部分组成，应用部分，几何部分和光栅部分。其中几何部分负责对多边形的顶点进行操作。典型的操作包括坐标转换、光照和裁剪。几何部分对每个顶点或者三角面进行操作，其中坐标变换和投影变换占的比重较大。

坐标系变换是用户对场景进行定向、变形、动画等处理的重要手段。从开始的模型坐标系的变换到最后的屏幕坐标系的变换，坐标系变换贯穿整个几何部分。

坐标系的所有变换都可以通过乘一个矩阵来实现。对于一个三维图形变换矩阵，应该采用4×4的矩阵表示，并将其称为齐次变换矩阵T

模型坐标系到观察坐标系的变换可以分两个步骤进行：模型坐标系到世界坐标系的变换；世界坐标系到观察坐标系的变换。其中基本的变换包括平移、旋转、缩放等等。

一般说来，模型到世界坐标系的变换是上面几种变换的组合。实际上不需要对每一个顶点进行同样的多级变换，而是先将需要进行的变换矩阵组合起来。这个组合方法叫做变换级联。将多个变换矩阵组合成单个矩阵可以有效提高变换的效率。

投影变换将位于视锥体内的物体投影到一个单位正方体，也就是从观察坐标系到裁剪坐标系的变换。以为视锥体的形式不同，可以将投影分为平行投影和透视投影。平行投影以一个立方体作为视锥体，物体无论远近，都具有一样的大小；而透视投影选择一个视锥体，与人眼看到的景物相似，远处的物体会显得小一些，适合用于真实感图形的绘制。

假如用(l,r,b,t,n,f)表示视锥体左、右、下、上、近、远平面，则平行投影的转换矩阵如下：

透视投影的转换矩阵如下：

这两个矩阵将视锥体映射到单位立方体中，具体是：近平面映射到平面z=-1；远平面映射到平面z=1；左平面映射到平面x=-1；右平面映射到平面x=1；下平面映射到平面y=-1；上平面映射到平面y=1。

发明内容

本发明要解决的技术问题是提供一种高效顶点处理装置及处理方法，减少完成顶点变换所需要的时间。

本发明采用如下技术手段实现发明目的：

一种高效顶点处理装置，包括变换矩阵存储器、顶点存储器和投影矩阵存储器，其特征是：所述变换矩阵存储器连接变换矩阵载入先进先出存储单元，所述顶点存储器连接顶点输入先进先出存储单元，所述投影矩阵存储器连接投影矩阵载入单元，所述变换矩阵载入先进先出存储单元连接变换矩阵生成单元，所述顶点输入先进先出存储单元连接坐标变换单元，所述投影矩阵载入单元连接投影单元，所述变换矩阵生成单元连接所述坐标变换单元，所述坐标变换单元连接所述投影单元，所述投影单元连接顶点输出先进先出存储单元。

作为对本技术方案的进一步限定，所述变换矩阵生成单元包括：

变换矩阵分配控制器：根据所需进行的操作对相应的变换矩阵中的参数进行赋值，并将其载入到变换矩阵先进先出存储单元中，用于控制变换矩阵的级联操作；

顶点变换矩阵生成乘法器：采用高精度的矩阵乘法器，能实现4×4矩阵与4×4矩阵的乘法运算，用于进行顶点变换所需要的变换矩阵的级联。

作为对本技术方案的进一步限定，所述坐标变换单元包括：

顶点运算矩阵乘法器：能实现4×4矩阵与4×1矩阵的乘法运算，完成顶点与变换矩阵的乘法运算；

数据暂存器：缓存经顶点运算矩阵乘法器计算后得到的顶点数据。

作为对本技术方案的进一步限定，所述投影单元包括：

投影运算矩阵乘法器：能实现4×4矩阵与4×1矩阵的乘法运算，完成顶点与投影矩阵的乘法运算；

投影变换控制器：控制投影运算矩阵乘法器利用顶点与投影矩阵的乘法运算完成投影操作。

作为对本技术方案的进一步限定，所述顶点变换矩阵生成乘法器包括3个4×4矩阵寄存器。

作为对本技术方案的进一步限定，所述顶点运算乘法器包括2个4×4矩阵寄存器和1个4×1矩阵寄存器。

作为对本技术方案的进一步限定，所述投影运算矩阵乘法器包括2个4×4矩阵寄存器和1个4×1矩阵寄存器。

作为对本技术方案的进一步限定，所述变换矩阵存储器中存储有平移、缩放、绕x轴旋转、绕y轴旋转、绕z轴旋转共五种变换矩阵。

本发明还公开了一种高效顶点处理方法，其特征在于，包括如下步骤：

（1）初始化顶点变换矩阵生成乘法器、顶点运算矩阵乘法器和投影运算矩阵乘法器中的4×4矩阵寄存器为单位矩阵；

（2）在变换矩阵分配控制器的控制下，从变换矩阵存储器中读入一个矩阵到变换矩阵载入先进先出存储单元中，将变换矩阵载入先进先出存储单元中的变换矩阵送进顶点变换矩阵生成乘法器中进行运算，同时从变换矩阵存储器中读入所需进行操作的另一个矩阵到变换矩阵载入先进先出存储单元中；

（3）判断所需进行级联的变换矩阵是否级联完毕，即变换矩阵载入先进先出存储单元是否为空，如果没有级联完毕，则将相乘得到的矩阵送入顶点变换矩阵生成乘法器的其中一个4×4矩阵寄存器中，转步骤（2），否则将所得到的变换矩阵送入顶点运算矩阵乘法器的一个4×4矩阵寄存器中；

（4）将顶点数据通过顶点输入先进先出存储单元送到顶点运算矩阵乘法器中的一个4×1寄存器中，与步骤（3）中得到的变换矩阵进行乘法运算，得到的顶点数据暂存到数据暂存器中；

（5）将投影矩阵载入到投影运算矩阵乘法器的一个4×4矩阵寄存器中，同时将步骤（4）中暂存的顶点数据载入到投影运算矩阵乘法器中的4×1矩阵寄存器中，与投影矩阵进行乘法运算完成投影操作后经由顶点输出先进先出存储单元输出。

与现有技术相比，本发明的优点和积极效果是：本发明采用管道式设计，可以减少顶点变换处理所需要的硬件资源，从而优化GPU的结构，减少完成顶点变换所需的时间。

附图说明

图1为本发明的原理方框图。

图2为本发明具体结构示意图。

具体实施方式

下面结合附图和优选实施例对本发明作更进一步的详细描述。

参见图1和图2，本发明包括变换矩阵存储器、顶点存储器和投影矩阵存储器，变换矩阵存储器存储进行每一个基本操作所需要的变换矩阵，包括平移、缩放、绕x轴旋转、绕y轴旋转、绕z轴旋转共五种变换矩阵，该部分的矩阵完成由模型坐标系到世界坐标系的变换。顶点存储器用于存储需要进行顶点运算的顶点数据。投影矩阵存储器存储两种投影矩阵，投影矩阵完成图形的投影操作。变换矩阵存储器、顶点存储器和投影矩阵存储器均采用现有技术，在此不再赘述。

所述变换矩阵存储器连接变换矩阵载入先进先出存储单元，利用先进先出结构进行并行运算可以增加运算效率。所述顶点存储器连接顶点输入先进先出存储单元，所述投影矩阵存储器连接投影矩阵载入单元，所述变换矩阵载入先进先出存储单元连接变换矩阵生成单元，所述顶点输入先进先出存储单元连接坐标变换单元，所述投影矩阵载入单元连接投影单元，所述变换矩阵生成单元连接所述坐标变换单元，所述坐标变换单元连接所述投影单元，所述投影单元连接顶点输出先进先出存储单元。变换矩阵载入先进先出存储单元、顶点输入先进先出存储单元和投影矩阵载入单元均采用现有技术，在此不再赘述。

所述变换矩阵生成单元包括：

所述坐标变换单元包括：

所述投影单元包括：

所述顶点变换矩阵生成乘法器包括3个4×4矩阵寄存器。

所述顶点运算乘法器包括2个4×4矩阵寄存器和1个4×1矩阵寄存器。

所述投影运算矩阵乘法器包括2个4×4矩阵寄存器和1个4×1矩阵寄存器。

所述变换矩阵存储器中存储有平移、缩放、绕x轴旋转、绕y轴旋转、绕z轴旋转共五种变换矩阵。

本发明还公开了一种高效顶点处理方法，包括如下步骤：

本发明未经描述的技术特征可以通过或采用现有技术实现，在此不再赘述，当然，上述说明并非是对本发明的限制，本发明也并不仅限于上述举例，本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改型、添加或替换，也应属于本发明的保护范围。

Claims

1.一种高效顶点处理装置，包括变换矩阵存储器、顶点存储器和投影矩阵存储器，其特征是：所述变换矩阵存储器连接变换矩阵载入先进先出存储单元，所述顶点存储器连接顶点输入先进先出存储单元，所述投影矩阵存储器连接投影矩阵载入单元，所述变换矩阵载入先进先出存储单元连接变换矩阵生成单元，所述顶点输入先进先出存储单元连接坐标变换单元，所述投影矩阵载入单元连接投影单元，所述变换矩阵生成单元连接所述坐标变换单元，所述坐标变换单元连接所述投影单元，所述投影单元连接顶点输出先进先出存储单元。

2.根据权利要求1所述的高效顶点处理装置，其特征是：所述变换矩阵生成单元包括：

3.根据权利要求1所述的高效顶点处理装置，其特征是：所述坐标变换单元包括：

4.根据权利要求1所述的高效顶点处理装置，其特征是：所述投影单元包括：

5.根据权利要求2所述的高效顶点处理装置，其特征是：所述顶点变换矩阵生成乘法器包括3个4×4矩阵寄存器。

6.根据权利要求3所述的高效顶点处理装置，其特征是：所述顶点运算乘法器包括2个4×4矩阵寄存器和1个4×1矩阵寄存器。

7.根据权利要求4所述的高效顶点处理装置，其特征是：所述投影运算矩阵乘法器包括2个4×4矩阵寄存器和1个4×1矩阵寄存器。

8.根据权利要求1所述的高效顶点处理装置，其特征是：所述变换矩阵存储器中存储有平移、缩放、绕x轴旋转、绕y轴旋转、绕z轴旋转共五种变换矩阵。

9.一种高效顶点处理方法，其特征在于，包括如下步骤：