CN110992240A - 一种可编程纹理处理器系统 - Google Patents
一种可编程纹理处理器系统 Download PDFInfo
- Publication number
- CN110992240A CN110992240A CN201911125798.1A CN201911125798A CN110992240A CN 110992240 A CN110992240 A CN 110992240A CN 201911125798 A CN201911125798 A CN 201911125798A CN 110992240 A CN110992240 A CN 110992240A
- Authority
- CN
- China
- Prior art keywords
- texture
- texel
- unit
- request
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 35
- 238000007781 pre-processing Methods 0.000 claims abstract description 32
- 230000006837 decompression Effects 0.000 claims abstract description 22
- 238000005070 sampling Methods 0.000 claims description 4
- 238000009877 rendering Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/40—Filling a planar surface by adding surface attributes, e.g. colour or texture
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Generation (AREA)
Abstract
本发明提供了一种可编程纹理处理器系统,该系统包含依次连接的纹理指令译码与输入参数存储单元101,纹理请求预处理单元10,纹理cache107,解压缩与格式转换单元108,插值单元109,格式转换单元110;所述纹素请求预处理单元10包括纹理参数查询子单元104,单纹素获取子单元105,多纹素获取子单元106。本发明提供的可编程纹理处理器系统增加了纹理贴图操作的灵活性,提高了纹理贴图操作的效率,从而提升了顶点处理吞吐率和像素生成能力。
Description
技术领域
本发明涉及计算机硬件技术领域,尤其涉及一种可编程纹理处理器系统。
背景技术
随着图形化应用的不断增加,早期单靠CPU进行图形绘制的解决方案已经难以满足成绩和技术增长的图形处理需求,图形处理器(Graphic Processing Unit,GPU)应运而生。从1999年Nvidia发布第一款GPU产品至今,GPU技术的发展主要经历了固定功能流水线阶段、分离着色器架构阶段、统一着色器架构阶段,其图形处理能力不断提升,应用领域也从最初的图形绘制逐步扩展到通用计算领域。GPU流水线高速、并行的特征和灵活的可编程能力,为图形处理和通用并行计算提供了良好的运行平台。
目前,在军用领域中,国外进口商用GPU芯片存在温度和环境适应性差、无法保证电路本身或配套软件没有“后门”、包含大量军用领域不需要的冗余功能单元,功耗指标无法满足要求、商用GPU芯片更新换代快,随时面临停产、断档,难以满足武器装备持续保障等缺陷,在安全性、可靠性、保障性等方面的存在重大隐患。GPU芯片的底层技术资料无法获得,如寄存器资料、详细的微架构、核心软件源码等,导致GPU功能、性能无法充分发挥,且移植性较差;上述问题严重制约了显示系统的独立研制和自主发展。
高度并行化可编程的3D引擎是提升和增强GPU图形处理能力的关键技术,尤其是突破3D引擎可编程纹理贴图关键技术,研制高性能图形处理器芯片迫在眉睫。
发明内容
本发明的目的:本发明公开了一种可编程纹理处理器系统,通过实现可编程性,提高纹理贴图操作的灵活性;通过设置多种执行通路、为多种数据采样操作提供硬件加速,从而提高GPU的绘制性能或者数据处理性能。
本发明的技术解决方案是:
本发明提供了一种可编程纹理处理器系统,该系统包含依次连接的纹理指令译码与输入参数存储单元101,纹理请求预处理单元10,纹理cache107,解压缩与格式转换单元108,插值单元109,格式转换单元110;
所述纹素请求预处理单元10包括纹理参数查询子单元104,单纹素获取子单元105,多纹素获取子单元106。
进一步的,所述纹理指令译码与输入参数存储单元101从固定关联的着色核200依次接收纹理指令编码和多个输入参数;根据纹理指令的编码将纹理指令控制信息和多个输入参数打包为纹理请求命令包转发给纹素请求预处理单元10。
进一步的,所述纹素请求预处理单元10根据纹理请求命令包的类型选择不同的子单元实施预处理操作,将纹理请求命令包中的纹理请求的控制信息以及对应子单元预处理操作后得到的数据发给固定关联的纹理cache107。
进一步的,所述纹理参数查询子单元104用于获取指定纹理图像的参数。
进一步的,所述单纹素获取子单元105用于根据纹理请求携带的纹理地址,结合纹理请求的控制信息,计算出1个纹素地址从外部存储器300获取1个纹素数据。
进一步的,所述多纹素获取子单元106用于根据纹理请求携带的纹理地址,结合纹理请求的控制信息,计算出n个纹素地址,从外部存储器300获取n个纹素数据。
进一步的,若所述纹素请求预处理单元10中单纹素获取子单元105或多纹素获取子单元106实施预处理操作,所述纹理cache107用于存储多种数据类型的纹素数据,所述纹素数据包括整型和浮点类型RGBA格式;如果纹理cache107命中,则从纹理cache107获取1~n个纹素数据;如果纹理cache107不命中,则将1~n个纹素采样地址及控制信息转发给固定关联的外部存储器300,外部存储器300为纹理cache107返回1~n个纹素数据;纹理cache107将1~n个纹素数据和纹素请求的控制信息转发给固定关联的解压缩与格式转换单元108;
若所述纹素请求预处理单元10中纹理参数查询子单元104实施预处理操作,则将纹理参数查询子单元104发送的纹理图像的参数和纹素请求的控制信息直接转发给固定关联的解压缩与格式转换单元108。
进一步的,所述解压缩与格式转换单元108依次完成解压缩操作和格式转换操作;
解压缩与格式转换单元108获取的纹素数据为压缩格式则对1~n个纹素数据执行解压缩操作;依据纹素数据格式、数据类型和纹理请求的控制信息对1~n个纹素数据实施格式转换操作,将处理完毕的1~n个浮点格式RGBA纹素数据和纹理请求的控制信息转发给固定关联的插值单元109。
进一步的,所述插值单元109根据纹理请求的控制信息对1~n个浮点格式的RGBA纹素数据的4个分量R、G、B、A并行实施纹素插值操作;
所述纹素插值操作包括线性纹素插值操作、双线性纹素插值操作和三线性纹素插值操作;
插值单元109产生1个浮点格式的RGBA纹素数据,将1个浮点格式的RGBA纹素数据和纹理请求的控制信息转发给格式转换单元110。
进一步的,所述格式转换单元110依据纹理请求的控制信息对1个浮点格式的RGBA纹素数据执行格式转换操作,产生1个整型或者浮点格式的RGBA纹素数据,转发给固定关联的着色核200。
本发明的技术效果是:
本发明提供的可编程纹理处理器系统增加了纹理贴图操作的灵活性,提高了纹理贴图操作的效率,从而提升了顶点处理吞吐率和像素生成能力。
附图说明
图1是本发明一种可编程纹理处理器系统的模块图。
具体实施方式
下面结合附图和具体实施例,对本发明的技术方案进行清楚、完整地表述。显然,所表述的实施例仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提所获得的所有其它实施例,都属于本发明的保护范围。
如图1所示,为本发明提供的一种可编程纹理处理器系统的模块图,
该系统包含依次连接的纹理指令译码与输入参数存储单元101,纹理请求预处理单元10,纹理cache107,解压缩与格式转换单元108,插值单元109,格式转换单元110;
所述纹素请求预处理单元10包括纹理参数查询子单元104,单纹素获取子单元105,多纹素获取子单元106。
所述纹理指令译码与输入参数存储单元101从固定关联的着色核200依次接收纹理指令编码和多个输入参数;根据纹理指令的编码将纹理指令控制信息和多个输入参数打包为纹理请求命令包转发给纹素请求预处理单元10。
所述纹素请求预处理单元10根据纹理请求命令包的类型选择不同的子单元实施预处理操作,将纹理请求命令包中的纹理请求的控制信息以及对应子单元预处理操作后得到的数据发给固定关联的纹理cache107。
所述纹理参数查询子单元104用于获取指定纹理图像的参数。
所述单纹素获取子单元105用于根据纹理请求携带的纹理地址,结合纹理请求的控制信息,计算出1个纹素地址从外部存储器300获取1个纹素数据。
所述多纹素获取子单元106用于根据纹理请求携带的纹理地址,结合纹理请求的控制信息,计算出n个纹素地址,从外部存储器300获取n个纹素数据。
若所述纹素请求预处理单元10中单纹素获取子单元105或多纹素获取子单元106实施预处理操作,所述纹理cache107用于存储多种数据类型的纹素数据,所述纹素数据包括整型和浮点类型RGBA格式;如果纹理cache107命中,则从纹理cache107获取1~n个纹素数据;如果纹理cache107不命中,则将1~n个纹素采样地址及控制信息转发给固定关联的外部存储器300,外部存储器300为纹理cache107返回1~n个纹素数据;纹理cache107将1~n个纹素数据和纹素请求的控制信息转发给固定关联的解压缩与格式转换单元108;
若所述纹素请求预处理单元10中纹理参数查询子单元104实施预处理操作,则将纹理参数查询子单元104发送的纹理图像的参数和纹素请求的控制信息直接转发给固定关联的解压缩与格式转换单元108。
所述解压缩与格式转换单元108依次完成解压缩操作和格式转换操作;
解压缩与格式转换单元108获取的纹素数据为压缩格式则对1~n个纹素数据执行解压缩操作;依据纹素数据格式、数据类型和纹理请求的控制信息对1~n个纹素数据实施格式转换操作,将处理完毕的1~n个浮点格式RGBA纹素数据和纹理请求的控制信息转发给固定关联的插值单元109。
所述插值单元109根据纹理请求的控制信息对1~n个浮点格式的RGBA纹素数据的4个分量R、G、B、A并行实施纹素插值操作;
所述纹素插值操作包括线性纹素插值操作、双线性纹素插值操作和三线性纹素插值操作;
插值单元109产生1个浮点格式的RGBA纹素数据,将1个浮点格式的RGBA纹素数据和纹理请求的控制信息转发给格式转换单元110。
所述格式转换单元110依据纹理请求的控制信息对1个浮点格式的RGBA纹素数据执行格式转换操作,产生1个整型或者浮点格式的RGBA纹素数据,转发给固定关联的着色核200。
Claims (10)
1.一种可编程纹理处理器系统,其特征在于:所述系统包含依次连接的纹理指令译码与输入参数存储单元101,纹理请求预处理单元10,纹理cache107,解压缩与格式转换单元108,插值单元109,格式转换单元110;
所述纹素请求预处理单元10包括纹理参数查询子单元104,单纹素获取子单元105,多纹素获取子单元106。
2.根据权利要求1所述的可编程纹理处理器系统,其特征在于:所述纹理指令译码与输入参数存储单元101从固定关联的着色核200依次接收纹理指令编码和多个输入参数;根据纹理指令的编码将纹理指令控制信息和多个输入参数打包为纹理请求命令包转发给纹素请求预处理单元10。
3.根据权利要求1所述的可编程纹理处理器系统,其特征在于:所述纹素请求预处理单元10根据纹理请求命令包的类型选择不同的子单元实施预处理操作,将纹理请求命令包中的纹理请求的控制信息以及对应子单元预处理操作后得到的数据发给固定关联的纹理cache107。
4.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
所述纹理参数查询子单元104用于获取指定纹理图像的参数。
5.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
所述单纹素获取子单元105用于根据纹理请求携带的纹理地址,结合纹理请求的控制信息,计算出1个纹素地址从外部存储器300获取1个纹素数据。
6.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
所述多纹素获取子单元106用于根据纹理请求携带的纹理地址,结合纹理请求的控制信息,计算出n个纹素地址,从外部存储器300获取n个纹素数据。
7.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
若所述纹素请求预处理单元10中单纹素获取子单元105或多纹素获取子单元106实施预处理操作,所述纹理cache107用于存储多种数据类型的纹素数据,所述纹素数据包括整型和浮点类型RGBA格式;如果纹理cache107命中,则从纹理cache107获取1~n个纹素数据;如果纹理cache107不命中,则将1~n个纹素采样地址及控制信息转发给固定关联的外部存储器300,外部存储器300为纹理cache107返回1~n个纹素数据;纹理cache107将1~n个纹素数据和纹素请求的控制信息转发给固定关联的解压缩与格式转换单元108;
若所述纹素请求预处理单元10中纹理参数查询子单元104实施预处理操作,则将纹理参数查询子单元104发送的纹理图像的参数和纹素请求的控制信息直接转发给固定关联的解压缩与格式转换单元108。
8.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
所述解压缩与格式转换单元108依次完成解压缩操作和格式转换操作;
解压缩与格式转换单元108获取的纹素数据为压缩格式则对1~n个纹素数据执行解压缩操作;依据纹素数据格式、数据类型和纹理请求的控制信息对1~n个纹素数据实施格式转换操作,将处理完毕的1~n个浮点格式RGBA纹素数据和纹理请求的控制信息转发给固定关联的插值单元109。
9.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
所述插值单元109根据纹理请求的控制信息对1~n个浮点格式的RGBA纹素数据的4个分量R、G、B、A并行实施纹素插值操作;
所述纹素插值操作包括线性纹素插值操作、双线性纹素插值操作和三线性纹素插值操作;
插值单元109产生1个浮点格式的RGBA纹素数据,将1个浮点格式的RGBA纹素数据和纹理请求的控制信息转发给格式转换单元110。
10.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
所述格式转换单元110依据纹理请求的控制信息对1个浮点格式的RGBA纹素数据执行格式转换操作,产生1个整型或者浮点格式的RGBA纹素数据,转发给固定关联的着色核200。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911125798.1A CN110992240A (zh) | 2019-11-18 | 2019-11-18 | 一种可编程纹理处理器系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911125798.1A CN110992240A (zh) | 2019-11-18 | 2019-11-18 | 一种可编程纹理处理器系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110992240A true CN110992240A (zh) | 2020-04-10 |
Family
ID=70084726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911125798.1A Pending CN110992240A (zh) | 2019-11-18 | 2019-11-18 | 一种可编程纹理处理器系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110992240A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112581575A (zh) * | 2020-12-05 | 2021-03-30 | 西安翔腾微电子科技有限公司 | 一种外视频做纹理系统 |
CN113034629A (zh) * | 2021-05-17 | 2021-06-25 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7109999B1 (en) * | 2003-05-29 | 2006-09-19 | Nvidia Corporation | Method and system for implementing programmable texture lookups from texture coordinate sets |
CN103503032A (zh) * | 2011-05-02 | 2014-01-08 | 索尼电脑娱乐公司 | 图形硬件中的纹理化 |
US20150187089A1 (en) * | 2013-12-27 | 2015-07-02 | Aleksander Olek Neyman | Dynamic programmable texture sampler for flexible filtering of graphical texture data |
CN106408634A (zh) * | 2015-07-29 | 2017-02-15 | 三星电子株式会社 | 纹理处理设备和方法 |
CN106683171A (zh) * | 2016-12-12 | 2017-05-17 | 中国航空工业集团公司西安航空计算技术研究所 | 一种GPU多线程纹理映射SystemC建模结构 |
CN106683158A (zh) * | 2016-12-12 | 2017-05-17 | 中国航空工业集团公司西安航空计算技术研究所 | 一种GPU纹理映射非阻塞存储Cache的建模结构 |
US20170256025A1 (en) * | 2016-03-04 | 2017-09-07 | Samsung Electronics Co., Ltd. | Efficient low-power texture cache architecture |
CN107153617A (zh) * | 2016-03-04 | 2017-09-12 | 三星电子株式会社 | 用于利用缓冲器高效访问纹理数据的高速缓存体系结构 |
CN108022269A (zh) * | 2017-11-24 | 2018-05-11 | 中国航空工业集团公司西安航空计算技术研究所 | 一种GPU压缩纹理存储Cache的建模结构 |
CN109615685A (zh) * | 2018-11-14 | 2019-04-12 | 西安翔腾微电子科技有限公司 | 基于uml面向gpu纹理贴图的硬件视图模型及纹理执行方法 |
-
2019
- 2019-11-18 CN CN201911125798.1A patent/CN110992240A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7109999B1 (en) * | 2003-05-29 | 2006-09-19 | Nvidia Corporation | Method and system for implementing programmable texture lookups from texture coordinate sets |
CN103503032A (zh) * | 2011-05-02 | 2014-01-08 | 索尼电脑娱乐公司 | 图形硬件中的纹理化 |
US20150187089A1 (en) * | 2013-12-27 | 2015-07-02 | Aleksander Olek Neyman | Dynamic programmable texture sampler for flexible filtering of graphical texture data |
CN106408634A (zh) * | 2015-07-29 | 2017-02-15 | 三星电子株式会社 | 纹理处理设备和方法 |
US20170256025A1 (en) * | 2016-03-04 | 2017-09-07 | Samsung Electronics Co., Ltd. | Efficient low-power texture cache architecture |
CN107153617A (zh) * | 2016-03-04 | 2017-09-12 | 三星电子株式会社 | 用于利用缓冲器高效访问纹理数据的高速缓存体系结构 |
CN106683171A (zh) * | 2016-12-12 | 2017-05-17 | 中国航空工业集团公司西安航空计算技术研究所 | 一种GPU多线程纹理映射SystemC建模结构 |
CN106683158A (zh) * | 2016-12-12 | 2017-05-17 | 中国航空工业集团公司西安航空计算技术研究所 | 一种GPU纹理映射非阻塞存储Cache的建模结构 |
CN108022269A (zh) * | 2017-11-24 | 2018-05-11 | 中国航空工业集团公司西安航空计算技术研究所 | 一种GPU压缩纹理存储Cache的建模结构 |
CN109615685A (zh) * | 2018-11-14 | 2019-04-12 | 西安翔腾微电子科技有限公司 | 基于uml面向gpu纹理贴图的硬件视图模型及纹理执行方法 |
Non-Patent Citations (1)
Title |
---|
韩立敏 等 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112581575A (zh) * | 2020-12-05 | 2021-03-30 | 西安翔腾微电子科技有限公司 | 一种外视频做纹理系统 |
CN112581575B (zh) * | 2020-12-05 | 2024-05-03 | 西安翔腾微电子科技有限公司 | 一种外视频做纹理系统 |
CN113034629A (zh) * | 2021-05-17 | 2021-06-25 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220222770A1 (en) | Graphics processing architecture employing a unified shader | |
US10719447B2 (en) | Cache and compression interoperability in a graphics processor pipeline | |
US9576340B2 (en) | Render-assisted compression for remote graphics | |
US9449362B2 (en) | Techniques for reducing accesses for retrieving texture images | |
US11941752B2 (en) | Streaming a compressed light field | |
US10559112B2 (en) | Hybrid mechanism for efficient rendering of graphics images in computing environments | |
WO2017172053A2 (en) | Method and apparatus for multi format lossless compression | |
US11501467B2 (en) | Streaming a light field compressed utilizing lossless or lossy compression | |
CN110992240A (zh) | 一种可编程纹理处理器系统 | |
WO2014182469A1 (en) | Improved multi-sampling anti-aliasing compression by use of unreachable bit combinations | |
WO2018052512A2 (en) | Load-balanced tessellation distribution for parallel architectures | |
US9959590B2 (en) | System and method of caching for pixel synchronization-based graphics techniques | |
CN106780289B (zh) | 基于渲染模式自适应的图形处理器统一染色阵列旁路结构 | |
EP4220431A1 (en) | Data processing method and related apparatus | |
CN112581575A (zh) | 一种外视频做纹理系统 | |
JP4749824B2 (ja) | グラフィックスシステム | |
WO2024001699A1 (zh) | 一种着色器输入数据的处理方法和图形处理装置 | |
Kim et al. | Bank-partition and multi-fetch scheme for floating-point special function units in multi-core systems | |
KR20140023794A (ko) | 오브젝트 렌더링 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200410 |