CN110992240A - 一种可编程纹理处理器系统 - Google Patents

一种可编程纹理处理器系统 Download PDF

Info

Publication number
CN110992240A
CN110992240A CN201911125798.1A CN201911125798A CN110992240A CN 110992240 A CN110992240 A CN 110992240A CN 201911125798 A CN201911125798 A CN 201911125798A CN 110992240 A CN110992240 A CN 110992240A
Authority
CN
China
Prior art keywords
texture
texel
unit
request
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911125798.1A
Other languages
English (en)
Inventor
韩立敏
田泽
张骏
任向隆
郑新建
刘晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Aeronautics Computing Technique Research Institute of AVIC
Original Assignee
Xian Aeronautics Computing Technique Research Institute of AVIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Aeronautics Computing Technique Research Institute of AVIC filed Critical Xian Aeronautics Computing Technique Research Institute of AVIC
Priority to CN201911125798.1A priority Critical patent/CN110992240A/zh
Publication of CN110992240A publication Critical patent/CN110992240A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Generation (AREA)

Abstract

本发明提供了一种可编程纹理处理器系统,该系统包含依次连接的纹理指令译码与输入参数存储单元101,纹理请求预处理单元10,纹理cache107,解压缩与格式转换单元108,插值单元109,格式转换单元110;所述纹素请求预处理单元10包括纹理参数查询子单元104,单纹素获取子单元105,多纹素获取子单元106。本发明提供的可编程纹理处理器系统增加了纹理贴图操作的灵活性,提高了纹理贴图操作的效率,从而提升了顶点处理吞吐率和像素生成能力。

Description

一种可编程纹理处理器系统
技术领域
本发明涉及计算机硬件技术领域,尤其涉及一种可编程纹理处理器系统。
背景技术
随着图形化应用的不断增加,早期单靠CPU进行图形绘制的解决方案已经难以满足成绩和技术增长的图形处理需求,图形处理器(Graphic Processing Unit,GPU)应运而生。从1999年Nvidia发布第一款GPU产品至今,GPU技术的发展主要经历了固定功能流水线阶段、分离着色器架构阶段、统一着色器架构阶段,其图形处理能力不断提升,应用领域也从最初的图形绘制逐步扩展到通用计算领域。GPU流水线高速、并行的特征和灵活的可编程能力,为图形处理和通用并行计算提供了良好的运行平台。
目前,在军用领域中,国外进口商用GPU芯片存在温度和环境适应性差、无法保证电路本身或配套软件没有“后门”、包含大量军用领域不需要的冗余功能单元,功耗指标无法满足要求、商用GPU芯片更新换代快,随时面临停产、断档,难以满足武器装备持续保障等缺陷,在安全性、可靠性、保障性等方面的存在重大隐患。GPU芯片的底层技术资料无法获得,如寄存器资料、详细的微架构、核心软件源码等,导致GPU功能、性能无法充分发挥,且移植性较差;上述问题严重制约了显示系统的独立研制和自主发展。
高度并行化可编程的3D引擎是提升和增强GPU图形处理能力的关键技术,尤其是突破3D引擎可编程纹理贴图关键技术,研制高性能图形处理器芯片迫在眉睫。
发明内容
本发明的目的:本发明公开了一种可编程纹理处理器系统,通过实现可编程性,提高纹理贴图操作的灵活性;通过设置多种执行通路、为多种数据采样操作提供硬件加速,从而提高GPU的绘制性能或者数据处理性能。
本发明的技术解决方案是:
本发明提供了一种可编程纹理处理器系统,该系统包含依次连接的纹理指令译码与输入参数存储单元101,纹理请求预处理单元10,纹理cache107,解压缩与格式转换单元108,插值单元109,格式转换单元110;
所述纹素请求预处理单元10包括纹理参数查询子单元104,单纹素获取子单元105,多纹素获取子单元106。
进一步的,所述纹理指令译码与输入参数存储单元101从固定关联的着色核200依次接收纹理指令编码和多个输入参数;根据纹理指令的编码将纹理指令控制信息和多个输入参数打包为纹理请求命令包转发给纹素请求预处理单元10。
进一步的,所述纹素请求预处理单元10根据纹理请求命令包的类型选择不同的子单元实施预处理操作,将纹理请求命令包中的纹理请求的控制信息以及对应子单元预处理操作后得到的数据发给固定关联的纹理cache107。
进一步的,所述纹理参数查询子单元104用于获取指定纹理图像的参数。
进一步的,所述单纹素获取子单元105用于根据纹理请求携带的纹理地址,结合纹理请求的控制信息,计算出1个纹素地址从外部存储器300获取1个纹素数据。
进一步的,所述多纹素获取子单元106用于根据纹理请求携带的纹理地址,结合纹理请求的控制信息,计算出n个纹素地址,从外部存储器300获取n个纹素数据。
进一步的,若所述纹素请求预处理单元10中单纹素获取子单元105或多纹素获取子单元106实施预处理操作,所述纹理cache107用于存储多种数据类型的纹素数据,所述纹素数据包括整型和浮点类型RGBA格式;如果纹理cache107命中,则从纹理cache107获取1~n个纹素数据;如果纹理cache107不命中,则将1~n个纹素采样地址及控制信息转发给固定关联的外部存储器300,外部存储器300为纹理cache107返回1~n个纹素数据;纹理cache107将1~n个纹素数据和纹素请求的控制信息转发给固定关联的解压缩与格式转换单元108;
若所述纹素请求预处理单元10中纹理参数查询子单元104实施预处理操作,则将纹理参数查询子单元104发送的纹理图像的参数和纹素请求的控制信息直接转发给固定关联的解压缩与格式转换单元108。
进一步的,所述解压缩与格式转换单元108依次完成解压缩操作和格式转换操作;
解压缩与格式转换单元108获取的纹素数据为压缩格式则对1~n个纹素数据执行解压缩操作;依据纹素数据格式、数据类型和纹理请求的控制信息对1~n个纹素数据实施格式转换操作,将处理完毕的1~n个浮点格式RGBA纹素数据和纹理请求的控制信息转发给固定关联的插值单元109。
进一步的,所述插值单元109根据纹理请求的控制信息对1~n个浮点格式的RGBA纹素数据的4个分量R、G、B、A并行实施纹素插值操作;
所述纹素插值操作包括线性纹素插值操作、双线性纹素插值操作和三线性纹素插值操作;
插值单元109产生1个浮点格式的RGBA纹素数据,将1个浮点格式的RGBA纹素数据和纹理请求的控制信息转发给格式转换单元110。
进一步的,所述格式转换单元110依据纹理请求的控制信息对1个浮点格式的RGBA纹素数据执行格式转换操作,产生1个整型或者浮点格式的RGBA纹素数据,转发给固定关联的着色核200。
本发明的技术效果是:
本发明提供的可编程纹理处理器系统增加了纹理贴图操作的灵活性,提高了纹理贴图操作的效率,从而提升了顶点处理吞吐率和像素生成能力。
附图说明
图1是本发明一种可编程纹理处理器系统的模块图。
具体实施方式
下面结合附图和具体实施例,对本发明的技术方案进行清楚、完整地表述。显然,所表述的实施例仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提所获得的所有其它实施例,都属于本发明的保护范围。
如图1所示,为本发明提供的一种可编程纹理处理器系统的模块图,
该系统包含依次连接的纹理指令译码与输入参数存储单元101,纹理请求预处理单元10,纹理cache107,解压缩与格式转换单元108,插值单元109,格式转换单元110;
所述纹素请求预处理单元10包括纹理参数查询子单元104,单纹素获取子单元105,多纹素获取子单元106。
所述纹理指令译码与输入参数存储单元101从固定关联的着色核200依次接收纹理指令编码和多个输入参数;根据纹理指令的编码将纹理指令控制信息和多个输入参数打包为纹理请求命令包转发给纹素请求预处理单元10。
所述纹素请求预处理单元10根据纹理请求命令包的类型选择不同的子单元实施预处理操作,将纹理请求命令包中的纹理请求的控制信息以及对应子单元预处理操作后得到的数据发给固定关联的纹理cache107。
所述纹理参数查询子单元104用于获取指定纹理图像的参数。
所述单纹素获取子单元105用于根据纹理请求携带的纹理地址,结合纹理请求的控制信息,计算出1个纹素地址从外部存储器300获取1个纹素数据。
所述多纹素获取子单元106用于根据纹理请求携带的纹理地址,结合纹理请求的控制信息,计算出n个纹素地址,从外部存储器300获取n个纹素数据。
若所述纹素请求预处理单元10中单纹素获取子单元105或多纹素获取子单元106实施预处理操作,所述纹理cache107用于存储多种数据类型的纹素数据,所述纹素数据包括整型和浮点类型RGBA格式;如果纹理cache107命中,则从纹理cache107获取1~n个纹素数据;如果纹理cache107不命中,则将1~n个纹素采样地址及控制信息转发给固定关联的外部存储器300,外部存储器300为纹理cache107返回1~n个纹素数据;纹理cache107将1~n个纹素数据和纹素请求的控制信息转发给固定关联的解压缩与格式转换单元108;
若所述纹素请求预处理单元10中纹理参数查询子单元104实施预处理操作,则将纹理参数查询子单元104发送的纹理图像的参数和纹素请求的控制信息直接转发给固定关联的解压缩与格式转换单元108。
所述解压缩与格式转换单元108依次完成解压缩操作和格式转换操作;
解压缩与格式转换单元108获取的纹素数据为压缩格式则对1~n个纹素数据执行解压缩操作;依据纹素数据格式、数据类型和纹理请求的控制信息对1~n个纹素数据实施格式转换操作,将处理完毕的1~n个浮点格式RGBA纹素数据和纹理请求的控制信息转发给固定关联的插值单元109。
所述插值单元109根据纹理请求的控制信息对1~n个浮点格式的RGBA纹素数据的4个分量R、G、B、A并行实施纹素插值操作;
所述纹素插值操作包括线性纹素插值操作、双线性纹素插值操作和三线性纹素插值操作;
插值单元109产生1个浮点格式的RGBA纹素数据,将1个浮点格式的RGBA纹素数据和纹理请求的控制信息转发给格式转换单元110。
所述格式转换单元110依据纹理请求的控制信息对1个浮点格式的RGBA纹素数据执行格式转换操作,产生1个整型或者浮点格式的RGBA纹素数据,转发给固定关联的着色核200。

Claims (10)

1.一种可编程纹理处理器系统,其特征在于:所述系统包含依次连接的纹理指令译码与输入参数存储单元101,纹理请求预处理单元10,纹理cache107,解压缩与格式转换单元108,插值单元109,格式转换单元110;
所述纹素请求预处理单元10包括纹理参数查询子单元104,单纹素获取子单元105,多纹素获取子单元106。
2.根据权利要求1所述的可编程纹理处理器系统,其特征在于:所述纹理指令译码与输入参数存储单元101从固定关联的着色核200依次接收纹理指令编码和多个输入参数;根据纹理指令的编码将纹理指令控制信息和多个输入参数打包为纹理请求命令包转发给纹素请求预处理单元10。
3.根据权利要求1所述的可编程纹理处理器系统,其特征在于:所述纹素请求预处理单元10根据纹理请求命令包的类型选择不同的子单元实施预处理操作,将纹理请求命令包中的纹理请求的控制信息以及对应子单元预处理操作后得到的数据发给固定关联的纹理cache107。
4.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
所述纹理参数查询子单元104用于获取指定纹理图像的参数。
5.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
所述单纹素获取子单元105用于根据纹理请求携带的纹理地址,结合纹理请求的控制信息,计算出1个纹素地址从外部存储器300获取1个纹素数据。
6.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
所述多纹素获取子单元106用于根据纹理请求携带的纹理地址,结合纹理请求的控制信息,计算出n个纹素地址,从外部存储器300获取n个纹素数据。
7.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
若所述纹素请求预处理单元10中单纹素获取子单元105或多纹素获取子单元106实施预处理操作,所述纹理cache107用于存储多种数据类型的纹素数据,所述纹素数据包括整型和浮点类型RGBA格式;如果纹理cache107命中,则从纹理cache107获取1~n个纹素数据;如果纹理cache107不命中,则将1~n个纹素采样地址及控制信息转发给固定关联的外部存储器300,外部存储器300为纹理cache107返回1~n个纹素数据;纹理cache107将1~n个纹素数据和纹素请求的控制信息转发给固定关联的解压缩与格式转换单元108;
若所述纹素请求预处理单元10中纹理参数查询子单元104实施预处理操作,则将纹理参数查询子单元104发送的纹理图像的参数和纹素请求的控制信息直接转发给固定关联的解压缩与格式转换单元108。
8.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
所述解压缩与格式转换单元108依次完成解压缩操作和格式转换操作;
解压缩与格式转换单元108获取的纹素数据为压缩格式则对1~n个纹素数据执行解压缩操作;依据纹素数据格式、数据类型和纹理请求的控制信息对1~n个纹素数据实施格式转换操作,将处理完毕的1~n个浮点格式RGBA纹素数据和纹理请求的控制信息转发给固定关联的插值单元109。
9.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
所述插值单元109根据纹理请求的控制信息对1~n个浮点格式的RGBA纹素数据的4个分量R、G、B、A并行实施纹素插值操作;
所述纹素插值操作包括线性纹素插值操作、双线性纹素插值操作和三线性纹素插值操作;
插值单元109产生1个浮点格式的RGBA纹素数据,将1个浮点格式的RGBA纹素数据和纹理请求的控制信息转发给格式转换单元110。
10.根据权利要求1所述的可编程纹理处理器系统,其特征在于:
所述格式转换单元110依据纹理请求的控制信息对1个浮点格式的RGBA纹素数据执行格式转换操作,产生1个整型或者浮点格式的RGBA纹素数据,转发给固定关联的着色核200。
CN201911125798.1A 2019-11-18 2019-11-18 一种可编程纹理处理器系统 Pending CN110992240A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911125798.1A CN110992240A (zh) 2019-11-18 2019-11-18 一种可编程纹理处理器系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911125798.1A CN110992240A (zh) 2019-11-18 2019-11-18 一种可编程纹理处理器系统

Publications (1)

Publication Number Publication Date
CN110992240A true CN110992240A (zh) 2020-04-10

Family

ID=70084726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911125798.1A Pending CN110992240A (zh) 2019-11-18 2019-11-18 一种可编程纹理处理器系统

Country Status (1)

Country Link
CN (1) CN110992240A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112581575A (zh) * 2020-12-05 2021-03-30 西安翔腾微电子科技有限公司 一种外视频做纹理系统
CN113034629A (zh) * 2021-05-17 2021-06-25 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7109999B1 (en) * 2003-05-29 2006-09-19 Nvidia Corporation Method and system for implementing programmable texture lookups from texture coordinate sets
CN103503032A (zh) * 2011-05-02 2014-01-08 索尼电脑娱乐公司 图形硬件中的纹理化
US20150187089A1 (en) * 2013-12-27 2015-07-02 Aleksander Olek Neyman Dynamic programmable texture sampler for flexible filtering of graphical texture data
CN106408634A (zh) * 2015-07-29 2017-02-15 三星电子株式会社 纹理处理设备和方法
CN106683171A (zh) * 2016-12-12 2017-05-17 中国航空工业集团公司西安航空计算技术研究所 一种GPU多线程纹理映射SystemC建模结构
CN106683158A (zh) * 2016-12-12 2017-05-17 中国航空工业集团公司西安航空计算技术研究所 一种GPU纹理映射非阻塞存储Cache的建模结构
US20170256025A1 (en) * 2016-03-04 2017-09-07 Samsung Electronics Co., Ltd. Efficient low-power texture cache architecture
CN107153617A (zh) * 2016-03-04 2017-09-12 三星电子株式会社 用于利用缓冲器高效访问纹理数据的高速缓存体系结构
CN108022269A (zh) * 2017-11-24 2018-05-11 中国航空工业集团公司西安航空计算技术研究所 一种GPU压缩纹理存储Cache的建模结构
CN109615685A (zh) * 2018-11-14 2019-04-12 西安翔腾微电子科技有限公司 基于uml面向gpu纹理贴图的硬件视图模型及纹理执行方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7109999B1 (en) * 2003-05-29 2006-09-19 Nvidia Corporation Method and system for implementing programmable texture lookups from texture coordinate sets
CN103503032A (zh) * 2011-05-02 2014-01-08 索尼电脑娱乐公司 图形硬件中的纹理化
US20150187089A1 (en) * 2013-12-27 2015-07-02 Aleksander Olek Neyman Dynamic programmable texture sampler for flexible filtering of graphical texture data
CN106408634A (zh) * 2015-07-29 2017-02-15 三星电子株式会社 纹理处理设备和方法
US20170256025A1 (en) * 2016-03-04 2017-09-07 Samsung Electronics Co., Ltd. Efficient low-power texture cache architecture
CN107153617A (zh) * 2016-03-04 2017-09-12 三星电子株式会社 用于利用缓冲器高效访问纹理数据的高速缓存体系结构
CN106683171A (zh) * 2016-12-12 2017-05-17 中国航空工业集团公司西安航空计算技术研究所 一种GPU多线程纹理映射SystemC建模结构
CN106683158A (zh) * 2016-12-12 2017-05-17 中国航空工业集团公司西安航空计算技术研究所 一种GPU纹理映射非阻塞存储Cache的建模结构
CN108022269A (zh) * 2017-11-24 2018-05-11 中国航空工业集团公司西安航空计算技术研究所 一种GPU压缩纹理存储Cache的建模结构
CN109615685A (zh) * 2018-11-14 2019-04-12 西安翔腾微电子科技有限公司 基于uml面向gpu纹理贴图的硬件视图模型及纹理执行方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韩立敏 等 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112581575A (zh) * 2020-12-05 2021-03-30 西安翔腾微电子科技有限公司 一种外视频做纹理系统
CN112581575B (zh) * 2020-12-05 2024-05-03 西安翔腾微电子科技有限公司 一种外视频做纹理系统
CN113034629A (zh) * 2021-05-17 2021-06-25 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
US20220222770A1 (en) Graphics processing architecture employing a unified shader
US10719447B2 (en) Cache and compression interoperability in a graphics processor pipeline
US9576340B2 (en) Render-assisted compression for remote graphics
US9449362B2 (en) Techniques for reducing accesses for retrieving texture images
US11941752B2 (en) Streaming a compressed light field
US10559112B2 (en) Hybrid mechanism for efficient rendering of graphics images in computing environments
WO2017172053A2 (en) Method and apparatus for multi format lossless compression
US11501467B2 (en) Streaming a light field compressed utilizing lossless or lossy compression
CN110992240A (zh) 一种可编程纹理处理器系统
WO2014182469A1 (en) Improved multi-sampling anti-aliasing compression by use of unreachable bit combinations
WO2018052512A2 (en) Load-balanced tessellation distribution for parallel architectures
US9959590B2 (en) System and method of caching for pixel synchronization-based graphics techniques
CN106780289B (zh) 基于渲染模式自适应的图形处理器统一染色阵列旁路结构
EP4220431A1 (en) Data processing method and related apparatus
CN112581575A (zh) 一种外视频做纹理系统
JP4749824B2 (ja) グラフィックスシステム
WO2024001699A1 (zh) 一种着色器输入数据的处理方法和图形处理装置
Kim et al. Bank-partition and multi-fetch scheme for floating-point special function units in multi-core systems
KR20140023794A (ko) 오브젝트 렌더링 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200410