CN107886466A - 一种图形处理器图像处理单元体系结构 - Google Patents

一种图形处理器图像处理单元体系结构 Download PDF

Info

Publication number
CN107886466A
CN107886466A CN201711203298.6A CN201711203298A CN107886466A CN 107886466 A CN107886466 A CN 107886466A CN 201711203298 A CN201711203298 A CN 201711203298A CN 107886466 A CN107886466 A CN 107886466A
Authority
CN
China
Prior art keywords
unit
units
pixel
data
connection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711203298.6A
Other languages
English (en)
Other versions
CN107886466B (zh
Inventor
任向隆
张骏
韩立敏
郑新建
王治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Aeronautics Computing Technique Research Institute of AVIC
Original Assignee
Xian Aeronautics Computing Technique Research Institute of AVIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Aeronautics Computing Technique Research Institute of AVIC filed Critical Xian Aeronautics Computing Technique Research Institute of AVIC
Priority to CN201711203298.6A priority Critical patent/CN107886466B/zh
Publication of CN107886466A publication Critical patent/CN107886466A/zh
Application granted granted Critical
Publication of CN107886466B publication Critical patent/CN107886466B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Image Generation (AREA)

Abstract

本发明属于图形处理器设计领域,涉及一种图形处理器图像处理单元体系结构。本发明由图像管线前段单元、图像处理子集单元、图像管线后段单元、仲裁单元、格式转换B单元、压缩解压单元、译码控制单元组成。本发明可完成像素、纹理和位图等主要数据的加载和获取,还支持颜色表、卷积核等辅助数据加载和获取,且在数据的加载和获取操作过程中,支持OpenGL标准所规定的存储操作、像素传输操作、像素映射操作、像素缩放操作、颜色表操作、卷积操作、颜色表变换操作、柱状图统计操作、最小最大值统计操作等功能。

Description

一种图形处理器图像处理单元体系结构
技术领域
本发明属于图形处理器设计领域,涉及一种图形处理器图像处理单元体系结构。
背景技术
图形处理器(GPU)是进行图形绘制、图像及视频处理和显示的关键部件,普遍存在于各类需对窗口系统、图形界面、游戏场景、图像应用和视频播放等进行加速的系统之中。图像处理单元是GPU中负责像素、纹理和位图数据加载、读取,并在加载和读取过程中进行颜色变换、处理的重要部件,负责为GPU提供图像管线和图像处理子集功能的支持和实现。
目前,我国GPU研制能力薄弱,各领域图形加速大量采用国外进口商用芯片。出于国家安全、商业利益等原因,商用GPU的底层资料(如内部微架构、核心设计等)向来不曾公开,导致在使用时商用GPU的功能、性能无法充分发挥,可移植性较差;此外,在军用领域,国外商用GPU在安全性、可靠性、保障性等方面存在隐患,难以满足军事应用的自主保障需求。
上述问题严重制约了我国各种图形加速系统的独立研制和自主发展,研制具有自主知识产权的GPU芯片迫在眉睫,而图像处理单元作为GPU中进行像素、纹理等加载和读取,同时进行变换、处理的关键部件,其实现结构内尚未见有公开报导,对其设计技术进行研究和突破已刻不容缓。
发明内容
本发明的目的是:提供一种可用于图形处理器的图像处理单元体系结构。
本发明的技术解决方案是:
一种图形处理器图像处理单元体系结构,包含图像管线前段单元101、图像处理子集单元102、图像管线后段单元103、格式转换B单元108、压缩解压单元107、译码控制单元111;所述图像管线前段单元101完成OpenGL协议所规定的图像管线功能中存储操作、像素映射,以及部分格式转换操作;所述图像处理子集单元102完成OpenGL协议所规定的图像处理子集功能中颜色表映射(包括颜色表、卷积后颜色表、颜色矩阵后颜色表)、卷积处理、颜色矩阵处理、柱状图统计、最大最小值统计功能;所述图像管线后段单元103完成OpenGL协议所规定的图像管线功能中像素缩放操作,以及像素数据由行顺序到块(Tile)顺序的转换;所述格式转换B单元108完成数据在处理格式和存储格式之间的转换;所述压缩解压单元107完成纹理数据的压缩和解压功能;译码控制单元111对SGU输入的功能码进行译码,产生图形处理单元中各模块的作用使能;
所述图像管线前段单元101具有与外部DMA单元的接口130,用于图像处理单元和外部模块之间像素数据的传输;所述译码控制单元111具有与外部SGU单元的接口136,用于从外部接收所处理OpenGL函数的功能码;所述压缩解压单元107具有与外部DDR单元的接口131,用于图像处理单元和DDR单元之间的数据传输;所述图像管线后段单元103具有与外部JSU单元的接口133,用于向JSU单元传输处理过的像素数据及控制信息;
所述图像管线前段单元101具有到图像管线后段单元103的连接137,用于向图像管线后段单元103传输位图数据;所述图像管线前段单元101具有到图像处理子集单元102的连接139,用于向图像处理子集单元102传输像素数据;所述图像管线前段单元101具有与图像处理子集单元102的连接140,用于在图像管线前段单元101和图像处理子集单元102之间传输颜色表、卷积核、柱状图、最小最大值等数据;所述图像处理子集单元102具有到图像管线前段单元101的连接138,用于向图像管线前段单元101传输像素数据;所述图像处理子集单元102具有到图像管线后段单元103的连接141,用于向图像管线后段单元103传输像素数据;所述格式转换B单元108具有与压缩解压单元107的连接147,用于格式转换B单元108与压缩解压单元107之间的数据传输。
所述译码控制单元111具有到图像处理单元内的各子单元之间的连接,用于根据OpenGL命令的功能码为各子单元的工作提供所需控制信号;所述仲裁单元105具有与图像管线前段单元101的连接142,用于为仲裁单元105和图像管线前段单元101之间的数据传输提供数据通路;所述仲裁单元105具有与图像处理子集单元102的连接143,用于为仲裁单元105和图像处理子集单元102之间的数据传输提供数据通路;所述仲裁单元105具有与格式转换B单元108的连接146,用于为仲裁单元105和格式转换B单元108之间的数据传输提供数据通路。
所述图形处理器图像处理单元体系结构的工作流程为:外部SGU单元对IP参数存储110中的参数进行设置;外部SGU单元向译码控制单元111发送需图像处理单元处理的OpenGL命令的功能码;外部单元设置外部的DMA控制器,启动DMA传输;译码控制单元111对接收到的OpenGL命令的功能码进行译码,控制图像处理单元内部的单元按照该命令的数据通路进行处理;对一条命令的处理过程为,从外部DMA单元或外部DDR单元或外部P/ZCache单元读取待处理数据,然后图像管线前段单元101、图像处理子集单元102、图像管线后段单元103、Sub替换单元104、仲裁单元105、Mipmap产生单元106、压缩解压单元107、格式转换B单元108等依据译码控制单元111的控制信息,对流经本模块的数据进行相应的处理,处理后的数据发往数据通路的下一级,数据通路上的最后一级将最终数据写入外部DMA单元或外部DDR单元或外部JSU单元,该条命令处理完毕;一条命令处理完毕后,图像处理单元处于空闲状态,等待接收下一条命令。
进一步的,所述的一种图形处理器图像处理单元体系结构,还包括一个Sub替换单元104、一个仲裁单元105、一个Mipmap产生单元106、一个主机可见寄存器单元109、一个IP参数存储单元110;所述Sub替换单元104完成非压缩纹理和压缩纹理的子纹理替换功能;所述仲裁单元105完成图像管线前段单元101、图像处理子集单元102和Sub替换单元104与格式转换B单元108进行数据传输的仲裁操作;所述Mipmap产生单元106负责生成纹理图像的各级Mipmap图像;所述主机可见寄存器单元109实现主机可读写的寄存器,用于实现主机对图像处理单元的控制及状态获取;所述IP参数存储单元110用于存储图像处理单元处理OpenGL命令所需要的众多配置参数;
所述主机可见寄存器单元109具有与外部HIU单元的连接134,用于外部HIU单元对主机可见寄存器单元109中寄存器的读写;所述IP参数存储单元110具有与外部SGU单元的连接135,用于外部SGU单元对IP参数存储单元110中的参数寄存器进行读写;所述格式转换B单元108具有与外部P/ZCache单元的连接132,用于和外部P/ZCache单元之间的数据传输;
所述主机可见寄存器单元109具有与图像处理单元内的各子单元之间的连接,用于设置各子单元的参数以及获取子单元的状态;所述IP参数存储单元110具有到图像处理单元内的各子单元之间的连接,用于为各子单元的正常工作提供所需参数;所述仲裁单元105具有与Sub替换单元104的连接144,用于为仲裁单元105和Sub替换单元104之间的数据传输提供数据通路;所述Sub替换单元104具有与图像管线后段单元103的连接145,用于从图像管线后段单元103接收纹理数据;所述Mipmap产生单元106具有与压缩解压单元107的连接148,用于Mipmap产生单元106与压缩解压单元107之间纹理数据的传输。
进一步的,所述的图像管线前段单元,包含FIFO单元201、存储操作单元202、格式转换A单元203、读写控制单元204、传输映射单元205;所述FIFO单元201完成数据的缓冲功能;所述存储操作单元202完成图像管线功能中存储操作(PixelStore)的部分功能(完成字节序、位序、位图的子图像功能);所述格式转换A单元203完成数据在主机格式和处理格式之间的转换;所述读写控制单元204依据译码控制单元的控制信号,完成对图像处理单元外的DDR单元及图像处理单元内部片上SRAM的读写访问;所述传输映射单元205完成像素传输操作所设置的缩放和偏移操作,以及像素映射操作;
所述FIFO单元201与所述存储操作单元202之间具有连接230,用于FIFO单元201与存储操作单元202之间的数据传输;所述存储操作单元202与所述格式转换A单元203之间具有连接231,用于存储操作单元202和格式转换A单元203之间的数据传输;所述格式转换A单元203具有到所述传输映射单元205的连接232,用于向传输映射单元205发送像素数据;所述格式转换A单元203与所述读写控制单元204之间具有连接233,用于格式转换A单元203与读写控制单元204之间的像素数据传输;所述读写控制单元204具有到所述传输映射单元205的连接234,用于向传输映射单元203发送像素数据;所述传输映射单元205与所述读写控制单元204之间具有连接236,用于读写控制单元204读写传输映射单元205中的像素映射表。
进一步的,所述图像管线后段单元由像素缩放翻转单元207组成;像素缩放翻转单元207在外部译码控制单元111的控制下完成像素数据的放大、缩小和反射。
进一步的,所述图像处理子集单元包含颜色表单元301、卷积单元302、卷积后颜色表单元303、颜色矩阵单元304、颜色矩阵后颜色表单元305、柱状图单元306、最小最大值单元307;所述颜色表单元301、所述卷积后颜色表单元303、所述颜色矩阵后颜色表单元305分别对应于3个不同阶段的颜色表,功能均为,根据像素的颜色值,完成颜色表的查找,并完成像素颜色值的替换;所述卷积单元302依据设置的卷积模式、卷积核、卷积核的内部格式信息,完成像素数据的卷积运算,并完成像素传输操作所设置的卷积后的缩放和偏移;所述卷积单元302内部包含存储,用于存放卷积核信息;所述颜色矩阵单元304依据外部IP参数存储单元110中存储的颜色矩阵,对像素数据进行变换,并完成像素传输操作所设置的颜色矩阵后的缩放和偏移;所述柱状图单元306根据外部IP参数存储单元110中柱状图的配置,对像素实施柱状图的统计功能;所述最小最大值单元307根据外部IP参数存储单元110中最小最大值的配置,实现像素值最小最大值的统计功能;所述最小最大值单元307内部包含寄存器,用于记录最小最大值信息;
所述颜色表单元301具有到所述卷积单元302的连接345,用于向卷积单元302发送像素数据;所述卷积单元302具有到所述卷积后颜色表单元303的连接346,用于向卷积后颜色表单元303发送像素数据;所述卷积后颜色表单元303具有到所述颜色矩阵单元304的连接347,用于向颜色矩阵单元304发送像素数据;所述颜色矩阵单元304具有到所述颜色矩阵后颜色表单元305的连接348,用于颜色矩阵后颜色表单元305发送像素数据;所述颜色矩阵后颜色表单元305具有到所述柱状图单元306的连接349,用于向柱状图单元306发送像素数据;所述柱状图单元306具有到所述最小最大值单元307的连接350,用于向最小最大值单元307发送像素数据;所述颜色表单元301与外部读写控制单元204之间具有连接352,用于读写控制单元204设置和读取颜色表单元301中的颜色表信息;所述卷积单元302与外部仲裁单元105之间具有连接355,用于卷积单元302读取和写入和外部DDR中的像素数据;所述卷积后颜色表单元303与外部读写控制单元204之间具有连接357,用于读写控制单元204设置和读取卷积后颜色表单元303中的颜色表信息;所述颜色矩阵后颜色表单元305与外部读写控制单元204之间具有连接359,用于读写控制单元204设置和读取颜色矩阵后颜色表单元305中的颜色表信息;所述柱状图单元306具有到外部读写控制单元204的连接361,用于读写控制单元204读取柱状图单元306中的柱状图信息;所述最小最大值单元307具有到外部读写控制单元204的连接362,用于读写控制单元204读取最小最大值单元307中的最小最大值信息。
本发明的有益效果是:
一、本发明提供的一种图像处理单元的体系结构,可完成像素、纹理和位图等主要数据的加载和获取,还支持颜色表、卷积核等辅助数据加载和获取,且在数据的加载和获取操作过程中,支持OpenGL标准所规定的:
a)图像管线的功能,包括:存储操作、像素传输操作、像素映射操作、像素缩放操作;
b)图像处理子集的功能,包括:颜色表操作、卷积操作、颜色表变换操作、柱状图统计操作、最小最大值统计操作。
二、本发明提供的一种图像处理单元的体系结构,可用于自主图形处理器芯片的研制。
附图说明
图1是本发明图形处理器图像处理单元体系结构的总体框图,其中:HIU-主机接口单元;SGU-状态参数与图形处理管理单元;JSU-任务调度单元;P/ZCache-Pixel/ZCache;IP-图像处理参数。
图2是图像管线的总体框图,包括图像管线前段和图像管线后段。
图3是图像处理子集的总体框图。
图4是图形处理器图像处理单元体系结构的一个实施例框图,其中:ROU-光栅操作单元;OCU-输出控制单元;USA-统一染色阵列。
具体实施方式
下面结合附图和具体实施例,对本发明的技术方案进行清楚、完整地表述。显然,所表述的实施例仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提所获得的所有其他实施例,都属于本发明的保护范围。
参见图1,其是本发明图形处理器图像处理单元体系结构的总体框图。图2是图像管线的总体框图,包括图像管线前段和图像管线后段。图3是图像处理子集的总体框图。
本发明图形处理器图像处理单元体系结构的一种具体实施方式的内部结构如图4所示,主要由图像管线单元、图像处理子集单元、主机可见寄存器单元、IP参数存储单元、译码控制单元、仲裁单元、格式转换B单元、压缩解压单元、Sub替换单元、Mipmap产生单元组成。其中:
a)图像管线单元完成图像管线的相关功能。图像管线单元由FIFO单元、存储操作单元、格式转换A单元、读写控制单元、传输映射单元、像素缩放翻转单元组成。其中:
——FIFO单元用于对数据进行缓存;
——存储操作单元进行存储模式的转换,功能参考glPixelStore;
——格式转换A单元用于对数据的格式进行转换;
——读写控制单元用于在译码控制单元的控制下对DDR和片上SRAM的数据进行读写;
——传输映射操作单元根据设置的传输模式和映射表对颜色成分进行操作,功能参考glPixelTransfer、glPixelMap;
——像素缩放翻转单元对图像进行放大、缩小或翻转操作,功能参考glPixelZoom。
b)图像处理子集单元完成图像处理子集的相关功能。图像处理子集单元由颜色表单元、卷积单元、卷积后颜色表单元、颜色矩阵单元、颜色矩阵后颜色表单元、柱状图单元和最小最大值单元组成。其中:
——颜色表单元用于实现颜色查找表。颜色查找表用于替换像素的颜色,以实现对比增强、过滤和图像均衡等效果,功能参考glColorTable;
——卷积单元用于实现卷积、缩放和偏移功能。卷积是一种像素过滤器,用像素本身以及邻近像素的加权平均值来替换这个像素,卷积可应用于图像的模糊、锐化、查找边缘以及调整对比度等,功能参考glConvolutionFilter*;缩放和偏移是对像素的颜色分量进行缩放和偏移操作,对应于参数GL_COLOR_TABLE_SCALE和GL_COLOR_TABLE_BIAS,功能参考glColorTableParameter。
——卷积后颜色表单元用于实现卷积后的颜色查找表,其功能与颜色表单元类似;
——颜色矩阵单元用于实现颜色矩阵、缩放和偏移功能。颜色矩阵用于对像素值进行颜色空间转换和线性变换,功能参考glLoadMatrix、glMatrixMode;缩放和偏移与卷积单元中的缩放和偏移功能类似;
——颜色矩阵后颜色表单元,功能与颜色查找表类似;
——柱状图单元实现柱状图功能,用于对图像颜色分布信息进行统计收集,功能参考glHistogram;
——最小最大值单元用于统计一个像素矩形中最大颜色分量和最小颜色分量,功能参考glMinmax。
c)主机可见寄存器单元实现主机可见的寄存器及其读写控制;
d)IP参数存储单元用于存储图像处理单元所需的参数;
e)译码控制单元对来自图形功能管理单元的图形功能码进行译码,控制、协调图像处理单元各单元的执行;
f)仲裁单元对图像处理子集中多个访问存储器的请求进行仲裁,选出一路进行存储器的访问;
g)格式转换B单元负责IPU处理格式、类型与DDR的内部格式之间的数据格式转换,以及数据地址、数据长度的变换;
h)压缩解压单元负责根据需要对纹理数据进行压缩、解压操作;
i)Sub替换单元负责纹理sub图像的替换,涉及的函数有glTexSubImage、glCopyTexSubImage、glCompressedTexSubImage;
j)Mipmap产生单元负责纹理图像Mipmap的产生。
最后应说明的是,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (5)

1.一种图形处理器图像处理单元体系结构,其特征为:所述图形处理器图像处理单元体系结构包含图像管线前段单元(101)、图像处理子集单元(102)、图像管线后段单元(103)、仲裁单元(105)、格式转换B单元(108)、压缩解压单元(107)、译码控制单元(111);所述图像管线前段单元(101)完成OpenGL协议所规定的图像管线功能中存储操作、像素映射,以及部分格式转换操作;所述图像处理子集单元(102)完成OpenGL协议所规定的图像处理子集功能中颜色表映射、卷积处理、颜色矩阵处理、柱状图统计、最大最小值统计功能;所述图像管线后段单元(103)完成OpenGL协议所规定的图像管线功能中像素缩放操作,以及像素数据由行顺序到块顺序的转换;所述格式转换B单元(108)完成数据在处理格式和存储格式之间的转换;所述压缩解压单元(107)完成纹理数据的压缩和解压功能;译码控制单元(111)对SGU输入的功能码进行译码,产生图形处理单元中各模块的作用使能;
所述图像管线前段单元(101)具有与外部DMA单元的接口(130),用于图像处理单元和外部模块之间像素数据的传输;所述译码控制单元(111)具有与外部SGU单元的接口(136),用于从外部接收所处理OpenGL函数的功能码;所述压缩解压单元(107)具有与外部DDR单元的接口(131),用于图像处理单元和DDR单元之间的数据传输;所述图像管线后段单元(103)具有与外部JSU单元的接口(133),用于向JSU单元传输处理过的像素数据及控制信息;
所述图像管线前段单元(101)具有到图像管线后段单元(103)的连接(137),用于向图像管线后段单元(103)传输位图数据;所述图像管线前段单元(101)具有到图像处理子集单元(102)的连接(139),用于向图像处理子集单元(102)传输像素数据;所述图像管线前段单元(101)具有与图像处理子集单元(102)的连接(140),用于在图像管线前段单元(101)和图像处理子集单元(102)之间传输颜色表、卷积核、柱状图、最小最大值等数据;所述图像处理子集单元(102)具有到图像管线前段单元(101)的连接(138),用于向图像管线前段单元(101)传输像素数据;所述图像处理子集单元(102)具有到图像管线后段单元(103)的连接(141),用于向图像管线后段单元(103)传输像素数据;所述格式转换B单元(108)具有与压缩解压单元(107)的连接(147),用于格式转换B单元(108)与压缩解压单元(107)之间的数据传输;
所述译码控制单元(111)具有到图像处理单元内的各子单元之间的连接,用于根据OpenGL命令的功能码为各子单元的工作提供所需控制信号;所述仲裁单元(105)具有与图像管线前段单元(101)的连接(142),用于为仲裁单元(105)和图像管线前段单元(101)之间的数据传输提供数据通路;所述仲裁单元(105)具有与图像处理子集单元(102)的连接(143),用于为仲裁单元(105)和图像处理子集单元(102)之间的数据传输提供数据通路;所述仲裁单元(105)具有与格式转换B单元(108)的连接(146),用于为仲裁单元(105)和格式转换B单元(108)之间的数据传输提供数据通路;
所述图形处理器图像处理单元体系结构的工作流程为:外部SGU单元对IP参数存储(110)中的参数进行设置;外部SGU单元向译码控制单元(111)发送需图像处理单元处理的OpenGL命令的功能码;外部单元设置外部的DMA控制器,启动DMA传输;译码控制单元(111)对接收到的OpenGL命令的功能码进行译码,控制图像处理单元内部的单元按照该命令的数据通路进行处理;对一条命令的处理过程为,从外部DMA单元或外部DDR单元或外部P/ZCache单元读取待处理数据,然后图像管线前段单元(101)、图像处理子集单元(102)、图像管线后段单元(103)、Sub替换单元(104)、仲裁单元(105)、Mipmap产生单元(106)、压缩解压单元(107)、格式转换B单元(108)等依据译码控制单元(111)的控制信息,对流经本模块的数据进行相应的处理,处理后的数据发往数据通路的下一级,数据通路上的最后一级将最终数据写入外部DMA单元或外部DDR单元或外部JSU单元,该条命令处理完毕;一条命令处理完毕后,图像处理单元处于空闲状态,等待接收下一条命令。
2.依据权利要求1所述的一种图形处理器图像处理单元体系结构,其特征在于:所述图形处理器图像处理单元体系结构还包括一个Sub替换单元(104)、一个Mipmap产生单元(106)、一个IP参数存储单元(110);所述Sub替换单元(104)完成非压缩纹理和压缩纹理的子纹理替换功能;所述Mipmap产生单元(106)负责生成纹理图像的各级Mipmap图像;所述IP参数存储单元(110)用于存储图像处理单元处理OpenGL命令所需要的众多配置参数;
所述IP参数存储单元(110)具有与外部单元的连接(135),用于外部单元对IP参数存储单元(110)中的参数寄存器进行读写;所述格式转换B单元(108)具有与外部单元的连接(132),用于和外部单元之间的数据传输;
所述IP参数存储单元(110)具有到图像处理单元内的各子单元之间的连接,用于为各子单元的正常工作提供所需参数;所述Sub替换单元(104)具有与图像管线后段单元(103)的连接(145),用于从图像管线后段单元(103)接收纹理数据;所述Mipmap产生单元(106)具有与压缩解压单元(107)的连接(148),用于Mipmap产生单元(106)与压缩解压单元(107)之间纹理数据的传输。
3.依据权利要求1所述的图形处理器图像处理单元体系结构,其特征在于:所述图像管线前段单元(101)包含存储操作单元(202)、格式转换A单元(203)、读写控制单元(204)、传输映射单元(205);所述存储操作单元(202)完成图像管线功能中存储操作的字节序、位序、位图的子图像功能,存储操作的全部功能由存储操作单元(202)及DMA传输过程共同完成;所述格式转换A单元(203)完成数据在主机格式和处理格式之间的转换;所述读写控制单元(204)依据译码控制单元的控制信号,完成对图像处理单元外的DDR单元及图像处理单元内部片上SRAM的读写访问;所述传输映射单元(205)完成像素传输操作所设置的缩放和偏移操作,以及像素映射操作;
所述存储操作单元(202)与所述格式转换A单元(203)之间具有连接(231),用于存储操作单元(202)和格式转换A单元(203)之间的数据传输;所述格式转换A单元(203)具有到所述传输映射单元(205)的连接(232),用于向传输映射单元(205)发送像素数据;所述格式转换A单元(203)与所述读写控制单元(204)之间具有连接(233),用于格式转换A单元(203)与读写控制单元(204)之间的像素数据传输;所述读写控制单元(204)具有到所述传输映射单元(205)的连接(234),用于向传输映射单元(203)发送像素数据。
4.根据权利要求1所述的图形处理器图像处理单元体系结构,其特征在于:所述图像管线前段单元(103)包含像素缩放翻转单元(207);像素缩放翻转单元(207)用于完成像素数据的放大、缩小和反射。
5.依据权利要求1所述的一种图形处理器图像处理单元体系结构,其特征在于:所述图像处理子集单元(102)包含颜色表单元(301)、卷积单元(302)、卷积后颜色表单元(303)、颜色矩阵单元(304)、颜色矩阵后颜色表单元(305)、柱状图单元(306)、最小最大值单元(307);所述颜色表单元(301)、所述卷积后颜色表单元(303)、所述颜色矩阵后颜色表单元(305)分别对应于3个不同阶段的颜色表,功能均为根据像素的颜色值,完成颜色表的查找,并完成像素颜色值的替换;所述卷积单元(302)依据设置的卷积模式、卷积核、卷积核的内部格式信息,完成像素数据的卷积运算,并完成像素传输操作所设置的卷积后的缩放和偏移;所述卷积单元(302)内部包含存储,用于存放卷积核信息;所述颜色矩阵单元(304)依据外部IP参数存储单元(110)中存储的颜色矩阵,对像素数据进行变换,并完成像素传输操作所设置的颜色矩阵后的缩放和偏移;所述柱状图单元(306)根据外部IP参数存储单元(110)中柱状图的配置,对像素实施柱状图的统计功能;所述最小最大值单元(307)根据外部IP参数存储单元(110)中最小最大值的配置,实现像素值最小最大值的统计功能;
所述颜色表单元(301)具有到所述卷积单元(302)的连接(345),用于向卷积单元(302)发送像素数据;所述卷积单元(302)具有到所述卷积后颜色表单元(303)的连接(346),用于向卷积后颜色表单元(303)发送像素数据;所述卷积后颜色表单元(303)具有到所述颜色矩阵单元(304)的连接(347),用于向颜色矩阵单元(304)发送像素数据;所述颜色矩阵单元(304)具有到所述颜色矩阵后颜色表单元(305)的连接(348),用于颜色矩阵后颜色表单元(305)发送像素数据;所述颜色矩阵后颜色表单元(305)具有到所述柱状图单元(306)的连接(349),用于向柱状图单元(306)发送像素数据;所述柱状图单元(306)具有到所述最小最大值单元(307)的连接(350),用于向最小最大值单元(307)发送像素数据。
CN201711203298.6A 2017-11-24 2017-11-24 一种图形处理器图像处理单元系统 Active CN107886466B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711203298.6A CN107886466B (zh) 2017-11-24 2017-11-24 一种图形处理器图像处理单元系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711203298.6A CN107886466B (zh) 2017-11-24 2017-11-24 一种图形处理器图像处理单元系统

Publications (2)

Publication Number Publication Date
CN107886466A true CN107886466A (zh) 2018-04-06
CN107886466B CN107886466B (zh) 2021-03-26

Family

ID=61775505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711203298.6A Active CN107886466B (zh) 2017-11-24 2017-11-24 一种图形处理器图像处理单元系统

Country Status (1)

Country Link
CN (1) CN107886466B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110349107A (zh) * 2019-07-10 2019-10-18 北京字节跳动网络技术有限公司 图像增强的方法、装置、电子设备、及存储介质
CN111028127A (zh) * 2019-11-18 2020-04-17 中国航空工业集团公司西安航空计算技术研究所 一种gpu子纹理替换存储方法
CN111028126A (zh) * 2019-11-18 2020-04-17 中国航空工业集团公司西安航空计算技术研究所 一种gpu图像处理卷积过滤的实现方法
CN111045623A (zh) * 2019-11-21 2020-04-21 中国航空工业集团公司西安航空计算技术研究所 一种多gpu拼接环境下图形命令的处理方法
CN111080507A (zh) * 2019-11-18 2020-04-28 中国航空工业集团公司西安航空计算技术研究所 一种面向gpu硬件图像处理卷积过滤系统的tlm微结构

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1873690A (zh) * 2005-06-03 2006-12-06 富士施乐株式会社 图像处理设备、方法和存储有程序的存储介质
US20150379763A1 (en) * 2014-06-30 2015-12-31 Intel Corporation Method and apparatus for filtered coarse pixel shading
US20160055613A1 (en) * 2014-03-13 2016-02-25 Huawei Technologies Co., Ltd. Image Processing Method, Virtual Machine, and Virtual Machine System
CN107038742A (zh) * 2015-11-25 2017-08-11 辉达公司 屏幕空间管线中的多通道渲染

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1873690A (zh) * 2005-06-03 2006-12-06 富士施乐株式会社 图像处理设备、方法和存储有程序的存储介质
US20160055613A1 (en) * 2014-03-13 2016-02-25 Huawei Technologies Co., Ltd. Image Processing Method, Virtual Machine, and Virtual Machine System
US20150379763A1 (en) * 2014-06-30 2015-12-31 Intel Corporation Method and apparatus for filtered coarse pixel shading
CN107038742A (zh) * 2015-11-25 2017-08-11 辉达公司 屏幕空间管线中的多通道渲染

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KWANG YEOB LEE 等: "A design of a GP-GPU based stream processor for an image processing", 《2015 38TH INTERNATIONAL CONFERENCE ON TELECOMMUNICATIONS AND SIGNAL PROCESSING (TSP)》 *
任向隆 等: "图形处理器VGA模式设计技术", 《计算机工程与设计》 *
任向隆 等: "支持双路显示的GPU显示控制单元设计与实现", 《小型微型计算机系统》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110349107A (zh) * 2019-07-10 2019-10-18 北京字节跳动网络技术有限公司 图像增强的方法、装置、电子设备、及存储介质
CN111028127A (zh) * 2019-11-18 2020-04-17 中国航空工业集团公司西安航空计算技术研究所 一种gpu子纹理替换存储方法
CN111028126A (zh) * 2019-11-18 2020-04-17 中国航空工业集团公司西安航空计算技术研究所 一种gpu图像处理卷积过滤的实现方法
CN111080507A (zh) * 2019-11-18 2020-04-28 中国航空工业集团公司西安航空计算技术研究所 一种面向gpu硬件图像处理卷积过滤系统的tlm微结构
CN111080507B (zh) * 2019-11-18 2022-12-06 中国航空工业集团公司西安航空计算技术研究所 一种面向gpu硬件图像处理卷积过滤系统的tlm微结构
CN111028127B (zh) * 2019-11-18 2023-06-13 中国航空工业集团公司西安航空计算技术研究所 一种gpu子纹理替换存储方法
CN111028126B (zh) * 2019-11-18 2023-06-30 中国航空工业集团公司西安航空计算技术研究所 一种gpu图像处理卷积过滤的实现方法
CN111045623A (zh) * 2019-11-21 2020-04-21 中国航空工业集团公司西安航空计算技术研究所 一种多gpu拼接环境下图形命令的处理方法
CN111045623B (zh) * 2019-11-21 2023-06-13 中国航空工业集团公司西安航空计算技术研究所 一种多gpu拼接环境下图形命令的处理方法

Also Published As

Publication number Publication date
CN107886466B (zh) 2021-03-26

Similar Documents

Publication Publication Date Title
CN107886466A (zh) 一种图形处理器图像处理单元体系结构
US10726519B2 (en) Cache arrangement for graphics processing systems
CN101802872A (zh) 深度缓冲器压缩
TW200427312A (en) Method and apparatus for pattern RAM sharing color LUT
CN103380417B (zh) 用于从存储器请求所存储的数据的方法及系统
CN101681502A (zh) 用于三维图形电路的像素高速媛冲存储器
CN108022269A (zh) 一种GPU压缩纹理存储Cache的建模结构
TW200917228A (en) Compression of multiple-sample-anti-aliasing tile data in a graphics pipeline
CN111861883A (zh) 基于同步积分surf算法的多路视频拼接方法
CN109871904A (zh) 甲骨文字识别模型及训练方法、系统、设备、计算机介质
WO2017222633A1 (en) Image rotation method and apparatus
CN105025264A (zh) 基于fpga与usb2.0的便携式计算机视频监控系统
WO2023197507A1 (zh) 视频数据处理方法、系统、装置及计算机可读存储介质
CN104796652B (zh) 一种基于srio传输视频帧的数据传输方法和装置
CN110728725A (zh) 一种硬件友好的面向实时系统无损纹理压缩算法
CN106415655A (zh) 虚拟存储器支持的压缩控制表面
TWI233573B (en) Method and apparatus for reducing primitive storage requirements and improving memory bandwidth utilization in a tiled graphics architecture
RU2225035C1 (ru) Способ кодирования координат перемещающегося на экране вычислительного устройства видеоизображения, устройство для декодирования визуального объекта, закодированного этим способом, и система, предназначенная для визуализации активного видео с помощью этого устройства
CN102831571B (zh) 用流水线方式单步实现图形图像缩放、旋转的5阶滤波器的设计方法
CN109873998A (zh) 基于多层次引导滤波的红外视频增强系统
CN107209926A (zh) 具有拜耳映射的图形处理单元
CN102572207A (zh) 一种适于jpeg图像的颜色空间转换方法
CN104954749B (zh) 一种信息记录方法
CN107094241A (zh) 一种机载sar的实时成像显示方法及系统
CN106909320A (zh) 一种多维数据扩充传输的方法、装置以及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant