CN106709859B - 一种图形处理器光栅化单元的自适应低功耗时钟门控结构 - Google Patents

一种图形处理器光栅化单元的自适应低功耗时钟门控结构 Download PDF

Info

Publication number
CN106709859B
CN106709859B CN201611139589.9A CN201611139589A CN106709859B CN 106709859 B CN106709859 B CN 106709859B CN 201611139589 A CN201611139589 A CN 201611139589A CN 106709859 B CN106709859 B CN 106709859B
Authority
CN
China
Prior art keywords
rasterization
primitive
module
unit
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611139589.9A
Other languages
English (en)
Other versions
CN106709859A (zh
Inventor
张骏
田泽
郑新建
任向隆
韩立敏
裴希杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Aeronautics Computing Technique Research Institute of AVIC
Original Assignee
Xian Aeronautics Computing Technique Research Institute of AVIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Aeronautics Computing Technique Research Institute of AVIC filed Critical Xian Aeronautics Computing Technique Research Institute of AVIC
Priority to CN201611139589.9A priority Critical patent/CN106709859B/zh
Publication of CN106709859A publication Critical patent/CN106709859A/zh
Application granted granted Critical
Publication of CN106709859B publication Critical patent/CN106709859B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Generation (AREA)

Abstract

一种图形处理器光栅化单元的自适应低功耗时钟门控结构,包含光栅化模块和时钟与功耗控制模块。光栅化模块中包含点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块、Early‑Z单元片元输出单元,以及图元顶点命令类型判定单元。时钟与功耗控制模块中包含分别针对点、直线和三角形图元的相关时钟门控电路。光栅化单元可以实时的检测到当前图元顶点命令的类型,并根据图元顶点命令类型对处于空闲状态的图元光栅化模块的工作时钟进行动态门控,从而降低光栅化单元的功耗。

Description

一种图形处理器光栅化单元的自适应低功耗时钟门控结构
技术领域
本发明涉及计算机硬件技术领域,尤其涉及图形处理器光栅化单元的自适应低功耗时钟门控结构。
背景技术
随着图形化应用的不断增加,早期单靠CPU进行图形绘制的解决方案已经难以满足成绩和技术增长的图形处理需求,图形处理器(Graphic Processing Unit,GPU)应运而生。从1999年Nvidia发布第一款GPU产品至今,GPU技术的发展主要经历了固定功能流水线阶段、分离染色器架构阶段、统一染色器架构阶段,其图形处理能力不断提升,应用领域也从最初的图形绘制逐步扩展到通用计算领域。GPU流水线高速、并行的特征和灵活的可编程能力,为图形处理和通用并行计算提供了良好的运行平台。
目前,我国尚无基于统一染色架构的GPU,各领域显示控制系统中大量采用国外进口的商用GPU芯片。尤其是在军用领域中,国外进口商用GPU芯片存在温度和环境适应性差、无法保证电路本身或配套软件没有“后门”、包含大量军用领域不需要的冗余功能单元,功耗指标无法满足要求、商用GPU芯片更新换代快,随时面临停产、断档,难以满足武器装备持续保障等缺陷,在安全性、可靠性、保障性等方面的存在重大隐患。而且,出于政治、军事、经济等原因,国外对我国实行技术“封锁”和产品“垄断”,难以获得GPU芯片的底层技术资料,如寄存器资料、详细内部微架构、核心软件源码等,导致GPU功能、性能无法充分发挥,且移植性较差;上述问题严重制约了我国显示系统的独立研制和自主发展。
尤其是图形处理器低功耗设计技术,是GPU图形处理体系结构的核心技术,而光栅化单元是GPU的关键核心模块,突破GPU光栅化单元低功耗设计关键技术,研制高性能图形处理器芯片迫在眉睫。
发明内容
本发明公开了一种图形处理器光栅化单元的自适应低功耗时钟门控结构,能够实时的检测到当前图元顶点命令的类型,并根据图元顶点命令类型对处于空闲状态的图元光栅化模块的工作时钟进行动态门控,从而降低光栅化单元的功耗。
本发明的技术解决方案是:
一种图形处理器光栅化单元的自适应低功耗时钟门控结构,包含光栅化模块(1)和时钟与功耗控制模块(2);
所述光栅化模块(1)中包含点图元光栅化模块(11)、直线图元光栅化模块(12)、三角形图元光栅化模块(13)、Early-Z单元(16)、片元输出单元(15),以及图元顶点命令类型判定单元(14)、顶层命令解析单元(17);
顶层命令解析单元(17)接收图元顶点命令进行解析,如果解析的图元顶点命令为点图元光栅化命令,发送给点图元光栅化模块(11);如果解析的图元顶点命令为直线图元光栅化命令,发送给直线图元光栅化模块(12);如果解析的图元顶点命令为三角形图元光栅化命令,发送给三角形图元光栅化模块(13);
点图元光栅化模块(11)执行点图元光栅化命令,完成点图元光栅化功能,片元属性数据发送给Early-Z单元(16);
直线图元光栅化模块(12)执行直线图元光栅化命令,完成直线图元光栅化功能,片元属性数据发送给Early-Z单元(16);
三角形图元光栅化模块(13)执行三角形图元光栅化命令,完成三角形图元光栅化功能,片元属性数据发送给Early-Z单元(16);
Early-Z单元(16)对所述执行结果进行提前深度测试,剔除最终不会被看到的片段,将剔除片段的片元属性数据发送给片元输出单元(15);
片元输出单元(15)将所述剔除片段的片元属性数据输出;
图元顶点命令类型判定单元(14)根据顶层命令解析单元(17)接收到的图元顶点命令的类型向时钟与功耗控制模块(2)发送光栅化单元的门控时钟控制信号,所述光栅化单元的门控时钟控制信号至少包括3位,分别对应点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块,1为有效,0为无效;
时钟与功耗控制模块(2)独立产生光栅化模块(1)中点图元光栅化模块(11)、直线图元光栅化模块(12)、三角形图元光栅化模块(13)的工作时钟,并连接到点图元光栅化模块(11)、直线图元光栅化模块(12)、三角形图元光栅化模块(13)中;时钟与功耗控制模块(2)包含分别针对点图元光栅化模块(11)、直线图元光栅化模块(12)、三角形图元光栅化模块(13)的相关时钟门控电路;解析光栅化单元的门控时钟控制信号,将门控时钟控制信号对应位为0的相应光栅化单元的工作时钟关闭。
本发明的技术效果是:
1、通常来说,光栅化单元是一个完整的功能模块,已有的低功耗技术都是把这个完整的功能模块作为整体进行控制,如工作电压的动态调整技术、时钟频率的动态缩放技术等。考虑到在GPU的实际绘制过程中,光栅化单元内部对三个不同类型图元的光栅化模块-点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块,在同一时刻只有一个处于工作状态,其它两个处于空闲状态。从低功耗的角度来说完全可以对三个光栅化模块的工作时钟进行独立控制。因此,本发明所提方案,不但能够实现将整个光栅化单元作为整体进行时钟门控,而且还能够在更细粒度的层面实现三种不同类型光栅化模块的独立时钟门控,从而实现可以根据图形绘制场景的行为特征和实现对光栅化单元的多个工作时钟的实时动态门控。既能够动态调节光栅化单元功耗,还能够显著增强对光栅化单元功耗控制的灵活性。
附图说明
图1是本发明图形处理器光栅化单元的自适应低功耗时钟门控结构图。
具体实施方式
下面结合附图和具体实施例,对本发明的技术方案进行清楚、完整地表述。显然,所表述的实施例仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提所获得的所有其它实施例,都属于本发明的保护范围。
本发明提供一种图形处理器光栅化单元的自适应低功耗时钟门控结构,包含光栅化模块1和时钟与功耗控制模块2;
所述光栅化模块1中包含点图元光栅化模块11、直线图元光栅化模块12、三角形图元光栅化模块13、Early-Z单元16、片元输出单元15,以及图元顶点命令类型判定单元14、顶层命令解析单元17;
顶层命令解析单元17接收图元顶点命令进行解析,如果解析的图元顶点命令为点图元光栅化命令,发送给点图元光栅化模块11;如果解析的图元顶点命令为直线图元光栅化命令,发送给直线图元光栅化模块12;如果解析的图元顶点命令为三角形图元光栅化命令,发送给三角形图元光栅化模块13;
点图元光栅化模块11执行点图元光栅化命令,完成点图元光栅化功能,片元属性数据发送给Early-Z单元16;
直线图元光栅化模块12执行直线图元光栅化命令,完成直线图元光栅化功能,片元属性数据发送给Early-Z单元16;
三角形图元光栅化模块13执行三角形图元光栅化命令,完成三角形图元光栅化功能,片元属性数据发送给Early-Z单元16;
Early-Z单元16对所述执行结果进行提前深度测试,剔除最终不会被看到的片段,将剔除片段的片元属性数据发送给片元输出单元15;
片元输出单元15将所述剔除片段的片元属性数据输出;
图元顶点命令类型判定单元14根据顶层命令解析单元17接收到的图元顶点命令的类型向时钟与功耗控制模块2发送光栅化单元的门控时钟控制信号,所述光栅化单元的门控时钟控制信号至少包括3位,分别对应点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块,1为有效,0为无效;
时钟与功耗控制模块2独立产生光栅化模块1中点图元光栅化模块11、直线图元光栅化模块12、三角形图元光栅化模块13的工作时钟,并连接到上述三个功能模块中;时钟与功耗控制模块2包含分别针对点图元光栅化模块11、直线图元光栅化模块12、三角形图元光栅化模块13的相关时钟门控电路;解析光栅化单元的门控时钟控制信号,将门控时钟控制信号对应位为0的相应光栅化单元的工作时钟关闭。
实施例
如图1所示,光栅化单元中包括点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块。在任意时刻,上述三个不同类型的光栅化模块只有一个处于工作状态。
图元顶点命令类型判定单元位于光栅化单元内部,根据图元顶点命令接收模块接收到的图元顶点命令类型向时钟与功耗控制模块发送光栅化单元的门控时钟控制信号。光栅化单元的门控时钟控制信号至少包括3位,分别对应点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块,时钟与功耗控制模块根据来自图元顶点命令类型判定单元的时钟门控控制信号决定应该如何对三个光栅化模块的工作时钟进行门控。
门控时钟控制信号的某一位如果为0,则表示将其对应的时钟关闭,即被门控;门控时钟控制信号的某一位如果为1,则表示将其对应的时钟打开。
时钟与功耗控制模块为光栅化单元中的3个独立的光栅化功能子模块提供独立的工作时钟,即使PLL产生3个光栅化单元的工作时钟;3个光栅化单元的工作时钟分别连接到时钟与功耗控制模块的3个独立的时钟门控电路中。经过门控电路处理后,输出的时钟分别连接到光栅化单元的点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块中。
时钟与功耗控制模块包含针对光栅化单元中的3个独立的光栅化功能子模块的3个独立的时钟门控电路。每一个时钟门控电路与一个光栅化功能子模块相对应,在光栅化单元中的图元顶点命令类型判定单元输出的时钟门控控制信号对应位为0的情况下,将对相应光栅化功能子模块的工作时钟关闭,从而实现对相应光栅化功能子模块工作时钟的门控。
如果光栅化单元接收到的是点图元对应的图元顶点命令,则图元顶点命令类型判定单元输出的时钟门控控制信号为100,表示将点图元光栅化模块的工作时钟打开,将直线图元光栅化模块和三角形图元光栅化模块的工作时钟关闭。
如果光栅化单元接收到的是直线图元对应的图元顶点命令,则图元顶点命令类型判定单元输出的时钟门控控制信号为010,表示将直线图元光栅化模块的工作时钟打开,将点图元光栅化模块和三角形图元光栅化模块的工作时钟关闭。
如果光栅化单元接收到的是三角形图元对应的图元顶点命令,则图元顶点命令类型判定单元输出的时钟门控控制信号为001,表示将三角形图元光栅化模块的工作时钟打开,将点图元光栅化模块和直线图元光栅化模块的工作时钟关闭。
最后应说明的是,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (1)

1.一种图形处理器光栅化单元的自适应低功耗时钟门控结构,其特征在于:包含光栅化模块(1)和时钟与功耗控制模块(2);
所述光栅化模块(1)中包含点图元光栅化模块(11)、直线图元光栅化模块(12)、三角形图元光栅化模块(13)、Early-Z单元(16)、片元输出单元(15),以及图元顶点命令类型判定单元(14)、顶层命令解析单元(17);
顶层命令解析单元(17)接收图元顶点命令进行解析,如果解析的图元顶点命令为点图元光栅化命令,发送给点图元光栅化模块(11);如果解析的图元顶点命令为直线图元光栅化命令,发送给直线图元光栅化模块(12);如果解析的图元顶点命令为三角形图元光栅化命令,发送给三角形图元光栅化模块(13);
点图元光栅化模块(11)执行点图元光栅化命令,完成点图元光栅化功能,片元属性数据发送给Early-Z单元(16);
直线图元光栅化模块(12)执行直线图元光栅化命令,完成直线图元光栅化功能,片元属性数据发送给Early-Z单元(16);
三角形图元光栅化模块(13)执行三角形图元光栅化命令,完成三角形图元光栅化功能,片元属性数据发送给Early-Z单元(16);
Early-Z单元(16)对所述执行结果进行提前深度测试,剔除最终不会被看到的片段,将剔除片段的片元属性数据发送给片元输出单元(15);
片元输出单元(15)将所述剔除片段的片元属性数据输出;
图元顶点命令类型判定单元(14)根据顶层命令解析单元(17)接收到的图元顶点命令的类型向时钟与功耗控制模块(2)发送光栅化单元的门控时钟控制信号,所述光栅化单元的门控时钟控制信号至少包括3位,分别对应点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块,1为有效,0为无效;
时钟与功耗控制模块(2)独立产生光栅化模块(1)中点图元光栅化模块(11)、直线图元光栅化模块(12)、三角形图元光栅化模块(13)的工作时钟,并连接到点图元光栅化模块(11)、直线图元光栅化模块(12)、三角形图元光栅化模块(13)中;时钟与功耗控制模块(2)包含分别针对点图元光栅化模块(11)、直线图元光栅化模块(12)、三角形图元光栅化模块(13)的相关时钟门控电路;解析光栅化单元的门控时钟控制信号,将门控时钟控制信号对应位为0的相应光栅化单元的工作时钟关闭。
CN201611139589.9A 2016-12-12 2016-12-12 一种图形处理器光栅化单元的自适应低功耗时钟门控结构 Active CN106709859B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611139589.9A CN106709859B (zh) 2016-12-12 2016-12-12 一种图形处理器光栅化单元的自适应低功耗时钟门控结构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611139589.9A CN106709859B (zh) 2016-12-12 2016-12-12 一种图形处理器光栅化单元的自适应低功耗时钟门控结构

Publications (2)

Publication Number Publication Date
CN106709859A CN106709859A (zh) 2017-05-24
CN106709859B true CN106709859B (zh) 2020-04-07

Family

ID=58937257

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611139589.9A Active CN106709859B (zh) 2016-12-12 2016-12-12 一种图形处理器光栅化单元的自适应低功耗时钟门控结构

Country Status (1)

Country Link
CN (1) CN106709859B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108022201B (zh) * 2017-11-24 2021-09-14 中国航空工业集团公司西安航空计算技术研究所 一种三角形图元并行光栅化定序方法
CN107993184A (zh) * 2017-11-24 2018-05-04 中国航空工业集团公司西安航空计算技术研究所 一种图形处理器深度值提前测试电路
CN108257076B (zh) * 2017-12-06 2021-10-15 中国航空工业集团公司西安航空计算技术研究所 一种图形处理器统一染色阵列低功耗门控时钟
CN113055099B (zh) * 2019-12-26 2022-03-25 大唐移动通信设备有限公司 一种时钟门控模块的检测方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093578A (zh) * 2006-06-23 2007-12-26 辉达公司 光栅化的方法和系统
CN101493717A (zh) * 2009-02-19 2009-07-29 浪潮电子信息产业股份有限公司 一种用于soc的动态多时钟低功耗ahb总线的设计方法
CN105513117A (zh) * 2014-10-10 2016-04-20 三星电子株式会社 调整细节等级的图形处理单元、操作方法及包括其的设备
CN105630441A (zh) * 2015-12-11 2016-06-01 中国航空工业集团公司西安航空计算技术研究所 一种基于统一染色技术的gpu体系架构

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2671206B1 (en) * 2011-02-03 2018-09-12 L-3 Communications Corporation Rasterizer packet generator for use in graphics processor

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093578A (zh) * 2006-06-23 2007-12-26 辉达公司 光栅化的方法和系统
CN101493717A (zh) * 2009-02-19 2009-07-29 浪潮电子信息产业股份有限公司 一种用于soc的动态多时钟低功耗ahb总线的设计方法
CN105513117A (zh) * 2014-10-10 2016-04-20 三星电子株式会社 调整细节等级的图形处理单元、操作方法及包括其的设备
CN105630441A (zh) * 2015-12-11 2016-06-01 中国航空工业集团公司西安航空计算技术研究所 一种基于统一染色技术的gpu体系架构

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
图形处理器低功耗设计技术研究;田泽 等;《计算机科学》;20130630;第40卷(第6A期);210-216 *

Also Published As

Publication number Publication date
CN106709859A (zh) 2017-05-24

Similar Documents

Publication Publication Date Title
CN106709859B (zh) 一种图形处理器光栅化单元的自适应低功耗时钟门控结构
US8570332B2 (en) Graphics processing system with power-gating control function, power-gating control method, and computer program products thereof
US8954775B2 (en) Power gating functional units of a processor
CN110751676A (zh) 一种基于目标检测的异构计算系统、方法和可读存储介质
EP2593860B1 (en) Dynamic enabling and disabling of simd units in a graphics processor
CN106709860B (zh) 一种gpu统一染色处理阵列的调试结构
US20190163255A1 (en) Core off sleep mode with low exit latency
US9122632B2 (en) Programmable power performance optimization for graphics cores
JP2008059556A (ja) 埋め込みメモリと複数レベル電力制御部とを有するシングルチップ三次元及び二次元グラフィックプロセッサ
CN106776023B (zh) 一种自适应gpu统一染色阵列任务负载均衡方法
EP3353746A2 (en) Dynamically switching between late depth testing and conservative depth testing
US10025372B2 (en) Techniques for managing system power using deferred graphics rendering
CN108022201B (zh) 一种三角形图元并行光栅化定序方法
Choi et al. Graphics-aware power governing for mobile devices
US20220366196A1 (en) Methods and apparatus for adaptive object classification
CN106780289B (zh) 基于渲染模式自适应的图形处理器统一染色阵列旁路结构
CN108257076B (zh) 一种图形处理器统一染色阵列低功耗门控时钟
KR20210045544A (ko) 클럭 사이클에 기반하여 전력을 모니터링하는 동적 전력 모니터, 프로세서, 및 시스템 온 칩
WO2016090641A1 (zh) 绘图处理系统及其电源门控方法
KR101945346B1 (ko) 동적 백라이트 제어 기능을 갖는 적응적 부분 스크린 업데이트
CN112306215A (zh) 用于管理逐核的性能状态的技术
Wang et al. A predictive shutdown technique for gpu shader processors
CN115103171A (zh) 一种投影方法、装置、电子设备及存储介质
US11615537B2 (en) Methods and apparatus for motion estimation based on region discontinuity
CN105676995A (zh) 一种实现三维测量芯片低功耗的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant