CN105573473B - 用于性能改善的可重配置图形处理器 - Google Patents
用于性能改善的可重配置图形处理器 Download PDFInfo
- Publication number
- CN105573473B CN105573473B CN201510996403.0A CN201510996403A CN105573473B CN 105573473 B CN105573473 B CN 105573473B CN 201510996403 A CN201510996403 A CN 201510996403A CN 105573473 B CN105573473 B CN 105573473B
- Authority
- CN
- China
- Prior art keywords
- processor
- graphics processor
- graphics
- power
- core
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/324—Power saving characterised by the action undertaken by lowering clock frequency
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/325—Power saving in peripheral device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3287—Power saving characterised by the action undertaken by switching off individual functional units in the computer system
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G5/00—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
- G09G5/36—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G2360/00—Aspects of the architecture of display systems
- G09G2360/08—Power processing, i.e. workload management for processors involved in display operations, such as CPUs or GPUs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Power Sources (AREA)
Abstract
本发明涉及图形处理器。可使用对图形处理器的部分进行功率门控来改善性能或实现功率预算。可对处理器粒度如切片或子切片进行门控。
Description
本申请是申请日为2011年11月21日申请号为第201180074955.6号发明名称为“用于性能改善的可重配置图形处理器”的中国专利申请的分案申请。
背景
本申请总体上涉及计算机系统中的图形处理。
图形处理器在不同的处理条件下运行。在一些情况下,它们可在高功耗模式下以及在低功耗模式下运行。可能令人期望的是,在给定图形处理器所运行的功耗模式的情况下,获得最大的可能性能。
附图简要说明
图1是本发明的一个实施例的框图。
图2是本发明的另一个实施例的流程图。
图3是本发明的一个实施例的示意图描绘。
图4是本发明的一个实施例的性能相对于功率预算的假想图;以及
图5是一个实施例的功率预算相对于时间的假想图。
详细说明
在一些实施例中,图形处理核自动对其自身进行重配置以便通过对图形处理引擎的部分进行动态功率门控来在高功率和低功率包络中增加或最大化性能。如在此所使用的,功率门控包括激活或去激活核部分。
尽管将使用平板计算机图形处理器提供示例,相同的概念应用于任何图形处理器。
图形处理核通常包括执行算数、逻辑和其他操作的多个执行单元。可使用多个采样器进行纹理处理。采样器和多个执行单元是子切片(subslice)。可基于目标性能和功率预算在特定的图形处理核中包括多个子切片。对子切片进行组合以形成图形处理切片(slice)。图形处理核可包含一个或多个切片。在平板计算机图形处理核中,通常使用单个切片以及一个、两个或三个子切片设计。多切片在客户端图形处理器中是常见的。
因此,参见图1,示出了典型的图形处理器核,核10包括切片编号1(标记为14),该切片可包括固定功能流水线逻辑16和多个子切片18a和18b。在一些实施例中,可包括更多切片和更多或更少的子切片。图形处理核还包括固定功能逻辑12。
一个、两个和三个子切片设计的功率和性能特征不同,如图4所示。作为一个示例,在性能对功率耗散曲线图中,性能线性地增加到拐点A(例如,大约2.5瓦)。在该拐点以下,图形处理器在频率成比例的区域中工作,在该区域中,能够在不升高工作电压的情况下升高图形处理器频率。在该拐点以上,图形处理器频率仅在电压也升高时才升高,这通常对功率耗散具有负面影响,并且相比于频率成比例的所述区域,会导致更平缓的性能对功率耗散曲线。
可对图形处理器的子切片中的一个或多个进行功率门控。总体上,子切片越多,性能越高,但是随着可用功率预算的减少,性能差距(gap)会减少,并且可能在图4中存在B点(例如,在大约1.5瓦),在该点处,单一子切片的配置表现得比两个子切片的配置更好。这种更优性能是由于较大配置具有明显更多的泄露功率从而使得较少空间可用于动态功率。在功率预算较低的情况下,可用于动态功率的空间较少的话会显著地限制较大配置的频率和性能,使得其看起来没有更小配置那么吸引人。
在一些实施例中,功率共享机制可用于实现图形处理器子切片的高效动态功率门控。当然,代替对子切片功耗进行门控,相同的概念应用于具有多于一个切片的实施例中的任意数量的图形处理器切片的动态功率门控。
图形处理器可具有功率共享功能,该功能基本上随着时间增加(或降低)功率,如图5所示。在特定的时间点t1处,可由功率控制单元为图形处理器核分配特定低水平的功率预算TDP1,该功率预算迫使图形处理器在特定频率f1下运行,该特定频率是允许图形处理器不超过其分配功率预算的最大频率。当功率预算随着时间增加时,图形核可在逐渐更高的频率下运行。
在子切片功率门控下,功率控制单元事先得知图形处理器核可配置有全套的执行单元和子切片或者配置有更少的执行单元和子切片。例如,一个实施例可包括十六个执行单元和两个子切片并且另一种操作模式可包括八个执行单元和一个子切片。当图形处理器可用的功率预算很小时,可在更小的核配置中配置图形处理器,其中两个可用子切片之一被功率门控。
总体而言,不是简单地在任何特定时间点关闭子切片,因为其可能正在执行有效线程。当功率控制单元确定应当对子切片进行功率门控时,立即动作是阻挡新的图形处理线程被调度到该子切片上。因此,在已经在子切片上执行的线程完成并且子切片变为空闲之前需要一段时间。在一个实施例中,仅当这时对子切片进行实际功率门控。
在功率门控下,当功率预算逐渐增加时,在某一时间点,初始关闭的子切片变为打开。或者,相反地,当处理器从高功率预算变为低功率预算时,可关闭子切片(如图5所示)。
当关闭子切片时,频率可增加或翻倍(如果关闭了两个子切片之一)。结果是,性能可保持相对稳定,因为剩余的子切片运行得比两个子切片快两倍。这种频率增加确保了从较大的未门控图形核到较小的门控图形核的平滑转变(从性能角度出发)。相反地,当子切片未被门控并且我们转变到两切片图形核时,时钟频率减半,以便将总体性能维持在大约相同的水平下。
如上所述的时钟频率改变被设计成在出现功率门控的时间点不显著地中断(例如翻倍或减半)图形核的可缩放部分(图1所示子切片逻辑)的总体性能。然而,如果功率门控的动作由于其低泄露耗散已经产生了更功率高效的图形核,这随后会允许图形核升高其时钟频率和功率耗散从而满足其分配功率预算。这将导致增加的性能,而这就是功率门控的终极目标。
另一方面,当分配给图形核的功率预算增加并允许增加子切片时,将时钟频率减半将初始地保留相同的性能。然而,给定增加的图形功率预算,图形核然后将被允许也升高其频率,这将导致所希望的提高性能的结果。
在如上所述的动态功率门控的过程中升高或降低时钟频率针对图形核的可缩放部分(即,图1所示的子切片)而言运行良好。然而,如果图形核的不可缩放部分(例如,固定功能逻辑12,如图1所示)使用相同的时钟,则改变时钟频率可影响并且可能限制该逻辑的性能。这将不是所希望的。为了避免这种情况,不可缩放逻辑可使用其自身的独立时钟,该独立时钟不受可缩放图形逻辑内的时钟频率改变的影响。
从较大配置切换到较小配置可改善性能,因为其提供了泄露节省并且为更动态的功率提供了空间。同时,从较大配置切换到较小配置可能潜在地导致增加的动态功率,因为频率也相应地增加了。因此,从较大配置转变到较小配置由于相应的频率增加可能在所实现的泄露节省超过了动态功率成本时发生。当这种情况保持时,这种转变将存在净功率节省并且有余地来继续增加频率并且实现净性能增益。
因此,举一个例子,在十六执行单元下,两子切片单元转变到八执行单元,一个子切片单元作为功率门控的结果,以下泄露增量(LD)等式适用:
其中f8和f16是在功率门控或不门控事件发生时的时间点处八和十六执行单元配置的频率;V8和V16是当功率门控事件发生时两个图形处理核的工作电压;C8和C16是当功率门控事件发生时两个图形处理核的切换电容;Cmax8和Cmax16是对于功率病毒(virus)工作负载,两个图形核的最大切换电容;以及AR16和AR8是就在功率门控或不门控事件之前和之后的两个核的应用率。应用的“应用率”被定义为当该应用在核上执行时图形核切换电容与图形核功率病毒的切换电容的比率。
这些等式可用于决定是否发起子切片功率门控。可能已经由图形处理器支持的封装功率共享机制涉及作为运行条件的函数的泄露功率的知识,包括管芯、电压以及温度并且通常熔融到该部分中,这样使得这种信息是可用的。根据该信息,还可通过简单地用当对子切片进行功率门控时合适的数字来缩放总泄露来动态地计算功率门控图形核的泄露增量。
如果图形处理核当前被配置为十六执行单元、两子切片核,f16和V16是其当前频率和电压并且然后在对子切片进行功率门控后所切换至的目标频率f8是f16的两倍。还事先已知匹配电压V8。可使用在一些图形处理引擎中已经可用的涡轮能量计数器来估计当前切换电容C16。最大电容Cmax8也是事先已知并且熔融到该部分中的静态量。
因此,上述两个等式中未知并且不能直接使用现有的功率共享基础设施计算的量是目标切换电容C8以及我们想切换到其上的较小配置的目标应用率AR8。这两个量实质上是等效的,因为一个量可从另一个量计算(C8=AR8*Cmax8))。
一种估计C8或AR8的方法如下所述。针对大范围的工作负载,不同图形工作负载所采取的硅测量可表明在较大图形核上运行的工作负载的应用率比在较小图形核上运行的相同工作负载的应用率低相对可预测的扩展因数,如0.8x或0.7x。因此,一种途径是对在功率门控或不门控的图形核上运行的一系列应用执行后硅表征。然后可计算平均十六执行单元相对于八执行单元应用率缩放因数并且将其编程为静态应用率缩放因数。当活跃在十六执行单元模式中时,图形核可使用可用的涡轮能量计数器动态地估计其当前应用率并且然后通过使用上述缩放因数投射其在八个执行单元中运行时将具有的应用率AR8。
可替代地,能量监测计数器可用于将能量计数器的值不仅与当前十六执行单元图形核(C16)而且与我们将在功率门控发生后切换到其上的目标十六执行单元图形核相关(通过曲线拟合方法)。一旦估计了该电容,等式(2)可用于做出功率门控决定。这种方法可比之前的方法更准确,但是可能针对16和8执行单元配置两者而言涉及能量监测计数器的更详细的并且更耗时的后硅表征。
一旦已经完成了在从十六转变到八执行单元时采取的功率门控的决定,可测量功率并且因此还确定新的八执行单元配置中的切换电容或应用率。如果其证明比所估计的高很多,则所采取的功率门控决定是错误的。在这种情况下,可将决定反转,转变回较大配置。另一方面,如果在功率门控之前正确地完成了较小配置的电容估计,则在转变到较小配置后测量的额外动态功率小于功率节省。在这种情况下,可维护新的配置并且功率共享机制自然地推到一定程度上更高的频率,这是由相同性能处的净功率减少所导致的,提供了性能增益。当然,相同的考虑因素可用于处理多个子切片或切片的功率门控。
在去激活核部分的情况下,我们可在一些情况下从八执行单元图形核转变到十六执行单元图形核。我们可使用等式(1)和(2)来确保十六执行单元图形核的额外泄露将低于通过将时钟频率减半所实现的动态功率节省。在这种情况下,时钟频率可升高,这将增加性能。
图2示出了根据本发明的某些实施例的用于做出功率门控确定的序列。可在硬件、软件和/或固件中实现该序列。在软件和硬件实施例中,它可实现在存储在非瞬态计算机可读介质(如磁、光学、或半导体存储)中存储的计算机执行指令中。
在状态1中,在这个示例中,一个子切片活动,如框20所示。棱形22处的检查确定功率控制单元是否请求新的图形处理器涡轮频率。如果是,棱形24处的检查确定是否满足打开第二子切片的条件。如果否,设置新的图形涡轮频率(框26),如功率控制单元所请求的。如果是,打开第二子切片。设置试探图形处理器频率(框28),并且然后使功率门控决定生效。如果生效成功,如棱形30所确定的,流程进行到状态2。如果否,再次对子切片进行功率门控,如框32所示,并且处理器返回状态1。
在状态2,两个子切片活动,如框34所示,棱形36处的检查确定功率控制单元是否已经请求新的图形处理器涡轮频率。如果是,棱形38处的检查确定是否满足关闭子切片的条件。如果不满足,设置新的图形处理器涡轮频率(框40),如所请求的。否则,在框42,终止目标子切片上的线程调度。该序列等待目标子切片变为空闲,并且然后当它如此时,关闭目标子切片。设置试探图形频率,并且然后使功率不门控决定生效。如果决定在棱形44处生效,流程返回状态1。否则,再次将子切片上电,如框46所示。
图3所示的计算机系统130可包括通过总线104耦合到芯片集核逻辑110的硬盘驱动器134和可移除介质136。计算机系统可是任意计算机系统,包括智能移动装置,如智能电话、平板计算机或移动互联网装置。键盘和鼠标120或其他常规组件可通过总线108耦合到芯片集核逻辑。在一个实施例中,核逻辑可通过总线105耦合到图形处理器112以及中央处理器100。图形处理器112还可通过总线106耦合到帧缓冲器114。帧缓冲器114还可通过总线107耦合到显示屏118。在一个实施例中,图形处理器112可是使用单指令多数据(SIMD)架构的多线程多核并行处理器。
在软件实现的情况下,相关代码可存储在任何适当的半导体、磁、或光学存储器中,包括图形处理器中的主存储器132(如139处所示)或任意可用的存储器。因此,在一个实施例中,用于执行图2的序列的代码可存储在非瞬态机器或计算机可读介质中,如存储器132、和/或图形处理器112、和/或中央处理器100,并且在一个实施例中可由处理器100和/或图形处理器112执行。
在此所述的图形处理技术可在各种硬件架构中实现。例如,可将图形功能集成在芯片集中。可替代地,可使用离散图形处理器。作为又一个实施例,可通过通用处理器实现图形功能,包括多核处理器。
贯穿本说明书对“一个实施例”或“实施例”的引用是指在此结合实施例所述的特定特征、结构或特性包括在本发明中所包含的至少一种实现方式中。因此,短语“一个实施例”或“在实施例中”的出现并非必须指代相同的实施例。此外,特定的特征、结构或特性可被设置为其他合适的形式而不是所展示的特定实施例,并且所有这种形式可包含在本申请的权利要求中。
尽管已经针对有限数量的实施例描述了本发明,本领域技术人员将认识到从其延伸的多种修改和变形。旨在所附权利要求书涵盖所有这种修改和变形,落入本发明的真实精神和范围中。
Claims (18)
1.一种图形处理器,包括:
存储器;
界面逻辑;
所述图形处理器的第一独立可门控的部分和第二独立可门控的部分;以及
用于对所述图形处理器的所述第一独立可门控的部分而不是所述第二独立可门控的部分进行功率门控以使所述第一独立可门控的部分被打开而所述第二独立可门控的部分被关闭的逻辑,所述逻辑还用于改变被打开部分的数量,并且使所述图形处理器在工作电压不升高但能够升高图形处理器频率的区域中操作。
2.如权利要求1所述的处理器,其特征在于,所述部分之一是处理器核。
3.如权利要求2所述的处理器,其特征在于,所述部分的两者是处理器核。
4.如权利要求1所述的处理器,包括功率控制器。
5.如权利要求1所述的处理器,包括多个分开的、相同的处理单元。
6.如权利要求5所述的处理器,其特征在于,所述处理单元被独立地功率门控。
7.一种存储指令的非瞬态计算机可读介质,其中计算机执行所述指令以:
对图形处理器的第一部分而不是第二部分进行功率门控,以使所述第一部分被打开而所述第二部分被关闭;以及
改变被打开部分的数量,并且使所述图形处理器在工作电压不升高但能够升高图形处理器频率的区域中操作,
其中所述第一部分和所述第二部分是所述图形处理器的独立可门控的部分。
8.如权利要求7所述的非瞬态计算机可读介质,其特征在于,所述部分之一是处理器核。
9.如权利要求8所述的非瞬态计算机可读介质,其特征在于,所述部分的两者是处理器核。
10.如权利要求7所述的非瞬态计算机可读介质,其特征在于,所述图形处理器包括功率控制器。
11.如权利要求7所述的非瞬态计算机可读介质,其特征在于,所述图形处理器包括多个分开的、相同的处理单元。
12.如权利要求11所述的非瞬态计算机可读介质,其特征在于,所述处理单元被独立地功率门控。
13.一种用于改善图形处理器性能的设备,所述设备包括:
用于对图形处理器的第一部分而不是第二部分进行功率门控以使所述第一部分被打开而所述第二部分被关闭的装置;以及
用于改变被打开部分的数量,并且使所述图形处理器在工作电压不升高但能够升高图形处理器频率的区域中操作的装置,
其中所述第一部分和所述第二部分是所述图形处理器的独立可门控的部分。
14.如权利要求13所述的设备,其特征在于,所述部分之一是处理器核。
15.如权利要求14所述的设备,其特征在于,所述部分的两者是处理器核。
16.如权利要求13所述的设备,其特征在于,所述图形处理器包括功率控制器。
17.如权利要求13所述的设备,其特征在于,所述图形处理器包括多个分开的、相同的处理单元。
18.如权利要求17所述的设备,其特征在于,所述处理单元被独立地功率门控。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510996403.0A CN105573473B (zh) | 2011-11-21 | 2011-11-21 | 用于性能改善的可重配置图形处理器 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201180074955.6A CN103959196A (zh) | 2011-11-21 | 2011-11-21 | 用于性能改善的可重配置图形处理器 |
CN201510996403.0A CN105573473B (zh) | 2011-11-21 | 2011-11-21 | 用于性能改善的可重配置图形处理器 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180074955.6A Division CN103959196A (zh) | 2011-11-21 | 2011-11-21 | 用于性能改善的可重配置图形处理器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105573473A CN105573473A (zh) | 2016-05-11 |
CN105573473B true CN105573473B (zh) | 2019-04-30 |
Family
ID=55888373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510996403.0A Active CN105573473B (zh) | 2011-11-21 | 2011-11-21 | 用于性能改善的可重配置图形处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105573473B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110703998B (zh) | 2019-09-29 | 2021-11-09 | 百度在线网络技术(北京)有限公司 | 存储器的控制方法、控制器、芯片及电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101802751A (zh) * | 2007-06-27 | 2010-08-11 | 高通股份有限公司 | 多媒体处理功率管理的功率门控 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7119808B2 (en) * | 2003-07-15 | 2006-10-10 | Alienware Labs Corp. | Multiple parallel processor computer graphics system |
US20110213950A1 (en) * | 2008-06-11 | 2011-09-01 | John George Mathieson | System and Method for Power Optimization |
-
2011
- 2011-11-21 CN CN201510996403.0A patent/CN105573473B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101802751A (zh) * | 2007-06-27 | 2010-08-11 | 高通股份有限公司 | 多媒体处理功率管理的功率门控 |
Also Published As
Publication number | Publication date |
---|---|
CN105573473A (zh) | 2016-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108509021A (zh) | 用于性能改善的可重配置图形处理器 | |
US9613393B2 (en) | Closed loop CPU performance control | |
Liu et al. | Dynamic thread mapping for high-performance, power-efficient heterogeneous many-core systems | |
Chen et al. | Statistical GPU power analysis using tree-based methods | |
Santriaji et al. | GRAPE: Minimizing energy for GPU applications with performance requirements | |
TWI489266B (zh) | 指定應用程式執行緒的效能狀態之指令 | |
Kodama et al. | Evaluation of power management control on the supercomputer fugaku | |
JP5345990B2 (ja) | 特定のプロセスを短時間で処理する方法およびコンピュータ | |
JP2013532855A (ja) | グラフィクスプロセッサにおけるsimdユニットの動的な有効化及び無効化 | |
US10515611B2 (en) | Performance-based graphics processing unit power management | |
Holmbacka et al. | Energy efficiency and performance management of parallel dataflow applications | |
Valery et al. | A collaborative CPU–GPU approach for principal component analysis on mobile heterogeneous platforms | |
US10242652B2 (en) | Reconfigurable graphics processor for performance improvement | |
CN105573473B (zh) | 用于性能改善的可重配置图形处理器 | |
Wang | Power analysis and optimizations for GPU architecture using a power simulator | |
Tian et al. | Collaborative power management through knowledge sharing among multiple devices | |
Holmbacka et al. | Performance monitor based power management for big. LITTLE platforms | |
Wang et al. | Evaluating the energy consumption of openmp applications on haswell processors | |
Villebonnet et al. | Towards Generalizing" Big Little" for Energy Proportional HPC and Cloud Infrastructures | |
Broyde et al. | MobiCore: An adaptive hybrid approach for power-efficient CPU management on Android devices | |
Tran et al. | Power models supporting energy-efficient co-design on ultra-low power embedded systems | |
Wang et al. | A predictive shutdown technique for gpu shader processors | |
Vinay et al. | Light weight rl based run time power management methodology for edge devices | |
Chiou et al. | A data-traffic aware dynamic power management for general-purpose graphics processing units | |
Wang et al. | Execution units power-gating to improve energy efficiency of GPGPUs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |