CN104704469B - 动态地重新平衡图形处理器资源 - Google Patents
动态地重新平衡图形处理器资源 Download PDFInfo
- Publication number
- CN104704469B CN104704469B CN201380052244.8A CN201380052244A CN104704469B CN 104704469 B CN104704469 B CN 104704469B CN 201380052244 A CN201380052244 A CN 201380052244A CN 104704469 B CN104704469 B CN 104704469B
- Authority
- CN
- China
- Prior art keywords
- resource
- graphics processor
- frequency
- clock signal
- different
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Power Sources (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
根据某些实施例,通过在各资源之间动态地重新平衡工作负荷,可以减轻图形处理器单元内的特定资源中出现的性能瓶颈,其目标为消除当前性能瓶颈,同时将功率耗散维持在当前分配的功率预算内。在某些实施例中,这可以通过为多个图形处理器资源中的每一个定义单独的时钟域来实现,然后,资源的性能可以被重新平衡。
Description
背景
本文一般涉及图形处理器。
图形处理器一般负责生成出现在计算机系统中的显示。每一图形处理器核都可包括执行不同类型的操作的若干个不同的资源。例如,图形核可包括实现DirectX(DX)或其他渲染流水线的各阶段的固定功能逻辑、处理纹理的纹理采样器、执行算术和数学运算的执行单元、执行像素填充和混合操作的像素后端,等等。
在图形核上执行的工作负荷在它们的特征方面有差异,并可能会给图形核中可用的不同的资源带来不同程度的压力,从而由于一个资源相对于其他资源的过载而产生性能瓶颈。例如,某些工作负荷可能是纹理密集的,它们在纹理采样器中产生性能瓶颈。其他工作负荷可能要求密集的数学运算,从而在执行单元中产生性能瓶颈。
此外,特定工作负荷的特征还可能随着时间而变化,导致动态地从一个资源移到另一个资源的性能瓶颈。
附图简述
参考下面的图形来描述一些实施例:
图1是根据一实施例的图形处理单元核的示意描绘;
图2是本发明的一个实施例的流程图;
图3是本发明的一个实施例的系统描绘;以及
图4是本发明的一个实施例的正面前视图。
具体实施方式
根据某些实施例,可以通过在各资源之间动态地重新平衡工作负荷来减轻图形处理器单元内的特定资源中出现的性能瓶颈,目标在于消除当前性能瓶颈、同时将功率耗散维持在当前分配的功率预算内。在某些实施例中,这可以通过为多个图形处理器资源中的每一个定义单独的时钟域来实现,然后,资源的性能可以被重新平衡。
假定常常通过将工作请求提交到特定图形处理器资源专用的队列中以在该特定图形处理器资源上调度工作,则通过定义量化多个图形处理器资源中的每一个的利用率的当前程度的利用率度量,可以实时地实现重新平衡。资源利用率度量的一个示例是特定资源的工作队列的状态。即,队列越满或越空,该资源越被过度使用或不太过度使用,对重新平衡的需要越大。然而,也可以使用其他利用率度量。
参考图1,在某些实施例中,可以被重新平衡的图形处理单元核10资源包括三维固定功能12、像素后端18以及计算切片22a和22b。每一计算切片22都包括采样器24和若干个执行单元26。当工作负荷在图形核上执行时,取决于该工作负荷的特征,可能会在图形核上可用的资源中的任何一个中产生性能瓶颈。
图形处理器核也可以包括高速缓存20、介质固定功能单元14以及存储器接口16。
根据一些实施例,在图形核中,可动态地将处理能力从使用不足的资源转移到过度使用的资源。在某些实施例中,这可以减轻性能瓶颈,并改善可用功率预算内的总体性能。
某些图形处理器核针对功率受限的市场细分。这些常常是大部分时间在它们的频率缩放区域内操作的设计,其中,图形处理器核以其最小操作电压操作,时钟频率也可以在一定的限度内降低或提高,无需改变操作电压。
如此,在某些实施例中,向被过分地使用的图形处理器资源分配较高时钟频率和较大的功率预算,向被相对比较轻微地使用的资源分配较低的时钟频率和功率预算。取决于资源在任何给定时间点的繁忙度,可以随着时间的推移提高或降低每一图形处理器资源的已分配的时钟频率。
在实践中,在一个实施例中,可以通过由不太被频繁使用的资源作出的降低它们自己的时钟频率的本地决定来实现此分配。结果,这些不太被频繁使用的资源的功率耗散被降低,由此,将整体图形核的功率耗散降低到低于其当前分配的预算。此外,图形处理器核中的被过分地使用的资源可以提高它们的时钟频率,并将图形处理器核功率预算装填回到已分配的级别。在短过渡时期结束时,比较忙的图形资源相对于不太繁忙的图形处理器资源使用比之前更高的时钟频率。
可以通过对于每一个图形处理器资源使用单独的时钟频率来定义并管理图形处理器核中的不同的时钟域。每一时钟频率都可能来自专用于特定资源的锁相回路或来自可以将基准时钟频率除以各种比率的单一锁相回路或几个锁相回路。如果图形处理器核中的所有资源都从同一个电压调节器供电,那么,最忙的图形处理器资源所需的最快时钟频率确定电压调节器的电压设置。
可另选地,核外部的、或与核集成在同一个芯片中的多个电压调节器可以用于不同的图形处理器资源,根据需要,允许某些资源独立地提高它们的电压和频率,而不会强制其他图形处理器资源也以较高电压操作。结果,比较忙的图形处理器资源以比不太忙的图形处理器资源更高的电压和频率操作。
产生不同的时钟域的另一种方式是对于核中的所有资源使用单一电压域和单一基准时钟频率,同时通过时钟沿跳过来允许每一资源生成较低的有效本地时钟频率。在时钟沿跳过中,所需数量的时钟沿被掩盖。例如,将三个时钟沿中的两个掩盖本质上将时钟频率除以三。
对于大部分时间都完全地在它们的频率缩放区域内操作的图形处理器核,基准图形时钟频率可以在一定的限度内上升和下降,而操作电压在其最小值保持不变。对于最常见的维持的工作负荷和使用模型,这样的图形处理器核有足够的空间来重新平衡它们的资源的本地时钟频率,无需将操作的电压提高为高于最小电压。
图形处理器核中的每一资源都可以跟踪其自己的利用率,在一个实施例下,当利用率低时,作出降低其本地时钟频率的决定。可另选地,可以有跟踪不同资源的利用率并作出有关每一资源的本地时钟频率的决策的集中式资源。
如果由于某些资源降低它们的时钟频率,整体图形处理器核的功率耗散下降,那么,为整体图形核创建某种功率预算净空。这允许所有资源的时钟频率的提高,包括当前遭遇性能瓶颈的那些资源。允许对于性能瓶颈增大时钟频率会提高由图形处理器核作为整体呈现的性能级别。在某些情况下,提高资源时钟频率还可以要求整体图形处理器核的电压或(在使用多个电压调节器的情况下)图形处理器核中的最忙的资源的电压进行改变。然而,主要在它们的频率缩放区域内操作的许多功率受限的设计大部分时间不需要提高电压。
根据如图2所示的一个实施例,重新平衡方案可以以软件、固件和/或硬件来实现。在软件和固件实施例中,它可以通过存储在诸如磁性、光学或半导体存储器之类的一个或多个非瞬态计算机可读介质中的计算机执行指令来实现。
在图2中,描绘了若干个不同的图形处理器资源。在菱形30,每一资源都可以检查资源利用率是否降低到预定义的阈值以下。如果不,则资源简单地继续周期性地检查资源利用率是否降低到某种预定义的阈值以下。
相反,如果资源利用率降低到低于阈值以下,那么,可以降低本地时钟频率,如在框32中指出的。
然后,对于所有资源的周期性地检查(菱形34)可以判断整体图形核的功率耗散是否降低到低于当前预算的级别以下。如果不,则流程迭代。
否则,可以提高全部资源的时钟频率(框36),从而节省总的图形功率预算。然后,当流程对于每一个资源迭代再次回到框30时,那些资源可以酌情逐步地降低它们的本地时钟频率。
在其他实施例中,检查可以判断利用率是否增至高于预定义的阈值,如果是这样的情况,则提高本地时钟频率。根据本发明的某些实施例,也可以实现其他方案。
图3示出了系统700的实施例。在各实施例中,系统700可以是媒体系统,虽然系统700不仅限于此上下文。例如,系统700可集成到个人计算机(PC)、膝上型计算机、超膝上型计算机、平板计算机、触摸板、便携式计算机、手持式计算机、掌上计算机、个人数字助理(PDA)、蜂窝电话、蜂窝电话/PDA的组合、电视机、智能设备(例如,智能电话、智能平板计算机或智能电视机)、移动因特网设备(MID)、消息收发设备、数据通信设备等等。
在各实施例中,系统700包括耦合到显示器720的平台702。平台702可以从诸如内容服务设备(多个)730、或内容递送设备(多个)740之类的内容设备或其他类似的内容源接收内容。包括一个或多个导航特征的导航控制器750可被用来与例如平台702和/或显示器720交互。在下文中更详细地描述这些组件中的每个。
在各实施例中,平台702可以包括芯片组705、处理器710、存储器712、存储714、图形子系统715、应用716、全球定位系统(GPS)721、相机723和/或无线电718的任何组合。芯片组705可以在处理器710、存储器712、存储714、图形子系统715、应用程序716、和/或无线电718之间提供相互通信。例如,芯片组705可以包括能够提供与存储714的相互通信的存储器适配器(未描绘)。
另外,平台702还可以包括操作系统770。通向处理器772的接口可以与操作系统和处理器710连接。
可以提供固件790以实现诸如引导序列之类的功能。可以提供更新模块以使得固件能够从平台702外面更新。例如,更新模块可以包括用于判断更新尝试是否是可信的、并用于标识固件790的最近的更新以促进对何时需要更新的判定的代码。
在某些实施例中,平台702可以由外部电源来供电。在某些情况下,平台702还可包括内部电池780,该内部电池780在不适用于外部电源的各实施例中或在允许电池作电源或者外部电源作电源的各实施例中,充当电源。
如图2所示的序列可以以软件和固件实施例,通过将它们包括在存储器714内或处理器710内的存储器内或图形子系统715内来实现,仅举几个例子。在一个实施例中,图形子系统715可以包括图形处理单元,而处理器710可以是中央处理单元。
处理器710可以实现为复杂指令集计算机(CISC)或精简指令集计算机(RISC)处理器、x86指令集兼容的处理器、多核、或任何其他微处理器或中央处理单元(CPU)。在各实施例中,处理器710可包括双核处理器(多个)、双核移动处理器(多个)等等。
存储器712可实现为易失性存储设备,例如但不限于,随机存取存储器(RAM)、动态随机存取存储器(DRAM)或静态RAM(SRAM)。
存储714可实现为非易失性存储设备,例如但不限于,磁盘驱动器、光盘驱动器、磁带驱动器、内部存储设备、附属存储设备、闪存、电池供电SDRAM(同步DRAM)和/或网络可访问存储设备。在各实施例中,存储714可包括用于在例如包括多个硬驱动器时提高有价值数字媒体的存储性能改善保护的技术。
图形子系统715可以对诸如静止图像或视频之类的图像执行处理以供显示。图形子系统715可以例如是图形处理单元(GPU)或视觉处理单元(VPU)。模拟或数字接口可用于通信地耦合图形子系统715和显示器720。例如,接口可以是高清多媒体接口、显示端口(DisplayPort)、无线HDMI,和/或无线HD兼容技术中的任何一个。图形子系统715可被集成至处理器710或芯片组705中。图形子系统715可以是可通信地耦合到芯片组705的独立卡。
本文中所描述的图形和/或视频处理技术可在各种硬件架构中实现。例如,图形和/或视频功能可被集成在芯片组中。替代地,可使用分立的图形和/或视频处理器。作为又一实施例,图形和/或视频功能可由包括多核处理器的通用处理器实现。在又一实施例中,这些功能可实现在消费者电子设备中。
无线电718可以包括能够使用各种合适的无线通信技术传输和接收信号的一个或多个无线电。这些技术可涉及跨一个或多个无线网络的通信。示例性无线网络包括(但不限于)无线局域网(WLAN)、无线个域网(WPAN)、无线城域网(WMAN)、蜂窝网络以及卫星网络。在跨这样的网络的通信中,无线电718可以根据任何版本的一个或多个适用的标准来操作。
在各实施例中,显示器720可包括任何电视机型监视器或显示器。显示器720可包括例如计算机显示屏、触摸屏显示器、视频监视器、电视机类设备和/或电视机。显示器720可以是数字和/或模拟的。在各实施例中,显示器720可以是全息显示器。此外,显示器720还可以是可接收视觉投影的透明表面。这样的投影可以传达各种形式的信息、图像,和/或对象。例如,这样的投影可以是用于移动增强现实(MAR)应用的视觉覆盖。在一个或多个软件应用程序716的控制下,平台702可以在显示器722上显示用户界面720。
在各实施例中,内容服务设备730可由任何国内、国际和/或独立服务所主控,并因此可经由例如因特网对平台702访问。内容服务设备(多个)730可以耦合到平台702和/或显示器720。平台702和/或内容服务设备(多个)730可以耦合到网络760,以往返于网络760地通信(例如,发送和/或接收)媒体信息。内容递送设备740还可以耦合到平台702和/或显示器720。
在各实施例中,内容服务设备(多个)730可包括有线电视机顶盒、个人计算机、网络、电话、启用互联网的设备或能够传递数字信息和/或内容的设施,以及能够经由网络760或直接地在内容提供者和平台702和/显示器720之间单向或双向地交换内容的任何其它类似设备。可以理解,可以通过网络760往返于系统700中的组件中的任何一个和内容提供商来单向地和/或双向地传递内容。内容的示例可包括任何媒体信息,包括例如视频、音乐、医疗和游戏信息等等。
内容服务设备(多个)730接收内容,诸如有线电视节目,包括媒体信息、数字信息和/或其他内容。内容提供者的示例可包括任何有线或卫星电视或无线电或者互联网内容提供者。给出的例子不旨在对本发明的实施例构成限制。
在各实施例中,平台702可从具有一个或多个导航特征的导航控制器750接收控制信号。控制器750的导航特征可以被用来例如与用户界面722进行交互。在一些实施例中,导航控制器750可以是定点设备,它可以是允许用户将空间(例如连续和多维)数据输入到计算机中的计算机硬件组件(具体地说是人机接口设备)。许多系统——例如图形用户接口(GUI)以及电视机和监视器——允许用户使用身体姿势控制并将数据提供给计算机或电视机。
可以通过指针、光标、焦点环或显示在显示器上的其他可视指示器将控制器750的导航特征的移动反映到显示器(例如,显示器720)上。例如,在软件应用716的控制下,位于导航控制器750上的导航特征可以被映射到例如用户界面722上显示的虚拟导航特征。在各实施例中,控制器750可以不是单独组件,而是集成到平台702和/或显示器720上。然而,各实施例并不限于这些元件或在本文中示出或描述的上下文中不受限制。
在各实施例中,驱动器(未示出)可包括技术,该技术例如当被启用时用于允许用户在最初引导之后通过触摸按钮立刻接通和切断类似电视机的平台702(例如当被启用时)。在平台被“关闭”时,程序逻辑可以允许平台702将内容流传输到媒体适配器或其他内容服务设备(多个)730或内容递送设备(多个)740。另外,芯片组705可包括对例如5.1环绕声和/或高清7.1环绕声的硬件和/或软件支持。驱动器可包括用于集成的图形平台的图形驱动器。在一些实施例中,图形驱动器可包括快速外围组件互连(PCI)图形卡。
在各实施例中,系统700中所示组件中的任意一个或多个可以是集成的。例如,可以集成平台702和内容服务设备(多个)730,或者也可以集成平台702和内容递送设备(多个)740,或者,例如,也可以集成平台702、内容服务设备(多个)730,以及内容递送设备(多个)740。在各实施例中,平台702和显示器720可以是集成单元。例如,可以集成显示器720和内容服务设备(多个)730,或者也可以集成显示器720和内容递送设备(多个)740。这些例子不旨在对本发明构成限制。
在各实施例中,系统700可实现为无线系统、有线系统或两者的组合。当实现为无线系统时,系统700可以包括适用于通过无线共享介质进行通信的组件和接口,诸如一个或多个天线、发射器、接收器、收发机、放大器、滤波器、控制逻辑等等。无线共享媒体的示例可包括无线频谱的一些部分,例如RF频谱等。当实现为有线系统时,系统700可包括适于在有线通信介质上通信的组件和接口,例如输入/输出(I/O)适配器、将I/O适配器与相应的有线通信介质连接的物理连接器、网络接口卡(NIC)、盘控制器、视频控制器、音频控制器等。有线通信介质的示例可包括,线路、缆线、金属导线、印刷电路板(PCB)、背板、交换机结构、半导体材料、双绞线、同轴电缆、光纤等等。
平台702可以建立一个或多个逻辑或物理信道以传递信息。该信息可包括媒体信息和控制信息。媒体信息可指代表针对用户的内容的任何数据。内容的示例可以包括,例如,来自语音谈话、视频会议、流式视频、电子邮件(email)消息、语音邮件消息、字母数字符号、图形、图像、视频、文本等等的数据。来自语音会话的数据可以是,例如,语音信息、静默时段、背景噪声、舒适噪声、音调等等。控制信息可以是指表示用于自动化系统的命令、指令或控制字的任何数据。例如,控制信息可用于使媒体信息路由通过系统,或指示节点以预定方式处理该媒体信息。然而,各实施例不仅限于图3中所示出的或所描述的上下文中的元件。
如上文所描述的,系统700可以以不同的物理样式或形状因数来体现。图4示出了其中可以实现系统700的小形状因数设备800的各实施例。在一些实施例中,例如设备800可被实现为具有无线能力的移动计算设备。移动计算设备可指具有处理系统以及移动电源或供电(诸如一个或多个电池)的任何设备。
如前所述,移动计算设备的示例可包括个人计算机(PC)、膝上计算机、超级膝上型计算机、平板计算机、触摸板、便携式计算机、手持式计算机、掌上计算机、个人数字助理(PDA)、蜂窝电话、组合式蜂窝电话/PDA、电视机、智能设备(例如智能电话、智能平板计算机或智能电视机)、移动互联网设备(MID)、消息收发设备、数据通信设备等。
移动计算设备的示例也可包括被配置成由人们佩戴的计算机,例如手腕式计算机、手指式计算机、戒指式计算机、眼镜式计算机、皮带夹计算机、臂带式计算机、鞋式计算机、服饰式计算机以及其它可佩戴计算机。在各实施例中,例如移动计算设备可被实现为能够执行计算机应用以及语音通信和/或数据通信的智能电话。尽管已经以实现为智能电话的移动计算设备为例描述了一些实施例,但可理解其他实施例也可利用其他无线移动计算设备来实现。这些实施例不限于这种背景。
如图4所示,设备800可以包括外壳802、显示器804、输入/输出(I/O)设备806以及天线808。设备800还可包括导航特征812。显示器804可以包括用于显示适合于移动计算设备的信息的任何合适的显示单元。I/O设备806可包括任何适当I/O设备,用以将信息输入到移动计算设备中。I/O设备806的示例可以包括字母数字键盘、数字键区、触摸板、输入键、按钮、开关、往复式开关、话筒、扬声器、语音识别设备以及软件等等。信息也可借助麦克风被输入到设备800中。该信息可通过语音识别设备数字化。这些实施例不限于这种背景。
各个实施例可利用硬件部件、软件部件或两者的组合来实现。硬件部件的示例可包括处理器、微处理器、电路、电路元件(例如晶体管、电阻器、电容器、电感器等)、集成电路、专用集成电路(ASIC)、可编程逻辑器件(PLD)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、逻辑门、寄存器、半导体器件、芯片、微芯片、芯片组等等。软件的示例可包括软件组件、程序、应用、计算机程序、应用、系统程序、机器程序、操作系统软件、中间件、固件、软件模块、例程、子例程、函数、方法、程序、软件接口、应用接口(API)、指令集、计算代码、计算机代码、代码片段、计算机代码片段、字、值、符号或它们的任意组合。判断一个实施例是否使用硬件元件或软件元件来实现可以根据任意数量的因素而不同,如所希望的计算速率、功率级别、耐热性、处理周期预算、输入数据率、输出数据率、存储器资源、数据总线速度及其他设计或性能约束。
至少一个实施例的一个或多个方面可以由存储在机器可读介质上的表示性指令来实现,该指令表示处理器中的各种逻辑,该指令在被机器读取时使得该机器制作用于执行本文所述的技术的逻辑。被称为“IP核”的这样的表示可以存储在有形的机器可读介质中,并提供给各种客户或生产设施,以加载到实际制造逻辑或处理器的制造机器中。
各个实施例可利用硬件部件、软件部件或两者的组合来实现。硬件部件的示例可包括处理器、微处理器、电路、电路元件(例如晶体管、电阻器、电容器、电感器等)、集成电路、专用集成电路(ASIC)、可编程逻辑器件(PLD)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、逻辑门、寄存器、半导体器件、芯片、微芯片、芯片组等等。软件的示例可包括软件组件、程序、应用、计算机程序、应用、系统程序、机器程序、操作系统软件、中间件、固件、软件模块、例程、子例程、函数、方法、程序、软件接口、应用接口(API)、指令集、计算代码、计算机代码、代码片段、计算机代码片段、字、值、符号或它们的任意组合。判断一个实施例是否使用硬件元件或软件元件来实现可以根据任意数量的因素而不同,如所希望的计算速率、功率级别、耐热性、处理周期预算、输入数据率、输出数据率、存储器资源、数据总线速度以及其他设计或性能约束。
至少一个实施例的一个或多个方面可以由存储在机器可读介质上的表示性指令来实现,该指令表示处理器中的各种逻辑,该指令在被机器读取时使得该机器制作用于执行本文所述的技术的逻辑。被称为“IP核”的这样的表示可以存储在有形的机器可读介质中,并提供给各种客户或生产设施,以加载到实际制造逻辑或处理器的制造机器中。
此处所描述的图形处理技术可以以各种硬件架构来实现。例如,图形功能可以集成在芯片组内。可另选地,可以使用单独的图形处理器。作为再一个实施例,图形功能可以通过通用处理器(包括多核处理器)来实现。
说明书中对“一个实施例”、“实施例”的引用意味着结合该实施例所描述的特定特征、结构或特性被包括在本发明内涵盖的至少一个实现中。因此,短语“一个实施例”或“在一个实施例中”的出现不一定是指同一个实施例。此外,还可以以除所示出的特定实施例以外的其他合适的形式构成特定特征、结构或特性,所有这样的形式都可以涵盖在本申请的权利要求书内。
尽管是参考数量有限的实施例来描述本发明的,但是,本领域技术人员将从其中理解很多修改和变体。所附权利要求书旨在涵盖落在本发明的真正的精神和范围内的所有这样的修改和变体。
Claims (23)
1.一种用于图形处理的方法,包括:
分析图形处理单元内的资源的工作负荷;
对于不同的资源启用不同的时钟域,包括:向所述图形处理单元的一个资源提供第一频率的第一时钟信号、使用时钟沿跳过从所述第一时钟信号生成与所述第一频率不同的第二频率的第二时钟信号、将所述第二时钟信号提供给所述图形处理单元的不同资源;以及
在那些资源之间重新平衡工作负荷。
2.如权利要求1所述的方法,其特征在于,包括:检查资源利用率是否降低到阈值以下。
3.如权利要求2所述的方法,其特征在于,包括:如果是,则降低资源的本机频率。
4.如权利要求3所述的方法,其特征在于,包括:检查整体功率耗散是否由于降低所述资源的本机频率而下降。
5.如权利要求4所述的方法,其特征在于,包括:如果是,则提高多个资源的时钟频率。
6.如权利要求1所述的方法,其特征在于,包括:分析三维固定功能、像素后端、或计算切片中的一项或多项的工作负荷。
7.一种计算机实现的系统,包括用于执行如权利要求1-6中的任一项所述的方法的装置。
8.一个或多个非瞬态的计算机可读介质,存储有指令,所述指令导致处理器执行包括下列各项的序列:
分析图形处理单元内的组件的工作负荷;
对于不同的资源启用不同的时钟域,包括:向所述图形处理单元的一个资源提供第一频率的第一时钟信号、使用时钟沿跳过从所述第一时钟信号生成与所述第一频率不同的第二频率的第二时钟信号、将所述第二时钟信号提供给所述图形处理单元的不同资源;以及
在那些组件之间重新平衡工作负荷。
9.如权利要求8所述的介质,其特征在于,所述序列进一步包括:检查组件利用率是否降低到阈值以下。
10.如权利要求9所述的介质,其特征在于,所述序列进一步包括:如果是,则降低组件的本机频率。
11.如权利要求10所述的介质,其特征在于,所述序列进一步包括:检查整体功率耗散是否由于降低所述组件的本机频率而下降。
12.如权利要求11所述的介质,其特征在于,所述序列进一步包括:如果是,则提高多个组件的时钟频率。
13.如权利要求8所述的介质,其特征在于,所述序列进一步包括:分析三维固定功能、像素后端、或计算切片组件中的一项或多项的工作负荷。
14.一种图形处理器,包括:
第一资源;
第二资源;以及
用于分析所述资源的利用率并重新平衡所述资源之间的工作负荷的单元,所述单元用于对于不同的资源启用不同的时钟域,包括:向所述图形处理器的一个资源提供第一频率的第一时钟信号、使用时钟沿跳过从所述第一时钟信号生成与所述第一频率不同的第二频率的第二时钟信号、将所述第二时钟信号提供给所述图形处理器的不同资源。
15.如权利要求14所述的图形处理器,其特征在于,所述图形处理器用于检查资源利用率是否降低到阈值以下。
16.如权利要求15所述的图形处理器,其特征在于,如果是,则所述图形处理器用于降低资源的本机频率。
17.如权利要求16所述的图形处理器,其特征在于,所述图形处理器用于检查整体功率耗散是否由于降低所述资源的本机频率而下降。
18.如权利要求17所述的图形处理器,其特征在于,如果是,则所述图形处理器用于提高所述资源的时钟频率。
19.如权利要求14所述的图形处理器,其特征在于,所述图形处理器用于分析三维固定功能、像素后端或计算机切片中的一项或多项的工作负荷。
20.一种用于图形处理的系统,包括:
中央处理单元;以及
图形处理器,耦合到所述中央处理单元,所述图形处理器包括第一资源、第二资源以及用于分析所述资源的利用率并在所述资源之间重新平衡工作负荷的设备,所述设备用于对于不同的资源启用不同的时钟域,包括:向所述图形处理器的一个资源提供第一频率的第一时钟信号、使用时钟沿跳过从所述第一时钟信号生成与所述第一频率不同的第二频率的第二时钟信号、将所述第二时钟信号提供给所述图形处理器的不同资源。
21.如权利要求20所述的系统,其特征在于,包括操作系统。
22.如权利要求20所述的系统,其特征在于,包括电池。
23.如权利要求20所述的系统,其特征在于,包括固件和用于更新所述固件的模块。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/669,576 | 2012-11-06 | ||
US13/669,576 US9269120B2 (en) | 2012-11-06 | 2012-11-06 | Dynamically rebalancing graphics processor resources |
PCT/US2013/048037 WO2014074176A1 (en) | 2012-11-06 | 2013-06-27 | Dynamically rebalancing graphics processor resources |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104704469A CN104704469A (zh) | 2015-06-10 |
CN104704469B true CN104704469B (zh) | 2018-11-23 |
Family
ID=50621931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380052244.8A Active CN104704469B (zh) | 2012-11-06 | 2013-06-27 | 动态地重新平衡图形处理器资源 |
Country Status (4)
Country | Link |
---|---|
US (2) | US9269120B2 (zh) |
CN (1) | CN104704469B (zh) |
TW (2) | TWI639973B (zh) |
WO (1) | WO2014074176A1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160253210A1 (en) * | 2004-07-26 | 2016-09-01 | Yi-Chuan Cheng | Cellular with Multi-Processors |
US20150355660A1 (en) * | 2014-06-06 | 2015-12-10 | Qualcomm Incorporated | Enhanced core power reduction |
US9330433B2 (en) | 2014-06-30 | 2016-05-03 | Intel Corporation | Data distribution fabric in scalable GPUs |
US10025367B2 (en) | 2014-08-19 | 2018-07-17 | Intel Corporation | Dynamic scaling of graphics processor execution resources |
US10928791B2 (en) * | 2015-11-12 | 2021-02-23 | Siemens Aktiengesellschaft | Model-based human machine interface (HMI) |
US10579121B2 (en) * | 2017-04-01 | 2020-03-03 | Intel Corporation | Processor power management |
US10043232B1 (en) * | 2017-04-09 | 2018-08-07 | Intel Corporation | Compute cluster preemption within a general-purpose graphics processing unit |
US10444817B2 (en) | 2017-04-17 | 2019-10-15 | Intel Corporation | System, apparatus and method for increasing performance in a processor during a voltage ramp |
CN110687997B (zh) * | 2019-09-06 | 2021-06-11 | 苏州浪潮智能科技有限公司 | 一种动态调整fpga的功耗的方法及装置 |
CN112285431B (zh) * | 2020-10-14 | 2023-06-23 | 武汉钢铁有限公司 | 立体卷铁心变压器的单框铁心损耗的测量装置及其方法 |
US11809911B2 (en) * | 2020-12-09 | 2023-11-07 | Dell Products L.P. | Resuming workload execution in composed information handling system |
TWI782845B (zh) * | 2022-01-04 | 2022-11-01 | 國立高雄大學 | 通用型圖形處理器核心函式之組態設定預測系統及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1702692A (zh) * | 2004-05-03 | 2005-11-30 | 微软公司 | 提供增强的图形流水线的系统和方法 |
CN101821697A (zh) * | 2007-10-11 | 2010-09-01 | 高通股份有限公司 | 图形处理单元中基于需求的功率控制 |
US8284205B2 (en) * | 2007-10-24 | 2012-10-09 | Apple Inc. | Methods and apparatuses for load balancing between multiple processing units |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5953237A (en) * | 1996-11-25 | 1999-09-14 | Hewlett-Packard Company | Power balancing to reduce step load |
US6606004B2 (en) * | 2000-04-20 | 2003-08-12 | Texas Instruments Incorporated | System and method for time dithering a digitally-controlled oscillator tuning input |
US7075541B2 (en) | 2003-08-18 | 2006-07-11 | Nvidia Corporation | Adaptive load balancing in a multi-processor graphics processing system |
WO2005086095A1 (en) | 2004-03-03 | 2005-09-15 | Qualcomm Incorporated | Variable clock control for a graphics processor |
US7343508B2 (en) | 2004-03-05 | 2008-03-11 | Ati Technologies Inc. | Dynamic clock control circuit for graphics engine clock and memory clock and method |
US8102398B2 (en) | 2006-03-03 | 2012-01-24 | Ati Technologies Ulc | Dynamically controlled power reduction method and circuit for a graphics processor |
US8243085B2 (en) * | 2007-12-30 | 2012-08-14 | Intel Corporation | Boosting graphics performance based on executing workload |
US8199158B2 (en) * | 2008-06-11 | 2012-06-12 | Intel Corporation | Performance allocation method and apparatus |
US8780121B2 (en) * | 2009-12-22 | 2014-07-15 | Intel Corporation | Graphics render clock throttling and gating mechanism for power saving |
US20140089699A1 (en) * | 2012-09-27 | 2014-03-27 | Advanced Micro Devices | Power management system and method for a processor |
-
2012
- 2012-11-06 US US13/669,576 patent/US9269120B2/en active Active
-
2013
- 2013-06-27 WO PCT/US2013/048037 patent/WO2014074176A1/en active Application Filing
- 2013-06-27 CN CN201380052244.8A patent/CN104704469B/zh active Active
- 2013-11-04 TW TW104124903A patent/TWI639973B/zh not_active IP Right Cessation
- 2013-11-04 TW TW102139958A patent/TWI502540B/zh active
-
2016
- 2016-01-12 US US14/993,421 patent/US9805438B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1702692A (zh) * | 2004-05-03 | 2005-11-30 | 微软公司 | 提供增强的图形流水线的系统和方法 |
CN101821697A (zh) * | 2007-10-11 | 2010-09-01 | 高通股份有限公司 | 图形处理单元中基于需求的功率控制 |
US8284205B2 (en) * | 2007-10-24 | 2012-10-09 | Apple Inc. | Methods and apparatuses for load balancing between multiple processing units |
Also Published As
Publication number | Publication date |
---|---|
US20140125679A1 (en) | 2014-05-08 |
WO2014074176A1 (en) | 2014-05-15 |
US20160225120A1 (en) | 2016-08-04 |
US9269120B2 (en) | 2016-02-23 |
US9805438B2 (en) | 2017-10-31 |
TWI639973B (zh) | 2018-11-01 |
CN104704469A (zh) | 2015-06-10 |
TW201541404A (zh) | 2015-11-01 |
TWI502540B (zh) | 2015-10-01 |
TW201439963A (zh) | 2014-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104704469B (zh) | 动态地重新平衡图形处理器资源 | |
CN104106053B (zh) | 使用功率的动态cpu gpu负载平衡 | |
CN104471540B (zh) | 通过统一存储器架构的存储器共享 | |
CN104951263B (zh) | 避免向显示器发送未改变的区域 | |
CN103546158B (zh) | 用于图形处理的方法、系统和装置 | |
CN104782136B (zh) | 在云中处理视频数据 | |
US10937118B2 (en) | Scheduling and dispatch of GPGPU workloads | |
CN103959200B (zh) | 自适应图像子系统功率和性能管理 | |
CN104951358B (zh) | 基于优先级的上下文抢占 | |
CN103959199B (zh) | 用于先进先出(fifo)存储器的功率节约方法和装置 | |
CN104952033A (zh) | 分布式图形处理器分级中的系统一致性 | |
CN104756150B (zh) | 深度缓冲 | |
CN103999032A (zh) | 显示元素中所包括的感兴趣的区域的兴趣度分数 | |
CN104035540B (zh) | 在图形渲染期间降低功耗 | |
TWI517086B (zh) | 用於去耦取樣為主描繪管線之低功率質心決定及紋理覆蓋區最佳化 | |
CN104067318B (zh) | 使用三维光栅化的时间连续碰撞检测 | |
CN104025031B (zh) | 减少应用中对共享存储器单元执行的顺序操作的数量 | |
CN104737198B (zh) | 在输入几何对象粒度上记录可见度测试的结果 | |
CN104937551B (zh) | 用于管理设备中的功率的计算机实现的方法和用于管理设备中的功率的系统 | |
CN104584544A (zh) | 使用一般化平面编码的随机深度缓冲器压缩 | |
CN104040589A (zh) | 使用随机光栅化生成随机采样分布 | |
CN106462936A (zh) | 深度偏移压缩 | |
TWI642029B (zh) | 內容適應性視訊處理技術 | |
CN104025037B (zh) | 在不将数据复制到单独的储存的情况下交换指针来处理被数据源存储在缓冲器中的数据 | |
CN103988253B (zh) | 用于显示数据流的速率调节的技术 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |