TW201541404A - 動態再平衡圖型處理器資源的方法、裝置與系統 - Google Patents

動態再平衡圖型處理器資源的方法、裝置與系統 Download PDF

Info

Publication number
TW201541404A
TW201541404A TW104124903A TW104124903A TW201541404A TW 201541404 A TW201541404 A TW 201541404A TW 104124903 A TW104124903 A TW 104124903A TW 104124903 A TW104124903 A TW 104124903A TW 201541404 A TW201541404 A TW 201541404A
Authority
TW
Taiwan
Prior art keywords
resource
power
resources
processor
graphics
Prior art date
Application number
TW104124903A
Other languages
English (en)
Other versions
TWI639973B (zh
Inventor
Nikos Kaburlasos
Eric C Samson
Altug Koker
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of TW201541404A publication Critical patent/TW201541404A/zh
Application granted granted Critical
Publication of TWI639973B publication Critical patent/TWI639973B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Power Sources (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

依據一些實施例,在移除現行效能瓶頸的目標下,發生在圖形處理器內的特定資源的效能瓶頸可能藉由在資源間動態再平衡工作負載,同時,維持功率消散在現行指定功率預算內,而加以減緩。在一些實施例中,這可以藉由界定其效能可以之後再平衡的各個多數圖形處理器資源的分開時鐘域加以完成。

Description

動態再平衡圖型處理器資源的方法、裝置與系統
本案大致關係於圖形處理器。
圖形處理器通常負責產生出現在電腦系統中的顯示。各個圖形處理核心可以包含若干執行不同類型操作的不同資源。例如,圖形核心可以包含執行DirectX(DX)或其他描繪管線階段的固定函數邏輯;處理紋理的紋理取樣器;執行算術及數學運算的執行單元;執行像素填入及混合操作的像素後端等等。
執行在圖形核心上的工作負載在其特徵上作變化並可能對圖形核心可用的不同資源展現不同程度壓力,因為一資源相對於其他資源的過載造成效能瓶頸。例如,一些工作負載可能紋理密集並且它們在紋理取樣器中造成效能瓶頸。其他工作負載可能需要密集數學運算,在執行單元中造成效能瓶頸。
再者,特定工作負載的特徵可能隨時間改 變,造成效能瓶頸由一資源動態移動至另一資源。
10‧‧‧圖形處理單元核心
12‧‧‧三維固定函數
14‧‧‧媒體固定函數單元
16‧‧‧記憶體介面
18‧‧‧像素後端
20‧‧‧快取
22a,22b‧‧‧計算切片
24‧‧‧取樣器
26‧‧‧執行單元
700‧‧‧系統
702‧‧‧平台
705‧‧‧晶片組
710‧‧‧處理器
712‧‧‧記憶體
714‧‧‧儲存器
715‧‧‧圖形子系統
716‧‧‧應用程式
718‧‧‧無線電
721‧‧‧全球定位系統
723‧‧‧攝影機
730‧‧‧內容服務裝置
740‧‧‧內容輸送裝置
750‧‧‧導航控制器
760‧‧‧網路
770‧‧‧作業系統
772‧‧‧至處理器介面
780‧‧‧內部電池
790‧‧‧韌體
800‧‧‧裝置
802‧‧‧外殼
804‧‧‧顯示器
806‧‧‧輸入/輸出裝置
808‧‧‧天線
812‧‧‧導航特性
一些實施例將針對以下圖式加以描述:圖1為依據一實施例的圖形處理單元核心的示意圖;圖2為本發明一實施例的流程圖;圖3為用於本發明一實施例的系統示意圖;及圖4為本發明之一實施例的前視圖。
依據一些實施例,以移除現行效能瓶頸為目標,發生在圖形處理器單元內的特定資源中的效能瓶頸可能藉由動態地再平衡在該等資源間的工作負載,同時,維持功率消散在現行指定功率預算內,而加以減緩。在一些實施例中,這可以藉由界定其效能可以之後再平衡的各個多數圖形處理器資源的分開時鐘域加以完成。
只要該工作係經常藉由補送工作要求至該資源所特定的佇列,而被排序於特定圖形處理器資源上,藉由界定量化各個多數圖形處理器資源的利用率的現行程度的利用度量,即可以以即時為基礎地實行再平衡。資源利用度量的一個例子為用於特定資源的工作佇列的狀態。即,該佇列的填滿或空白即為該資源的高或低過度利用及再平衡的需求愈大。然而,其他利用度量也可以利用。
參考圖1,在一些實施例中,可以再平衡的圖 形處理單元核心10資源包含三維固定函數12、像素後端18、及計算切片22a及22b。各個計算切片22包含取樣器24及若干執行單元26。當工作負載被執行於圖形核心時,取決於該工作負載的特徵,可能在圖形核心的任一可用資源上造成效能瓶頸。
圖形處理器核心也可以包含快取20、媒體固定函數單元14及記憶體介面16。
依據一些實施例,處理能力(power)可以動態地由圖形核心中的欠使用資源轉移至過使用資源。這可以消緩效能瓶頸並在一些實施例中,改良在可用功率預算內的整體效能。
一些圖形處理器核心係針對功率很有限的市場區隔。這些經常為多數時間操作於其頻率規格區域中的設計,其中圖形處理器核心操作於其最小操作電壓,及時鐘頻率可以在某些限制內增減,也不必改變操作電壓。
因此,在一些實施例中,愈高時鐘頻率及愈大功率預算分配給重度利用之圖形處理器資源;而愈低時鐘頻率及愈低功率預算分配給相對較低利用的資源。各個圖形處理器資源的分配時鐘頻率可以隨時間增減,取決於該資源在任何給定的時間點忙碌程度如何而定。
在實際上,在一實施例中,此分配可以藉由將輕度利用資源所採用的本地決定,以降低其本身時鐘頻率加以完成。結果,這些較輕度利用資源的功率消散降低,藉以降低該整體圖形核心的功率消散低於其現行分配 預算。同時,在圖形處理器核心中的愈多重度利用資源可能提升其時鐘頻率並將圖形處理器核心功率預算填回至所分配的位準。在短轉移期間結束時,相較於較不忙碌圖形處理器資源,愈忙碌圖形資源結果使用較以前更高的時鐘頻率。
在圖形處理器核心中的不同時鐘域可以藉由使用各個圖形處理器資源的分開時鐘頻率加以界定與管理。各個時鐘頻率可以來自專屬於一特定資源的相鎖迴路或者來自可以將基準時鐘頻率以各種比率分割的單一相鎖迴路或幾個相鎖迴路。如果在圖形處理器核心的所有資源為相同電壓調整器所供電,則為最忙碌圖形處理器資源所需的最快時鐘頻率決定該電壓調整器的電壓設定。
或者,在該核心外或整合在該核心內的相同晶片中的多數電壓調整器可以被使用於不同圖形處理器資源,使得多數資源各自如所需地提升其電壓及頻率,而不必強迫其他圖形處理器資源也操作於較高電壓。結果,較忙碌圖形處理器資源操作於比較不忙碌圖形處理器資源更高的電壓與頻率。
另一種產生不同時鐘域的方式為利用單一電壓域及單一基準時鐘頻率給在該核心中的所有資源,同時,允許各個資源藉由時鐘邊緣跳脫產生較低有效本地時鐘頻率。在時鐘邊緣跳脫中,想要數量的時鐘邊緣係被遮蔽。例如,遮蔽三個時鐘邊緣中的兩個基本上將該時鐘頻率除以三。
對於在多數時間中,整個操作在其頻率規格區域內的圖形處理器核心,基準圖形時鐘頻率可以升降在某些限制內,同時,操作電壓在其最小值處保持不變。對於多數常用維持工作負載及使用模型,此等圖形處理器核心具有顯著空間以再平衡其資源的本地時鐘頻率,而不必提升其操作的電壓超過最小電壓。
在圖形處理器核心的各個資源可以追蹤其本身利用率並在一實施例中,當利用率低時,作出一決定,以降低其本地時鐘頻率。或者,其中也有集中式資源,追蹤不同資源的利用率並對各個資源的本地時鐘頻率作出決定。
如果整個圖形處理器核心的功率消散由於一些資源降低其時鐘頻率而下降時,則已對整個圖形核心建立一些功率預算空間。這允許所有資源的時鐘頻率的增加,包含這些現行有效能瓶頸的資源。允許效能瓶頸的時鐘頻率的增加提升了整體圖形處理器核心所輸送的效能位準。提升資源時鐘頻率在一些情況下也可能需要在整體圖形處理器核心的電壓改變,或者,在使用多電壓調整器情況下在圖形處理器核心中之最忙碌資源的電壓改變。然而,多數操作於其頻率規格區域內的很多有限功率設計多數時間並不需要提升電壓。
依據圖2所示之一實施例,再平衡設計可以以軟體、韌體及/或硬體實施。在軟體及韌體實施例中,其可以被儲存在一或更多非暫態電腦可讀取媒體,例如 磁、光或半導體儲存器中的電腦可執行指令所實施。
在圖2中,描繪若干不同圖形處理器資源。各個資源可以在菱形30中檢查是否資源利用率已經下降低於一預定臨限值。如果否,則資源簡單地持續週期地檢查是否資源利用率已經下降至低於一些預定臨限值。
相反地,如果資源利用率已經下降至低於臨限值,則本地時鐘頻率可以降低,如方塊32所示。
然後,週期地,可以對所有資源檢查(菱形34)決定是否整體圖形核心的功率消散已經下降至低於現行預算位準下。如果不是,則流程遞迴。
相反地,則所有資源的時鐘頻率可以提升(方塊36),保留總圖形功率預算。然後,當流程再次為各個資源遞迴至方塊30時,則這些資源可以適當地漸減其本地時鐘頻率。
在其他實施例中,檢查決定是否利用率已經增加至超出預定臨限值,如果是,則增加本地時鐘頻率。其他設計也可以依據本發明之一些實施例加以實施。
圖3例示系統700的實施例。在實施例中,雖然系統700並不限於本文中,但系統700可以為一媒體系統。例如,系統700可以併入個人電腦(PC)、膝上型電腦、超膝上型電腦、平板電腦、觸控面板、攜帶式電腦、手持電腦、掌上型電腦、個人數位助理(PDA)、行動電話、組合行動電話/PDA、電視、智慧裝置(例如智慧手機、智慧平板電腦或智慧電視)、行動網際網路裝置 (MID)、發信裝置、資料通訊裝置等等。
在一些實施例,系統700包含耦接至顯示器720的平台702。平台702也可以自例如內容服務裝置730或內容輸送裝置740或其他類似內容資源的內容裝置接收內容。包含一或更多導航特性的導航控制器750也可以用以與例如平台702及/或顯示器720互動。各個這些元件係如下更詳細描述。
在一些實施例中,平台702也可以包含晶片組705、處理器710、記憶體712、儲存器714、圖形子系統715、應用程式716、全球定位系統(GPS)721、攝影機723及/或無線電718的任意組合。晶片組705也可以提供於處理器710、記憶體712、儲存器714、圖形子系統715、應用程式716及/或無線電718間之相互通訊。例如,晶片組705也可以包括儲存適配器(未示出),其能提供與儲存器714的相互通訊。
另外,平台702也可以包括一作業系統770。至處理器的介面772可以作為作業系統與處理器710的介面。
韌體790也可以提供實施例如啟動(boot)順序的功能。也可以提供一更新模組,以使得韌體被由平台702外部更新。例如,該更新模組也可以包含碼,以決定是否更新的嘗試被加密並識別韌體790的最後更新,以促成決定何時需要更新。
在一些實施例中,平台702也可以為外部電 源所供電。在一些情況下,平台702也可以包括內部電池780,其可以在未適配至外部電源的實施例或在允許電池電源或外部電源的實施例中作為電源。
圖2中所示的順序也可以藉由將之加入於儲存器714內或處理器710或圖形子系統715的記憶體內,而實施為軟體及韌體實施例,以舉出幾個例子。在一實施例中圖形子系統715也可以包括圖形處理單元及處理器710也可以為中央處理單元。
處理器710也可以實施為複雜指令集電腦(CISC)或精簡指令集電腦(RISC)處理器,x86指令集相容處理器、多核心或任何其他微處理器或中央處理單元(CPU)。在實施例中,處理器710可以包含雙核心處理器、雙核心行動處理器等等。
記憶體712也可以被實施為揮發記憶體裝置,例如但並不限於隨機存取記憶體(RAM)、動態隨機存取記憶體(DRAM)、或靜態RAM(SRAM)。
儲存器714也可以被實施為非揮發儲存裝置,例如但並不限於磁碟機、光碟機、磁帶機、內部儲存裝置、附著儲存裝置、快閃記憶體、電池備用SDRAM(同步DRAM)、及/或網路可接取儲存裝置。在實施例中,儲存器714也可以包含技術,以當例如包含多數硬體驅動器時,增加有價值數位媒體的儲存效能加強保護。
圖形子系統715可以執行例如靜態或視訊顯示的影像的處理。圖形子系統715可以例如為圖形處理單 元(GPU)或視覺處理單元(VPU)。類比或數位介面可以用以通訊地耦接圖形子系統715與顯示器720。例如,介面可以為高解析多媒體介面、顯示埠、無線HDMI、及/或無線HD相容技術的任一。圖形子系統715可以整合入處理器710或晶片組705。圖形子系統715可以為獨立卡,其可通訊地耦接至晶片組705。
於此所述之圖形及/或視訊處理技術可以實施於各種硬體架構中。例如,圖形及/或視訊功能可以整合於晶片組內。或者,也可以使用分立圖形及/或視訊處理器。其他實施例中,則圖形及/或視訊功能也可以為包含多核心處理的一般目的處理器所實施。在其他實施例中,功能也可以實施於消費電子裝置中。
無線電718可以包括一或更多無線電,其能使用各種適當無線通訊技術發射及接收信號。此等技術可以涉及跨越一或更多無線網路的通訊。例示無線網路包含(但並不限於)無線區域網路(WLAN)、無線個人區域網路(WPAN)、無線都會區域網路(WMAN)、細胞網路及衛星網路。在跨越這些網路通訊時,無線電718可以依據任意版本的一或更多可應用標準加以操作。
在實施例中,顯示器720可以包含任何電視類型監視器或顯示器。顯示器720可以包含例如電腦顯示螢幕、觸控螢幕顯示器、視訊監視器、電視狀裝置、及/或電視。顯示器720可以為數位及/或類比。在實施例中,顯示器720可以為全像顯示器。同時,顯示器720可 以為透明表面,其可以接收視覺投影。此等投影可以傳遞各種形式的資訊、影像、及/或物件。例如,此等投影可以為行動加強實境(MAR)應用的視訊重疊。在一或更多軟體應用程式716的控制下,平台702可以在顯示器720上顯示使用者介面722。
在實施例中,內容服務裝置730也可以為任何國家、國際及/或獨立服務所主管,因此,例如,可以經由網際網路接取平台702。內容服務裝置730可以耦接至平台702及/或至顯示器720。平台702及/或內容服務裝置730也可以耦接至網路760,以傳遞(例如,發送及/或接收)媒體資訊進出網路760。內容輸送裝置740也可以耦接至平台702及/或顯示器720。
在實施例中,內容服務裝置730也包含有線電視盒、個人電腦、網路、電話、有網際網路裝置或應用,其能輸送數位資訊及/或內容、及任何其他類似裝置,其能單向或雙向地經由網路760或直接傳送內容於內容提供者及平台702及顯示器720之間。應了解的是,該內容也可以單向及/或雙向地進出在系統700內的任一元件及經由網路760至內容提供者。內容的例子可以包括任何媒體資訊,例如包含視訊、音樂、醫療及遊戲資訊等等。
內容服務裝置730接收內容,例如有線電視節目,包含媒體資訊、數位資訊、及/或其他內容。內容提供者的例子可以包括任一有線或衛星電視或無線電或網 際網路內容提供者。所提供的例子並不是用以限制本發明的實施例。
在實施例中,平台702可以由具有一或更多導航特性的導航控制器750接收控制信號。控制器750的導航特性也可以用以例如與使用者介面722互動。在實施例中,導航控制器750也可以為指標裝置,其可以為電腦硬體元件(明確地說,人類介面裝置),其允許使用者輸入空間(例如連續及多維)資料進入電腦。很多系統,例如圖形使用者介面(GUI),及電視及監視器允許使用者使用身體姿勢控制及提供資料給電腦或電視。
控制器750的導航特性的動作可以藉由指標、游標、對焦環、或其他顯示在顯示器上的視覺指示器,回響於顯示器(例如顯示器720)上。例如,在軟體應用程式716的控制下,位於導航控制器750上的導航特性也可以映圖至例如顯示在使用者介面722上的虛擬導航特性。在實施例中,控制器750也可以不是分開元件,而是整合入平台702及/或顯示器720。然而,實施例並不限於該實施例或在此所示或描述的文中。
在實施例中,驅動器(未示出)可以包含技術,以使得使用者立即導通及關斷平台702,如同電視於例如致能時在初始啟動後的觸碰按鈕。當平台被“關斷”時,節目邏輯可以允許平台702流放內容至媒體適配器或其他內容服務裝置730或內容輸送裝置740。另外,晶片組705也可以包含硬體及/或軟體支持5.1聲音環繞音訊及 /或高解析7.1聲音環繞音訊。驅動器可以包含用於整合圖形平台的圖形驅動器。在實施例中,圖形驅動器可以包含圖形元件互連(PCI)快速圖形卡。
在各種實施例中,可以整合示於系統700的任一或更多元件。例如,平台702及內容服務裝置730可以整合,或者平台702及內容輸送裝置740可以整合,或例如平台702、內容服務裝置730、及內容輸送裝置740可以整合。在各種實施例中,平台702及顯示器720可以為整合單元。顯示器720及內容服務裝置730也可以整合,或者,例如顯示器720及內容輸送裝置740可以被整合。這些例子並不用以限制本發明。
在各種實施例中,系統700可以被實現為無線系統、有線系統、或兩者的組合。當實施為無線系統時,系統700也可以包括適用以透過無線共享媒體,例如一或更多天線、發射器、接收器、收發器、放大器、濾波器、控制邏輯等等作通訊的元件或介面。無線共享媒體的例子可以包括部份的無線頻譜,例如,RF頻譜等等。當實施為有線系統時,系統700可以包含適用以透過有線通訊媒體,例如輸入/輸出(I/O)適配器、實體連接器以連接該I/O適配器與相關有線通訊媒體、網路介面卡(NIC)、碟片控制器、視訊控制器、音訊控制器等等作通訊的元件與介面。有線通訊媒體的例子可以包括電線、纜線、金屬導線、印刷電路板(PCB)、背板、開關結構、半導體材料、對絞線、同軸纜線、光纖等等。
平台702可以建立一或更多邏輯或實體通訊,以傳遞資訊。該資訊可以包括媒體資訊及控制資訊。媒體資訊可以表示任何代表對使用者為內容的資料。內容的例子可以包括例如來自語音對話、視訊會議、流送視訊、電子郵件(email)信息、語音郵件信息、文字符號、圖形、影像、視訊、文字等等的資料。來自語音對話的資料可以例如語音資訊、靜音期、背景雜訊、等待雜音、音調等等。控制資訊可以表示任何代表命令、指令或對自動系統表示為控制字元的資料。例如,控制資訊可以用以透過一系統配送媒體資訊,或指示一節點,以預定方式處理該媒體資訊。然而,該等實施例並不限於該等元件或者圖3所示或描述的文中。
如上所述,系統700可以實施為各種實體態樣或形狀因素。圖4顯示小形狀因素裝置800的實施例,其中可以實施有系統700。例如,在實施例中,裝置800可以被實施為具有無線能力的行動計算裝置。行動計算裝置可以表示任何裝置,其具有處理系統及行動電源或來源,例如一或更多電池。
如上所述,行動計算裝置的例子可以包括個人電腦(PC)、膝上型電腦、超膝上型電腦、平板電腦、觸控面板、攜帶式電腦、手持電腦、掌上型電腦、個人數位助理(PDA)、行動電話、組合行動電話/PDA、電視、智慧裝置(例如智慧手機、智慧平板或智慧電視)、行動網際網路裝置(MID)、發信裝置、資料通訊裝置等等。
行動計算裝置的例子也可以包括電腦,其係被配置以為個人所穿戴,例如腕式電腦、指式電腦、環式電腦、眼鏡電腦、皮帶頭電腦、臂章式電腦、鞋式電腦、衣物電腦、及其他可穿戴電腦。例如,在實施例中,行動計算裝置可以被實施為智慧手機,其能執行電腦應用程式,及語音通訊及/或資料通訊。雖然一些實施例可以用例如實施為智慧手機的行動計算裝置加以描述,但可以了解的是,其他實施例也可以使用其他無線行動計算裝置加以實施。該等實施例並不限於本文所述。
如於圖4所示,裝置800可以包含外殼802、顯示器804、輸入/輸出(I/O)裝置806、及天線808。裝置800也可以包含導航特性812。顯示器804可以包含任何適當顯示單元,用以顯示適用於行動計算裝置的資訊。I/O裝置806可以包含任何適當I/O裝置,用以輸入資訊至行動計算裝置。I/O裝置806的例子可以包括文數字鍵盤、數字鍵盤、觸控面板、輸入鍵、按鈕、開關、擺動開關、麥克風、喇叭、語音辨識裝置及軟體等等。資訊也可以藉由麥克風輸入至裝置800。此資訊可以為語音辨識裝置所數位化。該等實施例並不限於本文所述。
各種實施例可以使用硬體元件、軟體元或兩者之組合加以實施。硬體元件的例子可以包括處理器、微處理器、電路、電路元件(例如,電晶體、電阻、電容、電感等等)、積體電路、特定應用積體電路(ASIC)、可程式邏輯裝置(PLD)、數位信號處理器(DSP)、場 可程式閘陣列(FPGA)、邏輯閘、暫存器、半導體裝置、晶片、微晶片、晶片組等等。軟體的例子可以包括軟體元件、程式、應用、電腦程式、應用程式、系統程式、機器程式、作業程式軟體、中間軟體、韌體、軟體模組、常式、副程式、函數、方法、程序、軟體介面、應用程式介面(API)、指令集、計算碼、電腦碼、碼區段、電腦碼區段、字元、值、符號或其任意組合。決定是否一實施例係使用硬體元件及/或軟體元件加以實施可以依據若干因素加以改變,例如,想要的計算速率、功率位準、熱容忍、處理循環預算、輸入資料率、輸出資料率、記憶體資源、資料匯流排速度及其他設計或效能上的侷限。
至少一實施例的一或更多態樣可以藉由儲存在機器可讀取媒體上的代表指令加以實施,該等指令代表在處理器內的各種邏輯,當為機器所讀取時使得機器製造邏輯,以執行於此所述之技術。稱為“IP核心”的此等代表可以被儲存在有形的機器可讀取媒體上並被供給至各種客戶或製造設施上,以載入可以實際作出該邏輯或處理器的製造機器。
各種實施例可以使用硬體元件、軟體元件或兩者之組合加以實施。硬體元件的例子可以包括處理器、微處理器、電路、電路元件(例如電晶體、電阻、電容、電感等等)、積體電路、特定應用積體電路(ASIC)、可程式邏輯裝置(PLD)、數位信號處理器(DSP)、場可程式閘陣列(FPGA)、邏輯閘、暫存器、半導體裝 置、晶片、微晶片、晶片組等等。軟體的例子可以包括軟體元件、程式、應用、電腦程式、應用程式、系統程式、機器程式、作業系統軟體、中間軟體、韌體、軟體模組、常式、副程式、函數、方法、程序、軟體介面、應用程式介面(API)、指令集、計算碼、電腦碼、碼區段、電腦碼區段、字元、值、符號、或其組合。決定是否一實施例使用硬體元件及/或軟體元件實施可以依據若干因素而加以改變,例如,想要計算速率、功率位準、熱容忍、處理循環預算、輸入資料率、輸出資料率、記憶體資源、資料匯流排速度及其他設計或效能侷限。
至少一實施例的一或更多態樣可以為儲存在機器可讀取媒體上的代表指令所實施,該等指令代表在處理器內的各種邏輯,其當為機器所讀取時使得機器製造邏輯,執行於此所述之技術。稱為“IP核心”的此等代表可以儲存在有形之機器可讀取媒體上並被供給至各種客戶或製造設施,以載入製造機器,其實際作成該邏輯或處理器。
於此所述之圖形處理技術可以以各種硬體架構實施。例如,圖形功能可以被整合入晶片組內。或者,也可以使用分立圖形處理器。在另一實施例中,圖形功能可以為包含多核心處理器的一般目的處理器所實施。
在本說明書中之“一實施例”或“實施例”表示有關該實施例所述之特定特性、結構或特徵係包含在本發明範圍內的至少一實施法中。因此,“一實施例”或“在一實施例中”的用語出現並不必然表示相同實施例。再者,特 定特性、結構、或特徵也可以以其他適合形式替代所示之該特定實施例,此等形式可以包含在本案的申請專利範圍內。
雖然本發明已經參考有限數量的實施例加以描述,但熟習於本技藝者將了解其各種修改與變化。吾人想要隨附之申請專利範圍涵蓋所有此等修改與變化,並落在本發明之精神與範圍內。
10‧‧‧圖形處理單元核心
12‧‧‧三維固定函數
14‧‧‧媒體固定函數單元
16‧‧‧記憶體介面
18‧‧‧像素後端
20‧‧‧快取
22a,22b‧‧‧計算切片
24‧‧‧取樣器
26‧‧‧執行單元

Claims (16)

  1. 一種動態再平衡圖形處理器資源的方法,包含:分析在圖形處理單元內的資源的工作負載,用以判斷是否超過功率預算;如果超過該功率預算,則對所有資源增加功率;檢查各資源,用以查看是否該資源的功率能被降低;降低能被降低功率的資源之功率;及再平衡這些資源間之工作負載。
  2. 如申請專利範圍第1項所述之方法,包括檢查是否資源利用率下降至低於臨限值。
  3. 如申請專利範圍第2項所述之方法,如果該資源利用率下降至低於該臨限值,則降低資源的本地頻率。
  4. 如申請專利範圍第1項所述之方法,包括分析三維固定函數、像素後端或計算切片的一或多者的工作負載。
  5. 一種儲存指令的一或更多非暫態電腦可讀取媒體,用以使得處理器執行一順序,其包含:分析在圖形處理單元內的元件的工作負載,用以判斷是否超過功率預算;如果超過該功率預算,則對所有資源增加功率;檢查各資源,用以查看是否該資源的功率能被降低;降低能被降低功率的資源之功率;及再平衡這些元件間之工作負載。
  6. 如申請專利範圍第5項所述之非暫態電腦可讀取 媒體,該順序更包含檢查是否元件利用率下降至低於臨限值。
  7. 如申請專利範圍第6項所述之非暫態電腦可讀取媒體,該順序更包含,如果該元件利用率下降至低於該臨限值,則降低元件的本地頻率。
  8. 如申請專利範圍第7項所述之非暫態電腦可讀取媒體,該順序更包括檢查是否整體功率消散由於降低該元件的本地頻率而下降。
  9. 如申請專利範圍第8項所述之非暫態電腦可讀取媒體,該順序更包括如果該整體功率消散由於降低該元件的本地頻率而下降,則提升多數元件的時鐘頻率。
  10. 如申請專利範圍第5項所述之非暫態電腦可讀取媒體,該順序更包括分析三維固定函數、像素後端、或計算切片元件的一或多者的工作負載。
  11. 一種圖形處理器,包含:第一資源;第二資源;及一單元,用以分析該等資源的利用率、用以分析在圖形處理單元內的資源的工作負載,用以判斷是否超過功率預算,如果超過該功率預算,則對所有資源增加功率、用以檢查各資源,用以查看是否該資源的功率能被降低、用以降低能被降低功率的資源之功率並用以再平衡該等資源間之工作負載。
  12. 如申請專利範圍第11項所述之圖形處理器,該 處理器檢查是否資源利用率下降至低於臨限值。
  13. 如申請專利範圍第12項所述之圖形處理器,如果該資源利用率下降至低於該臨限值,則該處理器降低資源的本地頻率。
  14. 如申請專利範圍第13項所述之圖形處理器,該處理器檢查是否整體功率消散由於該資源的本地頻率降低而下降。
  15. 如申請專利範圍第14項所述之圖形處理器,如果該整體功率消散由於該資源的本地頻率降低而下降,則該處理器提升該等資源的時鐘頻率。
  16. 如申請專利範圍第11項所述之圖形處理器,該處理器分析三維固定函數、像素後端、或計算切片的一或多者的工作負載。
TW104124903A 2012-11-06 2013-11-04 動態再平衡圖型處理器資源的方法、裝置與系統 TWI639973B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/669,576 US9269120B2 (en) 2012-11-06 2012-11-06 Dynamically rebalancing graphics processor resources
US13/669,576 2012-11-06

Publications (2)

Publication Number Publication Date
TW201541404A true TW201541404A (zh) 2015-11-01
TWI639973B TWI639973B (zh) 2018-11-01

Family

ID=50621931

Family Applications (2)

Application Number Title Priority Date Filing Date
TW104124903A TWI639973B (zh) 2012-11-06 2013-11-04 動態再平衡圖型處理器資源的方法、裝置與系統
TW102139958A TWI502540B (zh) 2012-11-06 2013-11-04 動態再平衡圖型處理器資源的方法、裝置與系統

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW102139958A TWI502540B (zh) 2012-11-06 2013-11-04 動態再平衡圖型處理器資源的方法、裝置與系統

Country Status (4)

Country Link
US (2) US9269120B2 (zh)
CN (1) CN104704469B (zh)
TW (2) TWI639973B (zh)
WO (1) WO2014074176A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI782845B (zh) * 2022-01-04 2022-11-01 國立高雄大學 通用型圖形處理器核心函式之組態設定預測系統及方法

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160253210A1 (en) * 2004-07-26 2016-09-01 Yi-Chuan Cheng Cellular with Multi-Processors
US20150355660A1 (en) * 2014-06-06 2015-12-10 Qualcomm Incorporated Enhanced core power reduction
US9330433B2 (en) 2014-06-30 2016-05-03 Intel Corporation Data distribution fabric in scalable GPUs
US10025367B2 (en) 2014-08-19 2018-07-17 Intel Corporation Dynamic scaling of graphics processor execution resources
EP3374863B1 (en) * 2015-11-12 2024-05-01 Siemens Aktiengesellschaft Model-based human machine interface (hmi)
US10579121B2 (en) 2017-04-01 2020-03-03 Intel Corporation Processor power management
US10043232B1 (en) * 2017-04-09 2018-08-07 Intel Corporation Compute cluster preemption within a general-purpose graphics processing unit
US10444817B2 (en) 2017-04-17 2019-10-15 Intel Corporation System, apparatus and method for increasing performance in a processor during a voltage ramp
CN110687997B (zh) * 2019-09-06 2021-06-11 苏州浪潮智能科技有限公司 一种动态调整fpga的功耗的方法及装置
CN112285431B (zh) * 2020-10-14 2023-06-23 武汉钢铁有限公司 立体卷铁心变压器的单框铁心损耗的测量装置及其方法
US11809911B2 (en) * 2020-12-09 2023-11-07 Dell Products L.P. Resuming workload execution in composed information handling system

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5953237A (en) * 1996-11-25 1999-09-14 Hewlett-Packard Company Power balancing to reduce step load
US6606004B2 (en) * 2000-04-20 2003-08-12 Texas Instruments Incorporated System and method for time dithering a digitally-controlled oscillator tuning input
US7075541B2 (en) 2003-08-18 2006-07-11 Nvidia Corporation Adaptive load balancing in a multi-processor graphics processing system
WO2005086095A1 (en) 2004-03-03 2005-09-15 Qualcomm Incorporated Variable clock control for a graphics processor
US7343508B2 (en) 2004-03-05 2008-03-11 Ati Technologies Inc. Dynamic clock control circuit for graphics engine clock and memory clock and method
US7978205B1 (en) * 2004-05-03 2011-07-12 Microsoft Corporation Systems and methods for providing an enhanced graphics pipeline
US8102398B2 (en) 2006-03-03 2012-01-24 Ati Technologies Ulc Dynamically controlled power reduction method and circuit for a graphics processor
US8458497B2 (en) * 2007-10-11 2013-06-04 Qualcomm Incorporated Demand based power control in a graphics processing unit
US8284205B2 (en) * 2007-10-24 2012-10-09 Apple Inc. Methods and apparatuses for load balancing between multiple processing units
US8243085B2 (en) * 2007-12-30 2012-08-14 Intel Corporation Boosting graphics performance based on executing workload
US8199158B2 (en) * 2008-06-11 2012-06-12 Intel Corporation Performance allocation method and apparatus
US8780121B2 (en) * 2009-12-22 2014-07-15 Intel Corporation Graphics render clock throttling and gating mechanism for power saving
US20140089699A1 (en) * 2012-09-27 2014-03-27 Advanced Micro Devices Power management system and method for a processor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI782845B (zh) * 2022-01-04 2022-11-01 國立高雄大學 通用型圖形處理器核心函式之組態設定預測系統及方法

Also Published As

Publication number Publication date
TWI639973B (zh) 2018-11-01
US9805438B2 (en) 2017-10-31
CN104704469A (zh) 2015-06-10
TWI502540B (zh) 2015-10-01
US9269120B2 (en) 2016-02-23
WO2014074176A1 (en) 2014-05-15
US20160225120A1 (en) 2016-08-04
CN104704469B (zh) 2018-11-23
US20140125679A1 (en) 2014-05-08
TW201439963A (zh) 2014-10-16

Similar Documents

Publication Publication Date Title
TWI639973B (zh) 動態再平衡圖型處理器資源的方法、裝置與系統
JP6072834B2 (ja) 方法、プログラム、装置、およびシステム
US9652300B2 (en) Systems, methods, and computer program products for preemption of threads at a synchronization barrier
TWI480725B (zh) 適應性圖形次級系統電源及效能管理
JP6374038B2 (ja) ドローコールにわたる共有リソースデータコヒーレンシを確実にするための効率的なハードウェアメカニズム
JP2017517799A (ja) ソートミドルアーキテクチャにおけるフレームのフレームコヒーレンシへの活用
TWI515580B (zh) 使用成本評估以增進用於影像處理的砌塊描繪效能之技術
US10228748B2 (en) Context aware power management for graphics devices
TWI615807B (zh) 用於記錄在輸入幾何物件粒度上的可視度測試之結果的方法、設備及系統
TW201537455A (zh) 用於記憶體子系統之動態快取及記憶體分配技術
JP2015530661A (ja) プロセッサにおける周波数変化に関連するオーバーヘッドの削減
JP2019057320A (ja) 方法、コンピュータプログラム、コンピュータ可読記録媒体および装置
US9792151B2 (en) Energy efficient burst mode
TW201340030A (zh) 內容適應性視訊處理技術
JP5968463B2 (ja) データを別の記憶装置にコピーせずにデータソースによりバッファに格納されたデータを処理するためのポインタのスワッピング
TWI493357B (zh) 描繪圖形的方法與設備、精簡客戶端系統及其機器可讀取媒體
US20150170317A1 (en) Load Balancing for Consumer-Producer and Concurrent Workloads
US9705964B2 (en) Rendering multiple remote graphics applications
TW201628415A (zh) 固定功能媒體裝置之先佔
US10261570B2 (en) Managing graphics power consumption and performance
US20130326351A1 (en) Video Post-Processing on Platforms without an Interface to Handle the Video Post-Processing Request from a Video Player
WO2013180728A1 (en) Video post- processing on platforms without an interface to handle the video post-processing request from a video player

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees