TWI613545B

TWI613545B - 繪圖處理程序之分析方法與分析系統

Info

Publication number: TWI613545B
Application number: TW105132243A
Authority: TW
Inventors: 達馬明; 賴俊宏; 黃迅倫; 盧俊銘
Original assignee: 財團法人工業技術研究院
Priority date: 2015-11-13
Filing date: 2016-10-05
Publication date: 2018-02-01
Also published as: CN106708499B; US20170140495A1; TW201717013A; US9953393B2; CN106708499A

Abstract

一種繪圖處理程序之分析方法與分析系統。分析方法包括以下步驟：以一探測電路對一繪圖處理器硬體量測出數個參考繪圖程式相對應的數個負載分值及數個負載總值，並建立出各個參考繪圖程式對應於各個硬體元件之一加權係數，以依據此些負載總值及此些加權係數將此些參考繪圖程式分類為數個群組。將參考繪圖程式之參考繪圖參數集合作為數個輸入，並將此些群組作為數個輸出，找出一映射函數，以訓練出此些參考繪圖程式對應於此些群組之一歸類關係。分析繪圖處理器硬體之此些硬體元件分別對應之負載分值與此些參考繪圖參數之相對關係。

Description

繪圖處理程序之分析方法與分析系統

本揭露是有關於一種繪圖處理程序之分析方法與分析系統。

隨著對行動裝置上晝面顯示的細緻度及華麗度之追求，因此繪圖處理器硬體已被廣泛的用於加速應用程式上3D場景的繪製，然而受限於行動裝置上有限的電池容量，因此行動裝置上的繪圖應用程式開發者必須能在開發階段很快的了解到3D場景的複雜度是如何影響處理功耗，以取得效能、3D場景表現、及功耗之間的平衡，並藉由修改繪圖應用程式來進行單位功耗之效能的最佳化。

針對繪圖處理器硬體的功耗預估，一般主要是於程式執行過程中實際存取硬體元件(或硬體模擬器)以獲得硬體訊號/狀態變動資訊，並藉此來估算功耗值，然而這種硬體訊號/狀態變動資訊是相依於硬體架構且繪圖處理器硬體供應商並不一定有提供方法來取得這些訊號/狀態變動資訊；此外，繪圖應用程式開發者很難直接從這些硬體變動資訊了解到是哪一段程式碼或哪一個3D場景會造成大量的功率消耗，進一步限制了最佳化的進行。

此外，除了功耗預估以外，處理時間的預估同樣也面臨上述一樣的問題，繪圖應用程式開發者很難直接從這些硬體變動資訊了解到是哪一段程式碼或哪一個3D場景會花費大量的處理時間，進一步限制了最佳化的進行。

本揭露係有關於一種繪圖處理程序之分析方法與分析系統。

根據本揭露之一實施例，提出一種繪圖處理程序之分析方法。繪圖處理程序之分析方法包括以下步驟。提供數個參考繪圖程式及各個參考繪圖程式之數個參考繪圖參數，各該參考繪圖程式之該些參考繪圖參數組成一參考繪圖參數集合。以一探測電路對一繪圖處理器硬體量測出此些參考繪圖程式相對應的數個負載分值及數個負載總值，各個負載分值對應於此些參考繪圖程式及繪圖處理器硬體之數個硬體元件，並建立出各個參考繪圖程式對應於各個硬體元件之一加權係數，以依據此些負載總值及此些加權係數將此些參考繪圖程式分類為數個群組(group)。將此些參考繪圖參數集合作為數個輸入，並將此些群組作為數個輸出，找出此些輸入與此些輸出之一映射函數，以訓練出此些參考繪圖程式對應於此些群組之一歸類關係(classifying relationship)。分析繪圖處理器硬體之此些硬體元件分別對應之負載分值與此些參考繪圖參數之相對關係。

根據本揭露之一實施例，提出一種繪圖處理程序之分析系統。繪圖處理程序之分析系統包括一參數擷取單元、一分組單元、一歸類單元(classifier)及一相對資訊單元。參數擷取單元對數個參考繪圖程式個別分析出數個參考繪圖參數，各該參考繪圖程式之該些參考繪圖參數組成一參考繪圖參數集合。分組單元係以一探測電路對一繪圖處理器硬體量測出此些參考繪圖程式相對應的數個負載分值及數個負載總值，各個負載分值對應於此些參考繪圖程式及繪圖處理器硬體之數個硬體元件，並建立出各個參考繪圖程式對應於各個硬體元件之一加權係數，以依據此些負載總值及此些加權係數將此些參考繪圖程式分類為數個群組(group)。歸類單元係將此些參考繪圖參數集合作為數個輸入，並將此些群組作為數個輸出，找出此些輸入與此些輸出之一映射函數，以訓練出此些參考繪圖程式對應於此些群組之一歸類關係(classifying relationship)。相對資訊單元分析繪圖處理器硬體之此些硬體元件分別對應之負載分值與此些參考繪圖參數之相對關係(relative relationship)。

為了對本揭露之上述及其他方面有更佳的瞭解，下文特舉較佳實施例，並配合所附圖式，作詳細說明如下：

100、100A、100B‧‧‧繪圖處理程序之分析系統

110‧‧‧參數擷取單元

120‧‧‧分組單元

130‧‧‧歸類單元

131‧‧‧訓練歸類單元

140‧‧‧相對資訊單元

150‧‧‧計算單元

900‧‧‧繪圖處理器硬體

CR‧‧‧歸類關係

LR‧‧‧相對關係

R_i、R_n,i‧‧‧參考繪圖參數

R_i’‧‧‧待估算繪圖參數

RP_n‧‧‧參考繪圖程式

RP’‧‧‧待估算繪圖程式

S110、S120、S121、S122、S123、S124、S125、S126、S127、S128、S130、S131、S132、S133、S134、S135、S136、S137、S140、S210、S220、S230‧‧‧流程步驟

α _j,i‧‧‧斜率係數

β _j‧‧‧平移係數

P_j、P_n,j、P_j’‧‧‧負載分值

PT、PT’、PT_n‧‧‧負載總值

W_k,j、W_k’,j‧‧‧加權係數

第1圖繪示繪圖處理程序之分析系統示意圖。

第2A圖繪示另一繪圖處理程序之分析系統示意圖。

第2B圖繪示另一繪圖處理程序之分析系統示意圖。

第3圖繪示負載總值的估算模型的示意圖。

第4圖繪示繪圖處理程序之分析方法於離線模式之流程圖。

第5A~5C圖繪示第4圖之各步驟的示意圖。

第6圖繪示繪圖處理程序之分析方法於線上模式之流程圖。

第7圖繪示第6圖之各步驟的示意圖。

請參照第1圖，其繪示繪圖處理程序之分析系統100之示意圖。繪圖處理程序之分析系統100對各種繪圖程式進行分析，以估算出一繪圖處理器硬體(Graphics Processing Unit,GPU)900(繪示於第5A圖)執行各種繪圖程式所需之處理負載。繪圖處理器硬體900例如是OpenGL ES 2.0 API為基礎的嵌入式繪圖處理器硬體(Embedded GPU)，此繪圖處理器硬體常用於可攜式裝置的磚牆式延緩描繪(Tile-Based Deferred Rendering,TBDR)繪圖處理器硬體架構。繪圖處理器硬體900又例如是DirectX。處理負載例如是處理功耗或處理時間。如此一來，程式開發者能夠針對高處理負載的繪圖程式進行改善。

繪圖處理程序之分析系統100包括一參數擷取單元110、一分組單元120、一歸類單元130、一相對資訊單元140及一計算單元150。繪圖處理程序之分析系統100在離線模式(offline mode)時，參數擷取單元110、分組單元120、歸類單元130及相對資訊單元140根據數個參考繪圖應用程式建立一估算模型。繪圖處理程序之分析系統100在線上模式(online mode)時，參數擷取單元110、歸類單元130、相對資訊單元140及計算單元150根據上述估算模型對一待估算繪圖程式進行估算，以獲得繪圖處理器硬體900(繪示於第5A圖)執行此待估算繪圖程式之負載總值。

請參照第2A圖，其繪示另一繪圖處理程序之分析系統100A之示意圖。在一實施例中，繪圖處理程序之分析系統100A可以僅執行離線模式的工作，而僅包括參數擷取單元110、分組單元120、歸類單元130及相對資訊單元140。請參照第2B圖，其繪示另一繪圖處理程序之分析系統100B之示意圖。在另一實施例中，繪圖處理程序之分析系統100B可以僅執行線上模式的工作，而僅包括參數擷取單元110、歸類單元130、相對資訊單元140及計算單元150。

參數擷取單元110、分組單元120、歸類單元130、相對資訊單元140及計算單元150例如分別是或組合成一晶片、一電路、一電路板、或儲存數組程式碼之記錄媒體。

請參照第3圖，其繪示負載總值PT的估算模型的示意圖。負載總值PT例如是處理功耗或處理時間。以磚牆式延緩描繪(TBDR)繪圖處理器硬體架構為例，繪圖處理器硬體900包括J個硬體元件，例如是虛擬驅動管理器(Virtual Drive Manager,VDM)、PDM元件、通用可擴展著色引擎(Universal Scalable Shader Engine,USSE)、拼貼共處理器(tiling coprocessor)、畫素共處理器(pixel coprocessor)、紋理共處理器(texturing coprocessor)、紋理快取記憶體(texture cache)、主記憶體(main memory)。

依據下式(1)，負載總值PT為加權係數W_k,j，(1

j

J)與硬體元件之負載分值P_j，(1

j

J)之乘積的總和。下標k表示第k個群組，下標j表示第j個硬體元件。每一群組均對應於J個加權係數W_k,j。

請參照下表一，其表示參考繪圖程式之參考繪圖參數與繪圖處理器硬體900之各項硬體元件之關係。參考繪圖參數可至少包括一般參數(general parameter)、幾何相關參數(geometry parameter)、像素相關參數(fragment parameter)、貼圖相關參數(texture parameter)。

一般參數包括幀速率(frame rate)。幾何參數可至少包括頂點數目(number of triangles/number of vertices)、批數(number of batches)、照光模式(lighting model)、細節的級別 (level-of-detail)、原始組合形式(primitive assembly type)、交錯的屬性(interleaving attributes)、實例(instancing)。分割參數包括解析度(resolution)、剪裁測試/板緩衝(scissor test/stencil buffer)、阿爾發測試(alpha test)、抗鋸齒(anti-aliasing)。紋理參數包括紋裡元素數量(number of texels)、紋理貼圖(texture mapping)、紋理過濾(texture filtering)、紋理壓縮(texture compression)、POT/NPOT。

表一中的「X」表示對應的參考繪圖參數與硬體元件具有高度相關性。如下式(2)所示，各個負載分值P_j與I個參考繪圖參數R_i，(1

i

I)具有一相對關係，後續以線性關係為例說明。下標i表示第i個參考繪圖參數。

也就是說，上式(1)可以轉換為下式(3)，下述式(3)即為負載總值PT的估算模型。

如第3圖所示，根據上述負載總值PT的估算模型，欲估算某一待估算繪圖程式之負載總值PT’時，可以擷取出待估算繪圖參數R_i’，(1

i

I)。依據待估算繪圖參數R_i’，(1

i

I)，配合相對資訊單元140所事先訓練出來之斜率係數α _j,i(1

j

J且1

i

I)及平移係數β _j，(1

j

J)，以計算出負載分值P_j’，(1

j

J)。再依據估算繪圖參數R_i’，(1

i

I)，歸類出此待估算繪圖程式所屬的群組後(例如是第k’群組)，可以得知此群組之加權係數W_k’,j，(1

j

J)，並求出負載總值PT’。

請參照第4及5A~5C圖，第4圖繪示繪圖處理程序之分析方法於離線模式之流程圖，第5A~5C圖繪示第4圖之各步驟的示意圖。繪圖處理程序之分析方法於離線模式中，可以將數個參考繪圖程式分為K個群組，並建立出各群組之繪圖處理器硬體900的負載總值PT的估算模型。以下係以繪圖處理程序之分析系統100B分析處理功耗為例作說明。在步驟S110中，提供數個參考繪圖程式RP_n，(1

n

N)，並透過參數擷取單元110對此些參考繪圖程式RP_n，(1

n

N)個別分析出數個參考繪圖參數R_n,i，(1

n

N且1

i

I)。此步驟是當參考繪圖程式運行於繪圖處理器硬體900時，將繪圖程式執行過程中每次呼叫繪圖API的動作及所帶的參數記錄成一個追蹤檔(API Trace)，並透過事後的分析以擷取出可用來進行負載估算的參考繪圖參數R_n,i，(1

n

N且1

i

I)。

在步驟S120中，分組單元120將此些參考繪圖程式RP_n，(1

n

N)分類為數個群組(例如是K個群組)。在此步驟中，群組的數量可以預先決定。對每個參考繪圖程式RP_n，(1

n

N)而言，當其運行於繪圖處理器硬體900時，可藉由額外添加的探測電路來進行負載分析，以量測出其相對應的負載分值P_n,j，(1

n

N且1

j

J)，負載總值PT_n，(1

n

N)，並建立出其對應的各硬體元件之加權係數W_n,j，(1

n

N且1

j

J)，此即為各硬體元件對整體負載的貢獻比率值。再使用各種分群演算法，例如可以是K平均演算法(K-means algorithm)來進行分組，其中分群演算法的輸入值主要有(1)預建立的群組個數K、(2)負載總值PT_n，(1

n

N)、(3)加權係數W_n,j，(1

n

N且1

j

J)；而輸出則為(1)K個群組中各自包含的參考繪圖程式集合，在此稱為群組配置、(2)K個群組中各自對應的各硬體元件之加權係數W_k,j，(1

k

K且1

j

J)，在此稱為加權係數集合。其概念在於將參考繪圖程式RP_n，(1

n

N)之加權係數W_n,j，(1

n

N且1

j

J)對應於負載總值PT_n之成長趨勢近似者劃歸為同一個群組，並平均出各群組之加權係數W_k,j，(1

k

K且1

j

J)；這樣作的物理意義在於將各硬體元件使用率近似的參考繪圖程式劃歸為同一個群組，並計算出此群組的加權係數，因此之後於線上模式進行負載估算時就可以根據待估算繪圖程式之特性對其進行歸類，以動態選用其對應群組之加權係數W_k’,j，(1

j

J)來進行負載估算，使其適應繪圖處理器硬體900中各硬體元件的負載不平衡情況，進一步提高負載估算的準確度。舉例來說，30個參考繪圖程式RP_n，(1

n

N)中，第1~10個參考繪圖程式RP_n(1

n

10)之加權係數W_n,j，(1

n

10且1

j

J)對應於負載總值PT_n之成長趨勢相近，而被歸類為同一群組，並平均出第一群組之加權係數W_1,j，(1

j

J)(未繪示)；第11~30個參考繪圖程式RP_n，(11

n

30)之加權係數W_n,j，(11

n

30且1

j

J)對應於負載總值PT_n之成長趨勢相近，而被歸類為同一群組，並平均出第二群組之加權係數W_2,j，(1

j

J)(未繪示)。分群演算法另外又可以為例如：最大期望演算法(Expectation-maximization algorithm)、高連通子圖分群演算法(Highly Connected Subgraphs clustering algorithm)、基於連通性分群法/層次聚類法(Connectivity based clustering/hierarchical clustering)等。

分組單元120詳細的實現方式如第5B圖繪示之流程圖所述。為了將此些參考繪圖程式RP_n，(1

n

N)分類為K個群組，首先在步驟S121會將各參考繪圖程式之負載總值PT_n，(1

n

N)及加權係數W_n,j，(1

n

N且1

j

J)視為每個具有D維向量的資料點；接著在步驟S122提供預建立的群組個數，並在步驟S123根據預建立的群組個數K，從上述資料點之集合中隨機取K個點，以作為K個群組各自暫時的中心點；之後在步驟S124分別計算剩下的資料點至K個群組暫時的中心點之相異度，並將各資料點劃歸到相異度最低的群組。相異度一般用歐式距離或馬式距離來運算，距離越小則表示兩者之間越相似；再來在步驟S125根據分類結果重新計算K個群組各自的中心點，計算方法是取各群組中所有資料點各自維度的算術平均數；如果K個群組之中心點產生變化(步驟S126的結果為否)，則在步驟S127需要將所有資料點再按照新的K個群組中心點重新分類，其方法同樣是計算所有資料點至新的K個群組中心點之相異度，並將各資料點劃歸到相異度最低的群組；再根據分類結果重新計算K個群組各自的中心點；如果此時K個群組之中心點保持不變(步驟S126的結果為是)，則代表分類結果已經穩定不變，所以可以在步驟S128結束此疊代方法，以完成K個群組之分類。此時K個群組中各自包含的資料點即表示K個群組中各自包含的參考繪圖程式集合(群組配置)；而K個群組各自的中心點即表示K個群組中各自對應的各硬體元件之加權係數W_k,j，(1

k

K且1

j

J)。

完成分組後，再來要對已分組的參考繪圖程式RP_n，(1

n

N)進行分析。在步驟S130中，訓練歸類單元131的動作依據此些參考繪圖參數R_n,i，(1

n

N且1

i

I)，訓練出此些參考繪圖程式對應於此些群組之一歸類關係(classifying relationship)CR。此步驟是根據機器學習演算法(Machine Learning Algorithm)來執行，例如是一人工神經網路(artificial neural network algorithm,ANN algorithm)或一支持向量機演算法(Support Vector Machine algorithm,SVM algorithm)來進行訓練，其中機器學習演算法的輸入值主要有(1)分組單元120所產生之K個群組中各自包含的參考繪圖程式集合(群組配置)、(2)參數擷取單元110對此些參考繪圖程式RP_n，(1

n

N)進行個別分析後所擷取出的數個參考繪圖參數R_n,i，(1

n

N且1

i

I)；而輸出則為訓練完成之可藉由繪圖參數來預測對應群組的歸類單元130。由於作完參考繪圖程式RP_n，(1

n

N)之分組後，各參考繪圖程式是對應於哪個群組的這層關係是已知的，因此可以藉由這層關係來進行歸類單元130的訓練；之後於線上模式進行負載估算時就可以藉由待估算繪圖程式之參數來預測對應群組，並選用其對應群組之加權係數W_k’,j，(1

j

J)來進行負載估算。另外，此步驟並非依據硬體元件中細部的硬體訊號或資訊來訓練，而是依據參考繪圖程式RP_n，(1

n

N)之參考繪圖參數R_n.i，(1

n

N且1

i

I)進行訓練。也就是說，後續於線上模式欲判斷待估算繪圖程式RP’(繪示於第7圖)屬於哪一群組時，可以不分析硬體元件，而是依據待估算繪圖程式RP’之待估算繪圖參數R_i’，(1

i

I)(繪示於第7圖)即可，以減少和繪圖處理器硬體900的相依性。舉例來說，分組單元120作完參考繪圖程式RP_n，(1

n

N)之分組後，我們即可以知道各個參考繪圖程式RP_n，(1

n

N)是對應於K個群組，(1

k

K)中的某一個群組，如第1個參考繪圖程式RP₁是對應於群組_K-1，第2個參考繪圖程式RP₂是對應於群組_K-2，依此類推。而各個參考繪圖程式RP_n，(1

n

N)也會經由參數擷取單元110擷取出I個參考繪圖參數R_n,i，(1

n

N且1

i

I)，形成一組特定的參考繪圖參數集合；如第1個參考繪圖程式RP₁會有對應的參考繪圖參數集合R_1,i，(1

i

I)，第2個參考繪圖程式RP₂也會有對應的參考繪圖參數集合R_2,i，(1

i

I)，依此類推。因此有了各個參考繪圖程式RP_n，(1

n

N)是對應於K個群組，(1

k

K)中的某一個群組這層關係，我們就可以藉由參考繪圖程式RP_n，(1

n

N)對應的參考繪圖參數集合R_n,i，(1

n

N且1

i

I)，及其對應的群組編號，訓練出如何由參考繪圖參數映射到群組，而這也等於在訓練如何將參考繪圖程式映射到群組，以完成訓練歸類單元131的動作。

訓練歸類單元131詳細的實現方式如第5C圖繪示之流程圖所述。首先在步驟S131將各參考繪圖程式RP_n，(1

n

N)之數個參考繪圖參數R_n,i，(1

n

N且1

i

I)視為輸入特徵x⁽ⁿ⁾，將各參考繪圖程式對應的群組編號視為目標變數y⁽ⁿ⁾；接著在步驟S132將一個x⁽ⁿ⁾與y⁽ⁿ⁾配對成為一組訓練範例(x⁽ⁿ⁾,y⁽ⁿ⁾)，此即為各參考繪圖程式對應於此些群組之歸類關係，而這層已知的關係也是後續步驟的訓練依據；之後在步驟S133將所有訓練範例結合成訓練集合{(x⁽ⁿ⁾,y⁽ⁿ⁾)：n=1,…,N}，以成為歸類單元130的訓練資料庫；再來在步驟S134透過監督式訓練(Supervised training)，隨機從訓練集合中取出樣本來進行訓練，以找出一個可以由x映射到y的函數，使此映射函數可以藉由x來預測y；然後在步驟S135評估映射函數之預測誤差是否小於臨界值(Threshold)，如果映射函數之預測誤差仍然過大，則需在步驟S136新增更多的訓練範例(x⁽ⁿ⁾,y⁽ⁿ⁾)再使用新的訓練集合重新進行監督式訓練，以產生出新的映射函數；最後如果映射函數之預測誤差小於臨界值，則代表訓練結果已經穩定，而在步驟S137完成歸類單元130之訓練；而所產生的歸類單元130已具備可藉由繪圖參數來預測對應群組之能力。

在一實施例，在步驟S140，相對資訊單元140分析負載分值P_n,j，(1

n

N且1

j

J)與參考繪圖參數R_n,i，(1

n

N且1

i

I)之相對關係，例如線性關係(linear relationship)LR，而完成相對關係訓練分析後可獲得斜率係數α _j,i，(1

j

J且1

i

I)及平移係數β _j，(1

j

J)；因此之後於線上模式時就可以藉由待估算繪圖程式之參數，配合訓練完成之斜率係數α _j,i，(1

j

J且1

i

I)及平移係數β _j，(1

j

J)來進行負載分值的估算。相對關係除了前述舉例之線性關係，另外又如：正交多項式回歸(Polynomial regression)、羅吉斯迴歸(Logarithmic regression)、指數迴歸(Exponential regression)等關係。

上述步驟S140可執行於步驟S120~S130之前，或者同時進行。步驟S140與步驟S120~S130並不會互相干擾。

請參照第6~7圖，第6圖繪示繪圖處理程序之分析方法於線上模式之流程圖，第7圖繪示第6圖之各步驟的示意圖。繪圖處理程序之分析方法於線上模式中，可以分析出待估算繪圖程式RP’屬於哪一群組，並依據估算模型計算出繪圖處理器硬體900的負載總值PT’。在步驟S210中，提供待估算繪圖程式RP’，並且經由參數擷取單元110獲得此待估算繪圖程式RP’之待估算繪圖參數R_i’，(1

i

I)。

在步驟S220中，歸類單元130依據待估算繪圖參數R_i’，(1

i

I)，分析出待估算繪圖程式屬於哪一群組(例如是第k’群組)，並從離線模式中分組單元120所輸出之加權係數集合，挑選出其對應群組的各硬體元件之加權係數W_k’,j，(1

j

J)。因此歸類單元130的輸入是待估算繪圖參數R_i’，(1

i

I)，而其輸出為此待估算繪圖程式RP’所對應群組之加權係數W_k’,j，(1

j

J)。另外歸類單元130在對待估算繪圖程式進行歸類時，其可以選擇最接近的群組或是多個接近的群組。如果是選擇最接近的群組，則輸出此群組對應之加權係數；如果是選擇多個接近的群組，則根據待估算繪圖程式與這多個接近群組的接近關係來對這些群組對應的加權係數進行線性內插，以計算出一組新的加權係數並輸出。

在步驟S230中，計算單元150依據歸類單元130所輸出之加權係數W_k’,j，(1

j

J)、待估算繪圖參數R_i’，(1

i

I)、以及於離線模式中相對資訊單元140所輸出之可藉由繪圖參數來預測負載分值的斜率係數α _j,i，(1

j

J且1

i

I)及平移係數β _j，(1

j

J)，以上述式(3)之估算模型，計算繪圖處理器硬體900執行待估算繪圖程式RP’之負載總值PT’。

於一實施例中，上述所採用之相對關係，是依據於離線模式時訓練分析所得。

於一實施例中，繪圖處理器硬體900所包括之複數個硬體元件以其各對應之負載分值執行該待估算繪圖程式。

根據上述實施例，本案是藉由分析程式原始碼或API追蹤檔(API Trace)獲得的繪圖參數，來預估其於繪圖處理器硬體900上執行時的負載總值，是一種較貼近於繪圖程式開發者的繪圖處理器硬體900之負載總值的估算方式。如此一來，能夠讓程式開發者快速察覺到負載瓶頸是落於程式碼的哪一段並進行改善。這些繪圖參數可以不需實際存取硬體元件(或硬體模擬器)來獲得，且不相依於繪圖處理器硬體900的硬體架構，因此上述估算模型可以移轉至各種不同的繪圖處理器硬體900的硬體架構，針對每一種硬體架構，重新進行一次估算模型之離線模式的訓練即可，提供了相當大的彈性與擴充性。

此外，上述估算模型可以根據待估算繪圖程式之特性，動態選用最合適的加權係數，以適應繪圖處理器硬體900中各硬體元件與繪圖管線的負載不平衡情況，進一步提高負載估算的準確度。

綜上所述，雖然本揭露已以各種實施例揭露如上，然其並非用以限定本揭露。本揭露所屬技術領域中具有通常知識者，在不脫離本揭露之精神和範圍內，當可作各種之更動與潤飾。因此，本揭露之保護範圍當視後附之申請專利範圍所界定者為準。

S110、S120、S130、S140‧‧‧流程步驟

Claims

一種繪圖處理程序之分析方法，包括：提供複數個參考繪圖程式及各該參考繪圖程式之複數個參考繪圖參數，各該參考繪圖程式之該些參考繪圖參數組成一參考繪圖參數集合；以一探測電路對一繪圖處理器硬體量測出該些參考繪圖程式相對應的複數個負載分值及複數個負載總值，各該負載分值對應於該些參考繪圖程式及該繪圖處理器硬體之複數個硬體元件，並建立出各該參考繪圖程式對應於各該硬體元件之一加權係數，以依據該些負載總值及該些加權係數將該些參考繪圖程式分類為複數個群組(group)；將該些參考繪圖參數集合作為複數個輸入，並將該些群組作為複數個輸出，找出該些輸入與該些輸出之一映射函數，以訓練出該些參考繪圖程式對應於該些群組之一歸類關係(classifying relationship)；以及分析該繪圖處理器硬體之該些硬體元件分別對應之該負載分值與該些參考繪圖參數之一相對關係。
如申請專利範圍第1項所述之繪圖處理程序之分析方法，其中將該些參考繪圖程式分類為該些群組之步驟包括：將各該參考繪圖程式之該負載總值及該些加權係數視為各個具有D維向量的一資料點；根據該些群組之個數，從該些資料點之集合中隨機取複數個，以作為該些群組之複數個中心點；分別計算各該群組之其他資料點至各該中心點之相異度，並將各該資料點劃歸到相異度最低之該些群組之其中之一；重新計算各該群組之各該中心點；以及若該些群組之該些中心點產生變化，則再次執行將各該資料點規劃歸到該些群組之其中之一的步驟。
如申請專利範圍第1項所述之繪圖處理程序之分析方法，其中將該些參考繪圖程式分類為該些群組之步驟係透過K平均演算法(K-means algorithm)、最大期望演算法(Expectation-maximization algorithm)、高連通子圖分群演算法(Highly Connected Subgraphs clustering algorithm)或基於連通性分群法/層次聚類法(Connectivity based clustering/hierarchical clustering)進行。
如申請專利範圍第1項所述之繪圖處理程序之分析方法，其中訓練出該些參考繪圖程式對應於該些群組之該歸類關係之步驟包括：將各該參考繪圖參數集合視為該些輸入之其中之一，並將各該參考繪圖程式對應的該些群組之其中之一視為該些輸出之其中一；將該些輸入之其中之一與該些輸出之其中之一配對成為一組訓練範例；將該些訓練範例結合成一訓練集合，以成為一訓練資料庫；透過一監督式訓練，隨機從該訓練集合中取出樣本來進行訓練，以找出由該些輸入映射到該些輸出的該映射函數；評估該映射函數之一預測誤差是否小於一臨界值；以及若該映射函數之該預測誤差大於該臨界值，則新增該些訓練範例，並執行將該些訓練範例結合成該訓練集合之步驟及找出由該些輸入映射到該些輸出的該映射函數之步驟。
如申請專利範圍第1項所述之繪圖處理程序之分析方法，其中訓練出該些參考繪圖程式對應於該些群組之該歸類關係之步驟係透過一人工神經網路(artificial neural network algorithm)或一支持向量機演算法(Support Vector Machine algorithm)進行。
如申請專利範圍第1項所述之繪圖處理程序之分析方法，更包括：提供一待估算繪圖程式，並獲得該待估算繪圖程式之複數個待估算繪圖參數；依據該些待估算繪圖參數，分析出該待估算繪圖程式屬於該些群組(group)之至少其中之一，並獲得該些加權係數；以及依據該些加權係數及該些待估算繪圖參數，計算該繪圖處理器硬體執行該待估算繪圖程式之該負載總值。
如申請專利範圍第1項所述之繪圖處理程序之分析方法，其中，該繪圖處理器硬體之各該硬體元件以各對應之該負載分值執行該待估算繪圖程式，該些硬體元件之該些負載分值以該些加權係數進行加權總和，而獲得該負載總值。
如申請專利範圍第1項所述之繪圖處理程序之分析方法，其中各該負載總值係為一處理功耗或一處理時間。
一種繪圖處理程序之分析系統，包括：一參數擷取單元，對複數個參考繪圖程式個別分析出複數個參考繪圖參數，各該參考繪圖程式之該些參考繪圖參數組成一參考繪圖參數集合；一分組單元，係以一探測電路對一繪圖處理器硬體量測出該些參考繪圖程式相對應的複數個負載分值及複數個負載總值，各該負載分值對應於該些參考繪圖程式及該繪圖處理器硬體之複數個硬體元件，並建立出各該參考繪圖程式對應於各該硬體元件之一加權係數，以依據該些負載總值及該些加權係數將該些參考繪圖程式分類為複數個群組(group)；以及一歸類單元(classifier)，係將該些參考繪圖參數集合作為複數個輸入，並將該些群組作為複數個輸出，找出該些輸入與該些輸出之一映射函數，以訓練出該些參考繪圖程式對應於該些群組之一歸類關係(classifying relationship)；以及一相對資訊單元，分析該繪圖處理器硬體之該些硬體元件分別對應之該負載分值與該些參考繪圖參數之一相對關係。
如申請專利範圍第9項所述之繪圖處理程序之分析系統，其中該分組單元係將各該參考繪圖程式之該負載總值及該些加權係數視為各個具有D維向量的一資料點；該分組單元根據該些群組之個數，從該些資料點之集合中隨機取複數個，以作為該些群組之複數個中心點；該分組單元分別計算各該群組之其他資料點至各該中心點之相異度，並將各該資料點劃歸到相異度最低之該些群組之其中之一；該分組單元重新計算各該群組之各該中心點；若該些群組之該些中心點產生變化，則該分組單元再次將各該資料點規劃歸到該些群組之其中之一。
如申請專利範圍第9項所述之繪圖處理程序之分析系統，其中該分組單元係透過K平均演算法(K-means algorithm)、最大期望演算法(Expectation-maximization algorithm)、高連通子圖分群演算法(Highly Connected Subgraphs clustering algorithm)或基於連通性分群法/層次聚類法(Connectivity based clustering/hierarchical clustering)將該些參考繪圖程式分類為該些群組。
如申請專利範圍第9項所述之繪圖處理程序之分析系統，其中該歸類單元將各該參考繪圖參數集合視為該些輸入之其中一，並將各該參考繪圖程式對應的該些群組之其中之一視為該些輸出之其中一；該歸類單元將該些輸入之其中一與該些輸出之其中之一配對成為一組訓練範例；該歸類單元將該些訓練範例結合成一訓練集合，以成為一訓練資料庫；該歸類單元透過一監督式訓練，隨機從該訓練集合中取出樣本來進行訓練，以找出由該些輸入映射到該些輸出的該映射函數；該歸類單元評估該映射函數之一預測誤差是否小於一臨界值；若該映射函數之該預測誤差大於該臨界值，則該歸類單元新增該些訓練範例，並再次將該些訓練範例結合成該訓練集合及再次找出由該些輸入映射到該些輸出的該映射函數。
如申請專利範圍第9項所述之繪圖處理程序之分析系統，其中該歸類單元係透過一人工神經網路(artificial neural network algorithm)或一支持向量機演算法(Support Vector Machine algorithm)訓練出該些參考繪圖程式對應於該些群組之該歸類關係。
如申請專利範圍第9項所述之繪圖處理程序之分析系統，其中該參數擷取單元更對一待估算繪圖程式分析出複數個待估算繪圖參數，該歸類單元更依據該些待估算繪圖參數分析出該待估算繪圖程式屬於複數個群組(group)之至少其中之一，並獲得複數個加權係數，該繪圖處理程序之分析系統更包括：一計算單元，係依據該些加權係數及該些待估算繪圖參數，計算該繪圖處理器硬體執行該待估算繪圖程式之該負載總值。
如申請專利範圍第9項所述之繪圖處理程序之分析系統，其中該繪圖處理器硬體之各該硬體元件以各對應之該負載分值執行該待估算繪圖程式，該些硬體元件之該些負載分值以該些加權係數進行加權總和，而獲得該負載總值。
如申請專利範圍第9項所述之繪圖處理程序之分析系統，其中各該負載總值係為一處理功耗或一處理時間。