TWI439941B

TWI439941B - 多處理器系統內之自動工作量分布的方法、裝置，及多核心處理器系統

Info

Publication number: TWI439941B
Application number: TW097148118A
Authority: TW
Inventors: Bell, Jr; Capps, Jr; Thomas Edward Cook; Thomas J Dewkett; Naresh Nayar; Ronald Edward Newhart; Bernadette Ann Pierson; Michael Jay Shapiro
Original assignee: Ibm
Priority date: 2007-12-19
Filing date: 2008-12-10
Publication date: 2014-06-01
Also published as: TW200945206A; US7996346B2; US20090164399A1; JP2009151774A

Description

多處理器系統內之自動工作量分布的方法、裝置，及多核心處理器系統

本發明係關於一種多核心處理器的自動(automatic)工作量分布方法，具體而言，係關於多核心處理器自動化工作量分布。

在多核心電腦系統中，每個不同的系統資源(如中央處理單元、記憶體、I/O頻寬、磁碟儲存等)，皆係用以操作多指令執行緒。有效運作此等多核心電腦系統的困難度，隨著多處理器電腦中核心數量及複雜性的增加而提升。

使用多核心積體電路的其中一個問題，係很難編寫得以利用多核心之優勢的軟體。為了運用多核心處理器的優勢，許多任務通常需要被分成執行緒，而執行緒通常需要分布於可用的核心。分布執行緒的問題之一，係如何有效指引此等執行緒。在習知系統中，工作量係根據可用性及同類性(availability and affinity)而被送到核心。在其他系統中，軟體的撰寫會將特定任務執行於特定類型的核心。隨著核心數量及種類的增加，即可能更有智慧的分布工作量。

根據本發明，多核心系統係包含自動工作量分布。具體而言，當執行緒執行於多核心系統時，作業系統/超管理器持續得知執行緒的執行特徵，並將資訊儲存於執行緒特定的控制塊。此等執行特徵係用以產生執行緒效能資料。當執行緒執行時，作業系統/超管理器持續使用此效能資料，以將執行緒指引到執行此工作量效率最高的核心。

具體而言，在一實施例中，本發明係關於多處理器系統內自動工作量分布的方法。此方法包含測量執行於多處理器系統的複數個處理器中之應用程式的效能；儲存與多處理器系統之此複數個處理器上的應用程式之效能相關的資料；以及指定應用程式的執行給具有對應應用程式之處理消耗屬性之特徵的處理器。

在另一實施例中，本發明係關於多處理器系統內自動工作量分布的裝置。本裝置包含測量執行於多處理器系統的複數個處理器中之應用程式的效能之裝置；儲存與多處理器系統之此複數個處理器上的應用程式之效能相關的資料之裝置；以及指定應用程式的執行給具有對應應用程式之處理消耗屬性之特徵的處理器之裝置。

在另一實施例中，本發明係關於包含複數個處理器核心與一記憶體的多核心處理器系統。此記憶體儲存一自動工作量分布系統。此自動工作量分布系統包含可由多核心處理器執行，以運作測量執行於多核心處理系統的複數個處理器中之應用程式的效能；儲存與多核心處理系統之此複數個處理器上的應用程式之效能相關的資料；以及指定應用程式的執行給具有對應應用程式之處理消耗屬性之特徵的處理器等指令。

參照圖1，其繪示多處理器(MP)資料處理系統100的高階方塊圖，此系統提供本發明所選實施例中單一執行緒程式的改良式執行。資料處理系統100具有一或多個處理單元，安排在一或多個處理器群組中，且如圖示，包含四個處理單元111、121、131、141於處理器群組110。在一對稱型多處理器(SMP)實施例中，所有的處理單元111、121、131、141一般係相同的單元，即此等單元皆使用一組共同的指令及協定集或子集進行操作，且一般具有相同的架構。如處理單元111所示，每個處理單元可包含一或多個處理器核心116a、116b、146a、146b，負責執行程式指令，以操作此電腦。一範例處理單元可為IBM公司所提供的POWER5^TM 處理器，其包含一單一積體電路超純量微處理器，係具有許多執行單元、暫存器、緩衝器、記憶體及其他功能性單元，皆係以積體電路組合而成。處理器核心可根據精簡指令集運算(RISC)技術運作，並可實施管線式及亂序指令執行，以進一步改進超純量(superscalar)架構的效能。

如圖1所示，每個處理器核心116a、116b、146a、146b包含由高速記憶體裝置所建構的板上(On-board)(第一階L1)快取記憶體119a、119b、149a,149b(一般係分離指令與資料快取)。快取一般係用來暫時儲存處理器所重複存取的數值，避免自系統記憶體161載入數值的較費時步驟，進而加快處理的速度。處理器單元可包含另一快取，例如第二階(L2)快取112，係與快取記憶體控制器(未圖示)一同支援分屬核心116a及116b的一部份的第一階(L1)快取119a、119b。第二階(L2)快取142，係與快取記憶體控制器(未圖示)一同支援分屬核心146a及146b的一部份的第一階(L1)快取149a、149b。本發明亦可包含其他快取階層，如可由纖網匯流排(fabric bus)150存取的第三階快取166。從最高(L1)到最低(L3)的每個快取階層可依次儲存更多資訊，但需要較長的存取時間。舉例而言，處理器核心(如116a)中的板上L1快取(如119a)可具有128千位元組的記憶體儲存量，L2快取112可具有4百萬位元組的儲存量，而L3快取116可具有132百萬位元組的儲存量。為了促進修復/替換受損處理單元構件，每個處理單元111、121、131、141可用可替換式電路板、可插式模組或類似現場可替換元件(FRU)的形式建置，以模組的方式，輕易地替換、安裝或拿出系統100。

處理單元係透過系統互連或纖網匯流排150，與系統100的其他元件通訊。纖網匯流排150連接一或多個服務處理器160、系統記憶體元件161、記憶體控制器162、分享或L3系統快取166及/或許多週邊裝置169。處理器橋接器170可選擇性地用以連接其他處理器群組。雖未圖示，需要知道的是，資料處理系統100亦可包含儲存系統的基本輸入/輸出邏輯，以及每當開啟電腦系統(開機)時，即自其中一週邊元件中找出並載入作業系統的韌體。

如圖1所示，資料處理系統100包含多個系統資源(如快取記憶體、記憶體控制器、互連、I/O控制器等)，係由多個執行緒所分享。

系統記憶體裝置161(隨機存取記憶體或RAM)係以揮發(暫時)狀態的形態，儲存處理單元所使用的程式指令及運作元資料，其包含作業系統161A與應用程式161B。自動工作量分布模組161C可以任何形態(如作業系統模組、超管理器構件等)儲存於系統記憶體，並用以最佳化處理器單元之多核心中單一執行緒程式的執行。雖然自動工作量分布模組161C係以一設備的方式顯示於系統記憶體內，熟此技藝者當知，此模組可實施於資料處理系統100的其他構件中、或者自動工作量分布單元可單獨存在(位於處理器內或處理器外)。自動工作量分布模組161C係以可執行指令、代碼及/或控制單元(包含可程式化暫存器)實施，其可用以檢測執行於系統100中之代碼的效能監控資訊、分配優先順序值給使用預定規則的代碼、以及標籤每個具有分配優先順序值的指令，使優先順序值會與指令一同分布到系統100，如下詳述。

本系統100亦包含一效能監控器180。此效能監控器180可提供自動工作量分布模組161C所使用的效能資訊，以運作一自動工作量分布功能。具體而言，當執行緒執行於多核心系統時，作業系統/超管理器持續得知執行緒的執行特徵，並將資訊儲存於執行緒特定的控制塊。此執行特徵係用以產生執行緒效能資料。當執行緒進行執行時，作業系統/超管理器持續使用效能資料，以指引執行緒到最有效率執行工作量的核心。

參照圖2，其繪示多核心處理器中自動工作量分布作業的流程圖。自動工作量分布功能得知多核心系統內工作量如何運作，並將工作量指引到最佳核心。具體而言，自動工作量分布程序始於測試多核心處理器的效能。多核心處理器可包含同質或異質核心。針對具有同質核心的處理器而言，每個處理器會因為半導體程序的不同，而以不同的方式運作。舉例而言，在相同的電壓下，一個核心可能會執行的比此核心之另一實例來的快。不同核心可在不同頻率下進行執行。效能的差異係於步驟210，在模組或卡測驗(card test)(例如透過效能監控器180)作測量。測量係在步驟220以執行目標應用程式集的方式進行。效能資料儲存於晶片、模組或卡ROM。針對具有異質核心的處理器而言，可由例如浮點或向量效能作測量。效能分配亦可由對處理器設計的認知而運作。

應用程式第一次執行於系統時，核心中的效能監控器測量系統使用量的特徵。舉例而言，監控器分析單或雙浮點作業、記憶體使用量(L1、L2或主記憶體存取)、使用單或多週期的指令及其他項目。於步驟230，效能監控器得知應用程式對系統所施加的資源載量。於步驟240，標籤應用程式或次例行程式或執行緒，以及儲存效能資料。效能監控資料係自效能監控器180粹取出。硬體效能資料係儲存於執行緒的核心資料架構，供作業系統/超管理器(hypervisor)/叢集排程器使用。(硬體效能資料亦可用於取得處理器核心的效能的特徵，而特徵資訊可儲存於處理器)。於步驟250，排程器比對儲存於執行緒之控制資料架構中的硬體利用統計值以及系統中處理器的特徵。於步驟260，作業系統或超管理器分配執行緒到適合的核心，此適合的核心其硬體能力匹配所測量到的軟體工作量的處理消耗屬性。

排程器亦可利用資料，智慧型結合處理器或核心中的工作量。舉例而言，自動工作量分布170可決定以存取位於相同核心或處理器之快取的資料的執行緒，執行經常存取記憶體的執行緒較為有效率。資料亦可用以將快取延遲效能匹配給具有許多延遲及不同大小的快取。

結合具有不同處理特徵的處理器(皆係單一系統、叢集、或超管理器執行綜合體、低階非侵入處理器或核心監控能力的一部份)，以及根據所測量到的單元，利用特徵遞送決定，將工作路由給適當的處理器或核心的排程演算法，係提供優勢的自動工作分布系統。再者，因為此程序係持續性的，且效能利用資料係在每個時段作收集，若執行緒或工作量具有工作量變化，則執行緒或工作量可自動自處理器或綜合體中的處理器移除。

熟此技藝者將知，資料處理系統100可包含其他更多或更少的構件，例如I/O配接器、互連橋接器、非揮發儲存器、連接網路或依附元件的連接埠等。由於了解此等構件對本發明並非必須，所以圖1未顯示之，爾後亦不詳述。然而，需要知道的是，本發明所提供的改進適用於任何架構的多執行緒資料處理系統，且不受限於圖1所示之一般MP架構。

因此，本發明僅受限於以下專利請求項之精神與範疇，以及所有面向之均等者。

100．．．資料處理系統

110．．．處理器群組

111、121、131、141．．．處理單元

112．．．L2快取

116a、116b．．．處理器核心

119a、119b．．．板上(L1)快取記憶體

150．．．纖網匯流排

160．．．服務處理器

161．．．系統記憶體裝置

161A．．．作業系統

161B．．．應用程式

161C．．．效能最佳化

162．．．記憶體控制器

166．．．L3系統快取

169．．．週邊裝置

170．．．處理器橋接器

180．．．效能監控器

熟此技藝者可參照伴隨圖式，而更了解本發明之許多面向、特徵及優勢。說明書中，使用相同標號的元件代表相同或類似的元件。

圖1繪示本發明之實施例可實施於其中之多核心電腦架構；以及

圖2繪示多核心處理器中自動工作量分布系統之作業的流程圖。

Claims

一種一多處理器系統內之自動工作量分布的方法，該方法包含：測量執行於該多處理器系統之複數個處理器中之一應用程式的效能；儲存與該多處理器系統之該複數個處理器中之該應用程式之效能相關的資料；以及將一應用程式的執行分配給具有對應該應用程式之處理消耗屬性之特徵的一處理器；其中，該儲存係在一對應應用程式之一控制資料架構內。
如請求項1所述之方法，更包含：比對儲存於該應用程式之該控制資料架構中的硬體利用統計值與該系統中處理器的特徵。
如請求項1所述之方法，其中：該多處理器系統包含一效能監控器；以及該測量步驟係由該多處理器系統之該效能監控器進行。
如請求項1所述之方法，其中：該多處理器系統之該複數個處理器中之至少一處理器包含複數個核心；以及該測量步驟包含測量執行於該至少一處理器之該複數個核心之一應用程式的效能；以及更包含根據該測量步驟，取得該複數個核心的效能的特徵；以及儲存與該至少一處理器之該複數個核心之效能相關之特徵資訊。
一種一多處理器系統內之自動工作量分布的方法，該方法包含：測量執行於該多處理器系統之複數個處理器中之一應用程式的效能；儲存與該多處理器系統之該複數個處理器中之該應用程式之效能相關的資料；以及將一應用程式的執行分配給具有對應該應用程式之處理消耗屬性之特徵的一處理器；得知該應用程式對該多處理器系統所施加的一資源載量；以及當根據該資源載量分配該應用程式的執行，考慮該資源載量。
如請求項5所述之方法，其中：該資源載量包含決定單或雙浮點作業、記憶體使用量及利用單或多週期的指令中之至少一者。
一種一多處理器系統內自動工作量分布的裝置，該裝置包含：一測量執行於該多處理器系統之複數個處理器中之一應用程式的效能之裝置；一儲存與該多處理器系統之該複數個處理器中之該應用程式之效能相關的資料之裝置；以及一將一應用程式的執行分配給具有對應該應用程式之處理消耗屬性之特徵的一處理器之裝置；其中，該儲存係在一對應應用程式之一控制資料架構內。
如請求項7所述之裝置，更包含：一比對儲存於該應用程式之該控制資料架構中的硬體利用統計值與該系統中處理器的特徵之裝置。
如請求項7所述之裝置，其中：該多處理器系統包含一效能監控器；以及該測量步驟係由該多處理器系統之該效能監控器運作。
一種一多處理器系統內自動工作量分布的裝置，該裝置包含：一測量執行於該多處理器系統之複數個處理器中之一應用程式的效能之裝置；一儲存與該多處理器系統之該複數個處理器中之該應用程式之效能相關的資料之裝置；以及一將一應用程式的執行分配給具有對應該應用程式之處理消耗屬性之特徵的一處理器之裝置；一得知該應用程式對該多處理器系統所施加的一資源載量之裝置；以及當根據該資源載量分配該應用程式的執行，一考慮該資源載量之裝置。
如請求項10所述之裝置，其中：該資源載量包含決定單或雙浮點作業、記憶體使用量及利用單或多週期的指令中之至少一者。
一種多核心處理器系統，該系統包含：複數個處理器核心；一記憶體，該記憶體儲存一自動工作量分布系統，該自動工作量分布系統包含可供該多核心處理器執行以運作下列步驟之指令：測量執行於該多核心處理系統之複數個處理器中之一應用程式的效能；儲存與該多核心處理系統之該複數個處理器中之該應用程式之效能相關的資料；以及將一應用程式的執行分配給具有對應該應用程式之處理消耗屬性之特徵的一處理器；其中，該儲存係在一對應應用程式之一控制資料架構內。
如請求項12所述之多核心處理器系統，其中該自動工作量分布系統更包含以下指令：比對儲存於該應用程式之該控制資料架構中的硬體利用統計值與該系統中處理器的特徵。
如請求項12所述之多核心處理器系統，更包含：一效能監控器；以及其中該測量指令導致該效能監控器測量該應用程式之效能。
一種多核心處理器系統，該系統包含：複數個處理器核心；一記憶體，該記憶體儲存一自動工作量分布系統，該自動工作量分布系統包含可供該多核心處理器執行以運作下列步驟之指令：測量執行於該多核心處理系統之複數個處理器中之一應用程式的效能；儲存與該多核心處理系統之該複數個處理器中之該應用程式之效能相關的資料；以及將一應用程式的執行分配給具有對應該應用程式之處理消耗屬性之特徵的一處理器；得知該應用程式對該多核心處理系統所施加的一資源載量；以及當根據該資源載量分配該應用程式的執行，考慮該資源載量。
如請求項15所述之多核心處理器系統，其中該自動工作量分布系統更包含以下指令：該資源載量包含決定單或雙浮點作業、記憶體使用量及利用單或多週期的指令中之至少一者。