TW201405425A

TW201405425A - 微處理器中存取及管理程式碼轉譯

Info

Publication number: TW201405425A
Application number: TW102112642A
Authority: TW
Inventors: Nathan Tuck; Ross Segelken
Original assignee: Nvidia Corp
Priority date: 2012-04-11
Filing date: 2013-04-10
Publication date: 2014-02-01
Also published as: US20130275684A1; DE102013201387A1; CN103377066B; US9880846B2; TWI512626B; CN103377066A

Abstract

在一具體實施例中，一微處理系統包含設置於一處理器核心上的一硬體結構。硬體結構包含複數個項目，其每一係關聯於程式碼的部份以及可執行而達成實質等效功能之該程式碼的一轉譯。硬體結構包含一重定向陣列，其在被參照時係致能執行從程式碼的部份重定向至其對應轉譯。致能此重定向的項目係基於項目的使用資訊而維持於硬體結構內或從硬體結構逐出。

Description

微處理器中存取及管理程式碼轉譯

本發明係關於一種微處理器中存取及管理程式碼轉譯。

現代的微處理器使用各種的策略來改善處理及執行。其中一種改善包含轉譯給定指令集架構(ISA)的指令。當由微處理器執行時，ISA程式碼的轉譯版本相對於非轉譯的ISA指令可提供各種效能優勢。在某些情況中，具有轉譯的系統在其提供具有對轉譯程式碼存取之處理管線的方式中效率不佳。舉例來說，某些系統可持續位於一狀態，其中重要、經常執行的轉譯比提供較少優勢的轉譯相對更難以存取。

本發明提供一機制，用以有效管理對應程式碼部分(例如目標ISA程式碼部份)之轉譯的擷取與執行。轉譯的智慧型產生及其最佳化可由動態二元轉譯器處理，其可包含作為提供ISA及處理器核心之間介面的軟體層的部份。本發明更描述一多工處理管線，其中微處理器使用核心上硬體結構以有效地擷取及執行對應ISA程式碼的轉譯版本。硬體結構在本文中也可稱作「硬體重定向器」。

100‧‧‧微處理系統

102‧‧‧微處理器

110‧‧‧儲存位置

112‧‧‧處理器暫存器

114‧‧‧L1處理器快取記憶體

116‧‧‧L2處理器快取記憶體

118‧‧‧L3處理器快取記憶體

120‧‧‧主記憶體

122‧‧‧輔助儲存

124‧‧‧第三儲存

126‧‧‧記憶體控制器

128‧‧‧提取邏輯

130‧‧‧解碼邏輯

132‧‧‧執行邏輯

134‧‧‧記憶體邏輯

136‧‧‧寫回邏輯

138‧‧‧軟體層

140‧‧‧動態二元轉譯器

200‧‧‧系統

202‧‧‧處理管線

204‧‧‧提取邏輯

206‧‧‧硬體解碼器

208‧‧‧執行邏輯

210‧‧‧核心上硬體重定向器

212‧‧‧項目

220‧‧‧重定向器陣列

222‧‧‧重定向器資訊

230‧‧‧提取操作

232‧‧‧位址

234‧‧‧位址

240‧‧‧存取陣列

242‧‧‧每項目存取位元

250‧‧‧管理軟體

252‧‧‧使用歷史資料結構

300‧‧‧方法

400‧‧‧方法

圖1顯示根據本發明具體實施例之微處理系統。

圖2示意地繪示具有一核心上硬體結構及相關構件的微處理系統，其有助於從程式碼部份至達成實質等效功能之該程式碼部份的對應轉譯的執行重定向。圖式更繪示了基於其使用而將重定向項目維持於硬體結構中或逐出硬體結構。

圖3顯示在一處理管線中之範例的方法程序流程，用於在轉譯模式或在硬體解碼器模式中的另一處理。

圖4顯示在處理管線中之另一範例的方法程序流程，用於在轉譯模式或在硬體解碼器模式中的另一處理。

當經由硬體重定向器存取時，轉譯係代替對應的程式碼而執行並提供實質等效的功能。一旦被擷取，這些轉譯可在處理管線中執行而不需使用微處理器的硬體解碼器。當本說明書中提到「不需使用硬體解碼器」而執行，這種表達方式可仍包含在執行一轉譯時之硬體解碼器的輕微或瑣細使用。或者，若轉譯尚未產生或無法存取，則目標程式碼可由硬體解碼器接收及處理以產生對微處理器之執行邏輯/機制為原生且可由其執行的指令。所述之不需硬體解碼器之轉譯的執行在本文中將稱作執行的「轉譯模式」，對比於上述之「硬體解碼器模式」，其中完整的硬體解碼器功能係用以將目標ISA指令解碼為原生指令。在許多情況中避開硬體解碼器(即藉由執行一轉譯)將改善執行的速度、降低功率消耗、及提供各種其他優勢。

雖然本文中描述對「多工」處理管線的各種參照，將理解到此術語係指組態以交替地提供(例如多工)多重操作模式(例如轉譯模式對硬體解碼器模式)的處理管線。因此，將進一步理解到管線可使用邏輯，以取代或額外補充多工邏輯，來提供本文所述的特徵。

隨著時間經過，經常及/或最近請求的轉譯係由設置於處理器核心上的硬體重定向器所索引並併入其中。硬體重定向器中的每一項目係關聯於一轉譯，並提供重定向資訊，其致能微處理器在針對所選程式碼部份的提取操作過程中造成執行被重定向而遠離該程式碼部份並朝向其關聯的轉譯。若程式碼部份具有一項目於硬體結構中(「命中(hit)」)，則關聯轉譯係執行於轉譯模式中(即不需硬體解碼器)。若對硬體結構的參照「未命中(misses)」(即沒有針對程式碼部份的項目)，則程式碼部份係使用硬體解碼器而執行於硬體解碼器中。

隨著時間經過，微處理器系統可產生大量的轉譯。為了節省處理器晶粒面積並提供快速的檢查，硬體重定向器的尺寸可能受到限制。因此，較佳為填入對最「有價值」的轉譯(例如最常及/或最近使用的轉譯)提供重定向之項目。換言之，一般較佳為對硬體重定向器的參照具有儘可能高的命中率。

為最大化命中率並提供對有價值轉譯的有效及快速存取，硬體重定向器包含關聯於出現在結構之項目的使用資訊。使用資訊係回應用於重定向執行之硬體結構中的項目而變化。最大化命中率可藉由基於此使用資訊而將項目維持在硬體結構內或從硬體結構逐出而達成。

根據系統的整體設計，在硬體重定向器上的未命中可表示 (1)針對特定程式碼部份尚未產生一轉譯；或(2)轉譯已經產生，但無法經由與硬體重定向器的互動而存取。情況(2)可能導致例如轉譯由於比其他轉譯更少及/或更久使用而為「較小可利用性」的情況。在此範例中，且如本文所述，硬體重定向器中項目的數量係動態且智能地控制以最大化硬體重定向器的命中率。

圖1示意地繪示微處理系統100，其包含微處理器/核心102 及相關的軟體及記憶體系統，其可與本文所述的系統及方法結合使用。特別地，可實施所繪示的系統以有效地利用上述的多工策略，且其將結合各種範例而進一步描述於下。

微處理器102可包括及/或可通訊各種記憶體及儲存位置110，其可包括處理器暫存器112、L1處理器快取記憶體114、L2處理器快取記憶體116、L3處理器快取記憶體118、主記憶體120(如一或多個DRAM晶片)、輔助儲存122(如磁性及/或光學儲存單元)及/或第三儲存124(如磁帶)。這些位置的部份或全部可為記憶體映射，然在某些實施中，處理器暫存器可不同於其他位置而映射、或可實施而使得其非為記憶體映射。L1-L3快取記憶體可在或可不在處理器晶粒/核心上，但在許多情況中，至少L1快取記憶體會在處理器核心上。將理解到，記憶體/儲存組件係以存取時間及容量的遞增順序於上文中列出，但可能有例外。記憶體控制器126可用以處理協定並提供主記憶體120所需的信號介面，以及一般來說用以排程記憶體存取。記憶體控制器可實施於處理器晶粒上或於單獨的晶粒上。將理解到，前文所提到的位置為非限制性的，且可使用其他記憶體/儲存位置而不會偏離本發明範疇。

微處理器102係組態以執行指令，其一般由對處理器為原生之ISA所描述及定義。在本說明書中，原生指令係以兩種不同的方式產生。第一種方式包含硬體解碼器，其接收目標ISA指令並從那些目標ISA指令產生原生指令。第二種方式為產生目標ISA指令的最佳原生轉譯，一般係經由動態二元轉譯器(例如顯示為140)。這些指令提供實質等效的功能，但可不需硬體解碼器而最佳化及執行。

不論特定的ISA，所述的多工機制可用以有效地擷取及執行ISA程式碼部份或這些程式碼部份的對應轉譯。微處理器102可組態以執行各種指令集架構，其可特徵化為複雜指令集(CISC架構)、精簡指令集(RISC架構)、及/或VLIW架構。此外，給定的指令集有可能具有關聯於多於一個這些規則的特性。此外，被認為是CISC實施的某些指令集實際上可以類似RISC的方式執行於微處理器102上。舉例來說，廣為使用的x86架構，雖被認為是CISC系統，通常以與管線RISC實施更為相關的方式施行。再者，不論特定的ISA或其特徵，本發明提供用以有效地利用ISA程式碼部份之轉譯的方式。

一連串處理器識別指令(即ISA指令)之程式碼的例子可造成作業系統、應用程式、驅動器等之編譯程式碼產生由微處理器102執行之二元程式碼。在編譯或後處理操作過程中，可使用VLIW類型的技術(例如在軟體層)以實現各種最佳化。在某些情況中，可使用這些軟體最佳化以使微處理器可依程式順序執行指令，而不需複雜的雜湊偵測及迴避/減緩硬體，其係出現在許多CISC及RISC執行管線中。亦即，在某些情況中，可使用軟體及/或解碼及執行硬體來施行動態最佳化及雜湊迴避，以替代或補充VLIW技術。

微處理器更包含處理管線，其一般包括提取邏輯128、解碼邏輯130、執行邏輯132、記憶體邏輯134、及寫回邏輯136。提取邏輯128從一或多個位置110(但一般係從由L2-L3快取記憶體及主記憶體所支援之統一或專用L1快取記憶體)擷取指令。

解碼邏輯130藉由例如解析運算碼、運算元、及定址模式而解碼指令。解析後，指令接著由執行邏輯132執行。如前述且如下文中將進一步描述，處理器102可組態以在轉譯模式時經由執行邏輯132執行目標ISA指令的轉譯，而不需先以硬體解碼器(例如解碼邏輯130)解碼這類指令。

針對產生主要結果的操作(例如相對於施行分支至執行程式中另一位置的操作)，寫回邏輯136將結果寫回適當的位置，例如處理器暫存器。在載入/儲存架構中，記憶體邏輯134執行負載及儲存操作，例如從主記憶體將運算元載入處理器暫存器。

應理解到，上述五個階段係稍微特定於或包含於一典型的 RISC實施中。更一般地，微處理器可包括提取、解碼、及執行邏輯，其具有由執行邏輯所實現的記憶體及寫回功能。本發明同樣可應用於這些及其他微處理器實施。

在所述的範例中，指令可在一時間提取及執行一次，可能需要多個時脈循環。在這期間，可不使用資料路徑的重要部份。補充或取代單一指令提取，可使用預提取方法以改善效能並避免關聯於讀取及儲存操作的延遲瓶頸(即指令的讀取及載入此類指令至處理器暫存器及/或執行序列)。此外，範例性微處理器可管線化以利用指令階層平行度(parallelism)且較佳地利用資料路徑，使得在相同時間有多重指令在不同的執行階段。此外，提取邏輯128、解碼邏輯130、執行邏輯132等可個別地以多重邏輯階段管線化以改善效能。

儲存位置110可包括安全/私用的記憶體配置，其在原生ISA指令的執行過程中可由微處理器102存取。此記憶體配置可例如用於軟體層138(圖1)的執行及相關資料的儲存。特別相關於本發明的為轉譯的程式庫，其已從目標ISA程式碼的對應區塊產生。這些轉譯可在長度及其最佳化的範圍上變化。

圖2顯示用以選擇性地經由處理管線202而提供硬體解碼器執行及動態二元轉譯執行的系統200具體實施例。處理管線係以簡化形式顯示，且包括提取邏輯204、硬體解碼器206及執行邏輯208。系統200包括具有複數個項目212的核心上硬體重定向器210，其每一係關聯於對應程式碼部份的轉譯。在本範例中，硬體重定向器包括N個項目，然將理解到，其可具有任何可行的尺寸。

硬體重定向器所參照的每一轉譯可執行以取代其對應的程式碼部份而達成實質等效的功能。如前述，轉譯的程式碼可經由基於軟體的動態二元轉譯器(例如，圖1的動態二元轉譯器140)而智能地產生，且可以各種方式最佳化(例如使用暫存器更名、迴圈轉換、操作的重排序、指令及微操作的編組及聯合等等)。這些為非限制性的範例-程式碼轉譯可由各種其他方式實施。

硬體重定向器包括重定向器陣列220，其對每一項目包括重定向器資訊222，系統可使用重定向器資訊222將執行從一所選程式碼部份重定向至其對應的轉譯。此資訊可例如在提取邏輯204施行提取操作230的過程中使用。

在所繪示的範例中，重定向資訊係實施為目標ISA程式碼部份之位址(232)與其對應轉譯之位址(234)之間的位址映射。在提取操作過程中，可在重定向陣列220上執行檢查。若被提取的目標ISA位址係出現於陣列中，則提取操作係使用轉譯的位址而進行。這致能處理管線重定向轉譯，並在執行邏輯中將其執行而不使用硬體解碼器(即在執行的轉譯模式中)。或者，若目標ISA程式碼部份的位址未出現於陣列中，則程式碼部份係使用硬體解碼器206而執行於硬體解碼器模式中。在使用位址映射的範例中，也可使用位址的雜湊形式結合硬體重定向器中的項目。位址映射僅為一範例；本發明包含任何適當的核心上硬體機制，用以致能執行從其對應的程式碼部份被重定向至一轉譯。

硬體重定向器210更包含存取陣列240，其包含使用資訊，使用資訊係變化以回應項目212用於重定向執行至轉譯。如下文中將更詳細描述，所繪示的系統使用使用資訊以控制特定項目係維持在硬體重定向器內或從硬體重定向器逐出。使用資訊可為各種形式，然而其在此範例中係實施為每項目存取位元242。存取位元為其在硬體重定向器中的關聯項目是否已用以重定向執行至轉譯的二元指示。在其他範例中，可編碼使用資訊以涵蓋硬體重定向器中的多個項目，而非編碼針對個別項目的資訊。

系統200更包含管理軟體250，其與硬體重定向器及使用歷史資料結構252互動。此外，此互動的目的係動態地控制硬體重定向器中特定項目的數量。管理軟體可重複地取樣在存取陣列240中的使用資訊，且可使用這些取樣來儲存及分析關聯於硬體重定向器中項目的資訊。分析係依序執行以判定特定項目係維持在硬體重定向器內或從硬體重定向器逐出。這可例如基於這些項目最近一次及/或有多常用於重定向執行至轉譯而執行。

有關被逐出的項目，歷史資訊一般將保留在使用歷史資料結構252中，另外還有目前有效的項目。作為後續分析的結果(例如藉由所繪示的管理軟體)，逐出項目可在同一點再次進入硬體重定向器中。

事實上，圖2顯示未出現在硬體重定向器中之項目的歷史資訊的儲存。歷史資料結構252比硬體重定向器具有更多的項目(N+X>N)，其反應了一般情況為系統產生了比硬體重定向器中之槽隙更多的轉譯。轉譯提供較快及/或較有效率的操作，然而從一個大的查詢結構識別及擷取一給定的轉譯可能抵消任何這類的好處。舉例來說，在有大量轉譯的情況下，試圖使用目標指令指標來查詢及擷取轉譯可能相對較慢。硬體重定向器中從1到N以及結構252中從1到N+X的編號並不暗示任何序列或連續的排序。這僅為可針對比硬體重定向器中之項目更多數量的轉譯儲存使用資訊的一指示。

現在回到使用存取位元242的特定範例，每當項目用以重定向執行時，可設定針對特定項目的存取位元。在被設定的時間之間，位元可由硬體或由管理軟體250清除。在一範例中，管理軟體針對硬體定向器中的項目而重複地取樣並清除存取位元。這可以定期的時間間隔發生，例如每M個時脈週期(例如每1000個週期)或有關於某些其他經常性事件(例如計時器中斷)。管理軟體接著可隨著時間產生存取位元之數值的歷史，並儲存該歷史於使用歷史資料結構252中。接著，可使用各種方法來分析此歷史，以增加硬體重定向器210的命中率。再者，由管理軟體250所執行的分析一般將包含對項目有多常及/或最近一次用於重定向執行的評估，其接著用以控制特定項目係維持在硬體重定向器中或從硬體重定向器逐出。

除了存取位元，本文所述系統可採用使用資訊。不論是編碼於存取陣列240中或以各種形式儲存於使用歷史資料結構252，使用資訊可包括對一項目已用於重定向執行幾次的計數。舉例來說，可針對一或多個項目於硬體重定向器210及/或使用歷史資料結構中使用計數器。當項目用於重定向執行時，使用資訊可更包括時間的識別。

在圖2中，管理軟體係繪示為與處理管線202分開。然而，此程式碼可於不同的位置執行及/或可關聯於圖1及圖2中所繪示之各種組件。在一範例中，管理程式碼於處理管線202上執行，並存取圖2中所繪示的硬體重定向器及使用歷史資料結構。

不論特定組態為何，提供重定向及使用資訊於硬體結構中可提供顯著的好處。當處理器沿主要執行路徑提取程式碼時，對硬體重定向器的查詢可發生在管線的前端。若重定向改成實施為軟體結構，次常式將需要被呼叫以施行檢查，而非直接繼續沿著主要執行路徑。硬體重定向器因而提供一機制，供對高數值轉譯的快速及簡單存取。

現在參考圖3及圖4，圖式顯示管理重定向資訊的硬體可存取項目之範例方法及程序流程。方法可以任何合適的軟體/硬體來施行，包括前述範例中所顯示之外的組態。然而，在某些情況中，程序流程可參照已描述的組件及程序。為了清楚描述並將重複最小化，可假設這些組件/程序類似於前述的範例。

圖3繪示用於在前述模式(即硬體解碼器模式或轉譯模式)中之替換處理的範例方法300。在302，方法包含使用動態二元轉譯器或經由另一適當的方法來產生複數個轉譯。在304，方法包含設置具有複數個嵌入項目的核心上硬體結構。每一項目係關聯於步驟302所產生之轉譯的其中一者，並包含重定向資訊，其致能將執行從非轉譯程式碼部份重定向至其對應的轉譯。可如前述使用位址映射，然而可使用其他方法以重定向執行至轉譯，以代替其對應的程式碼部份。

在306，方法包含將使用資訊嵌入硬體結構。使用資訊回應用於重定向執行之項目而變化。合適使用資訊的範例包括每項目存取位元；項目用於重定向執行之次數的計數；項目用於重定向執行之時間的指示等。在某些範例中，使用資訊係從硬體結構擷取，並儲存於軟體且處理以控制在304所提及之項目的數量。

事實上，在308，方法包括基於步驟306之不同的使用資訊而維持項目或將項目從硬體結構逐出。如前述，這可包括基於項目有多常及/或最近一次用於重定向執行而控制什麼項目出現在硬體結構中。

在具有存取位元的範例中，這些位元可被重複地取樣並清除以隨著時間產生存取位元值的歷史。接著可分析此歷史以執行步驟308所示的維持/逐出。

圖3的流程圖並不意圖暗示需以特定順序來執行步驟，然在某些設定中可能需要特定的順序。一般而言，可以不同於圖式中所示的順序來執行步驟，且在許多情況中，步驟將並行地施行。

圖4顯示用於在轉譯模式或硬體解碼器模式中之替換處理的另一範例方法400。此範例方法特別地包含使用前述之硬體重定向器中的存取位元。在402中，方法400包含在硬體解碼器模式中執行目標ISA指令。為了在程式碼部份(即目標ISA部份及/或原生ISA部份)之間簡單地切換，程式碼部份可於分支指令分開。換言之，第一程式碼部份可結束於一分支指令，使得分支指令的目標為其他程式碼部份的開始。因此，在402之目標ISA指令的執行可繼續直到到達此一分支指令，並接著進行至404。除了在此範例中的分支，可使用任何其他合適程式碼區段的分隔。

在404，方法包含評估是否在硬體重定向器(例如圖2的硬體重定向器210)中發生命中。在一範例中，對硬體重定向器的詢問可藉由查詢關聯於分支目標的一位址而實施。在命中的情況下，方法繼續進行至406，設定關聯於重定向項目的存取位元。

在408，方法包含執行相關的轉譯。轉譯的執行係持續進行直到(1)到達原生分支410，在此處將執行另一轉譯，或(2)到達一外部分支(即到目標ISA程式碼部份的分支)，在此處程序將回到404以對硬體重定向器中的項目做進一步的詢問。

再次回到404，若在硬體重定向器中沒有項目對應分支目標，在412可記錄一失誤。失誤可關聯於分支目標，以識別經常失誤的目標或失誤次數高於一臨界數目的目標。特別地，在414，方法400包含評估是否已發生失誤觸發的情況。此一觸發可經由使用各種不同標準(補充或取代上述的頻率/臨界範例)的任何適合機制來判定。步驟412及414可被認為是追蹤硬體解碼器的使用，因為分支目標失誤將導致硬體解碼器模式的執行。

若滿足觸發條件，方法可包含在416，若存在一轉譯，可能地加入針對分支目標的一項目至硬體重定向器。在一範例中，可接著使用原生分支以繼續進行在408所示的轉譯模式執行。然而，若不存在轉譯，則方法400可包括在418可能地產生一轉譯並加入針對該轉譯之一項目至硬體重定向器。或者，系統可記錄轉譯可能是需要的或較佳的，且程序可回到在402的硬體解碼器模式執行，而非立刻地產生轉譯。

如前述的流程圖所示，應理解到，在許多情況中可以不同於圖式中所指的順序來施行各種步驟。舉例來說，硬體解碼器模式執行一般在404的失誤後將立刻啟動，使得步驟412、414、416及418將與失誤分支目標的硬體解碼器處理並行地發生。

在方法400所述之程序過程中的任何時間點，方法可包含維持硬體重定向器結構，如420所示。維持硬體重定向器可包括在422讀取存取位元及在424清除存取位元。維持可更包括在426基於使用資訊而更新硬體重定向器中的項目，如參照存取位元之數值所判定。

將理解到，本文所述之方法僅用以作為說明目的且不意欲作為限制。因此，將理解到，在某些具體實施例中，本文所述的方法可包含額外或替代的程序，而在某些具體實施例中，本文所述的方法可包含被重新排序或省略的某些程序，而不會偏離本發明範疇。此外，將理解到，本文所述方法可使用包含本文所述之特定範例之任何合適的軟體及硬體來施行。

此書面說明使用範例來揭露本發明，其包含最佳模式，也致能熟習相關領域技藝者實行本發明，包括製造及使用任何裝置或系統並實施任何結合的方法。本發明的可專利範疇係由申請專利範圍所定義，且可能包括熟此技藝者所理解的其他範例。這些其他範例係意欲在申請專利範圍的範疇內。