TWI282514B

TWI282514B - Method, apparatus and computer readable media for recording related instruction for correcting an internal call/return stack in a pipelined microprocessor

Info

Publication number: TWI282514B
Application number: TW092135488A
Authority: TW
Inventors: Thomas C Mcdonald
Original assignee: Ip First Llc
Priority date: 2003-01-16
Filing date: 2003-12-16
Publication date: 2007-06-11
Also published as: TW200417919A; US20040143727A1; US7178010B2

Description

^8251^年./轉換頁；一一>· 九、發明說明：【發明所屬之技術領域】之領:=有關微處理器中呼叫(cai 1 v轉回(return滩疊呼叫/轉回堆疊與主記憶體間之-致性的維持。詈。!疋一種可執行電腦系麟規定之指令的數位裝科用一種内部呼叫/轉回堆疊以減少管線氣泡的指令挪之冗長記舰於存取時所造成的。 ^日'7純_來將財雜改變至次f式之-指令， ί Ϊ!? 由辦叫齡所綱。當—呼叫指令_于二二該呼叫指令後面之指令的位址)將會被推入主記 k體中由祕理盗内-堆疊指標暫存器所指定之一堆疊中，而該次常之物旨標暫存括可改變一程式流程由次常式退回至程式内呼叫指令後面之指2 當一轉回指令被執行時，& 記憶體堆疊中爆出(pop) ’並被載入堆疊指標暫存器中。 [0005] 在包含呼叫/轉回堆疊之—微處理中，當呼叫齡被時’轉回位址係可被推至該呼叫/轉瞒疊上以令可繼續提取，而管線之後端階層接著將可利用該轉回位址來更新主記堆疊。相反地’當轉回指令執行時，轉回位址可自呼叫/轉回堆疊中^ 出(_)，以使指令可繼續提取而不需等待自該主記憶體堆疊所之轉回位址的冗長提取。

Client’s Docket No·: TT’s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 [0006] 呼叫/轉回堆疊之效能主要係根據處理器之可使呼叫/轉回堆疊與主記憶體維持-致之能力所決定。呼叫/轉回堆疊依據呼叫回指令所做的推測性更新會導致主記憶體與呼叫/轉回堆疊間的不二致發生。❿呼叫/轉回堆疊的更新之所以為推測性，乃是g為管線中吟 7 1282514 . ^轉回之别的指令引起一無效事件(例如產生一個異常)所導致的，舉例來說，其縣管線於引起異常之指令後進行所有的指令清洗 (flush) ’其中引起異常之指令係包括被推測性執行之呼叫/轉回指 =。同樣地，在呼叫/轉回指令之前所執行之一分支指令有可能會被錯誤預測(nuspredicted) ’而將要求管線清洗被推測性執行之呼叫/轉回指令。由於呼叫/轉回堆疊係已依據呼叫/轉回指令而被推測性地更新’但主記憶體堆疊在呼叫/轉回指令不再為推測性之前並不會被更，’因此呼叫/轉回堆疊之内容與主記憶體之内容將造成不一致的現象0

[0007]此處可參考美國專利案號6 314 514「瓶獅励 APPARATUS FOR CORRECTING AN INTERNAL CALL/RETTJRN STACK IN A MICROPROCESSOR THAT SPECILATIVELY EXECUTES CALL AND RETIM INSTRU_S」’其係描述在無論是否有推測性呼叫/轉回指令^行的情況下，用來維持-呼叫/轉回堆疊與主記憶體一致之震置及方法。然而在此專利令所描述之裝置，僅可用於其管線測重Ρ白層來執仃與偵測分支指令錯誤預測的微處理器中。 [_]因此，提供用於更正—微處理財之内受之方法與裝置，且該微處理器係可自多，獅恢 _在 [0009]為達上述之目的，本發明之一較佳實施例遂提供一分離 =置’此分赋更正裝置可保存更正資訊以提：呼叫/轉回位置而位於不同程式段上的一推雕呼叫/轉回指令，= 可於偵測到無效事件時啟動翻別/轉回齡所屬階層之選擇正，其中該無效事件係相_於偵測到該無效事件之階層。本發明之一

Client’s Docket No.: TT^sDocketNo:0608.A40743-TW/DraftFl/#^^/2〇〇6/11/14 1282514 目的係提供-糊來更正位於管線化微處理器中之一啤叫/轉回 Ϊ裝置係包括一第一堆疊’其係具有複數個項目以二儲存更正#訊，其帽更正資訊乃侧於微處_管線巾之第個階層内的呼叫或轉回指令。該褒置還包括有一第二堆疊至=第了堆疊並具有第4幽目項目以用於儲存更正資訊，其中該更正資訊係、侧於微歧II管線巾之第二複細崎内的呼叫或轉^指令。此外，該裝妓包括一控制邏輯，其係雛至第一與第二堆疊。曰該控制邏财絲接收-控備號峨示-呼叫或細齡自第二數娜皆層傳遞至第二複數個階層。且該控制邏輯可將相關於呼叫回指令之更正資訊自第一堆疊中搬移至第二堆疊。 ” [0010]本發明之又-目的係提供一管線化之微處理器。此微處理器乃包括-呼叫/轉瞒疊(CRS)。且其亦包括第一與第二管線階層，分別於第-及第二信號上產生一真值，以分別對應於^第 -與第二管、鎌層巾之-分支指令的錯顯測檢測結果，而其中該第一P皆層在管線中係位於該第二階層上方。此外，該微處理哭^ 裝置，其係输以接收第-及第二信號。該裝置翻於相；^ 於該第-P皆層之管線階層内的呼叫或轉回指令之第一資訊，以及用於 2持，關於介於該第-與第二階層中間之管線階層内的呼叫或轉回指令=第二資訊，其巾若該第—信麟域值時，雜置係可利用該第 -，訊以選擇性敝正CRS，而總第二信號為真值時，該裝置可利用該第一與第二資訊以選擇性地更正CRS。 [0011]本發明之另一目的係提供一種用於使一管線化微處理器中之一呼叫/轉回堆疊(CRS)和與其輕接之一記憶體維持一致的方法°。該方法係包括接收請求以回應一呼叫或轉回指令來更新CRS。該方法亦包括回應刖述之接收步驟，將更正資訊儲存至一第一緩衝器内。於儲存元之後，該方法還包括有一步驟，其係檢測該呼叫或轉回指令其中之

Client’s Docket No.: TT’s Docket N〇:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 1282514 第—階層以用來檢測-無效事件。〇 / 0有—步驟，其係回 ^ 之一部份自該第一緩衝器_至-第二緩衝器，驟謂更正纽腦資：^本目的係提供"具體實施於-傳輸媒體内之電，貝’其她她_程式如提供__用於更正】 :：更二資訊係有關微處理器管線之第::==:::: ^ ^式碼亦包括第二程式碼以用於提供一第二堆叠，= =接至^ -堆疊，該第二程柄更包括有料謝_儲存更正微處理器管線之第4 的呼叫或轉回指令。此外，該程式包制邏輯，其係耦接至該第-及第二堆疊，該第中械細齡正自該第—複數嶋傳^該苐4數鐵層，其t該湖邏__該_健靖無呼叫或轉回指令棚之該控制邏輯自該第—堆疊移至該第二堆疊。 [0013] 本發日月之好處是可使無效事件(例如分支指令錯誤删或異常)於微處理器管線之多重階層巾被檢測絲，且仍可讓—呼叫增回堆疊與主纖體轉-雜。本拥可在管制前餅檢測出分支指令錯誤預測而非只能在管線的底部，其係因為可使更正錯誤預測與提取正確指令的動作比只能在管線底部檢測出錯誤預測時快，而可以減少管線氣泡發生。 [0014] 本發明之其他特徵、利益及優點，在參閱本說明書的其餘部分和圖示後，將可更加清楚。【實施方式】 [0018]請參考圖一，其係為本發明之一管線化微處理器1〇〇的方塊

Client’s Docket No·: TT，s Docket No:0608-A40743-TW/DraftFl/林碌輝/2006/11/14 1282514 * ^ ^

* ； I ----- ·“=，·一—……—卜，示意圖。在一較佳實施例中，微處理器100如圖一所示係包括了 12個階層。 [0019]微處理器100包括有一IP皆層102(或稱指令提取階層1〇2)。I 階層102係可提供一提取位址給一指令快取記憶體以提取指令供微處理器100執行。若該提取位址在指令快取記憶體中未命中，則IP皆層102 將自一主記憶體中提取未命中快取線(missing cache line)，其中該主記憶體係耦接至微處理器100。在一較佳實施例中，I階層1〇2包括有一分支目標位址快取記憶體，藉由指令快取記憶體提取位址，此一分支目標位址快取係可沿著I階層102内部之一指令快取記憶體而被加以存取。此外，該分支目標位址快取記憶體係可儲存之前被執行過之分支指令的目標位址，以及儲存有關分支指令之預測資訊，無論分支指令是否會被提取。分支目標位址快取記憶體可根據該指令快取記憶體取位指以產生一結果預測與一分支指令的目標位址。分支指令係為微處理器之習知技術中廣為人知的技術，其係包括可改變程式流程之指令。特別是，分支指令可改變一指令指標緩衝器或程式計數緩衝器之值(例如圖二中之指令指標(IP)暫存器214)，而其中該指令指標緩衝器或程式計數緩衝器係可紀錄下一個將被執行之指令的記憶體位址。在一較佳實施例中IP皆層102係包括有多重階層。 [0020 ]微處理器1 〇〇亦包括有一Fp皆層1 〇4(或稱指令格式階層 104) ’其係耦接至ip皆層1〇2。fp皆層1〇4包括有指令解碼與格式化邏輯以用來將指令解碼與格式化。在一較佳實施例中，微處理器薦係為一 x86處理器，其係可容許各式不同長度之指令於其指令集中。F階層1〇4 可自指令快取記憶體中接收一指令位元流，並依照每個指令之長度來剖析該指令位元流以成為位元組之分離群組，其中該分離群組係可組成一x86指令。特別是，F階層104之解碼邏輯可將呼叫及轉回指令解碼，並回應一已解碼之呼叫/轉回指令以更新如圖二所示之微器中

Client’s Docket No.: TT’s Docket N〇:0608-A40743-TW/DraftFl/林璟輝/2006/11/14

1282514皆1各修正替換頁I 的一呼叫/轉回堆疊(CRS)206。呼叫/轉回堆疊(crs)2〇6與F卩皆層1〇4將配合圖二於後面内容詳細說明之。 [0021] 微處理器1〇〇還包括有一X卩皆層ι〇6(或稱轉譯階層⑽），其係柄接至FP皆層104。此Xp皆層1〇6包括一指令轉譯器，可將χ86之巨集指令轉譯為微指令，而此微指令係由管線剩下之階層來執行。 [0022] 微處理器1 〇〇還包括有一r階層1 〇8(或稱暫存器階層1 〇8)，其係耦接至ΧΡ皆層106 〇此RP皆層1〇8除了包括其他非使用者可視暫存器 (non-user-visible register)外，還包括一使用者可視暫存集 (user-visible register set)。用於轉譯後之微指令的指令運算元係儲存於R階層108暫存器中，以供管線1〇〇後繼之階層執行該微指令之用。 [0023] 微處理器1〇〇還包括有一a階層112(或稱位址階層η?)，其係耦接至RP皆層108。此AP皆層112包括位址產生邏輯，其可自Rp皆層1〇8 接收運算元與微指令’並產生微指令所需要之位址，例如用於載入/儲存微指令之記憶體位址。特別是Ap皆層112還可計算出分支指令目標位址。 [0024] 微處理器1〇〇還包括有一jp皆層114，其係麵接至Ap皆層η〗，此JP皆層114可接收由AP皆層112計算得出之分支指令目標位址。^可偵測出分支指令錯誤預測。也就是說，JP皆層μ可偵測出由一較前面之管線100P皆層因？一分支指令所做出之預測為錯誤預測，而此處所謂的錯為預測即為由A階層112計算得出之目標位址與先前所預測的目標位址不匹配。JP皆層114將配合圖二於後面内容詳細說明之。 [0025] 微處理器100還包括有一DP皆層116(或稱資料階層116)，其係搞接至J卩皆層114。此一D階層116係包括用於存取由a階層112產生之位址所載明之資料的邏輯單元。D卩皆層116可自主記憶體中將資料載入微處理器100中。特別是D階層116可回應一轉回指令以自主記憶體堆疊

Client’s Docket No.: TT’s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 12 I28251fW^g^ ' 中載入轉回位址。由主記憶體堆疊所載入之轉回位址係用來與之前?回應一轉回指令而自呼叫/轉回堆疊(CRS)206所發生之轉回位址相比較，以檢測呼叫/轉回堆疊206是否具有正確的值。若呼叫/轉回堆疊2〇6 之轉回位址與主記憶體堆疊之轉回位址不匹配，則管線1〇〇將進行清洗 (flush)並利用主記憶體堆疊之轉回位址重新啟動。邮皆層還包括有一資料快取記憶體，其係可自主記憶體中快取微處理器1〇〇中之資料。在一較佳實施例中，該資料快取記憶體係為一三循環之快取記憶體。G P皆層118乃耦接至DP皆層116，其係作為資料快取記憶體項目之第二階層。而取皆層122乃耦接至GP皆層118，以作為資料快取記憶體項目之第三階層。 [0026] 微處理器100還包括一E階層124(或稱執行階層124)，其係耦接至HP皆層122。此EP皆層124具有執行邏輯(例如算數邏輯單元)以執行微指令’其中該些微指令乃是基於之前階層所提供的資料與運算元。特別是，EP皆層124還可產生所有分支指令之一分解目標位址與執行結果。亦即EP皆層124之目標位址係已知為正確之所有分支指令的目才示位址，而所有的預測目標位址必須與其相匹配。再者，E階層124可產生一用於所有分支指令的分解結果，無論該分支是否被提取。 [0027] 微處理器1〇〇還包括一汾皆層丨26(或稱儲存階層126)，其係耦接至EP皆層124。SP皆層126可將自E階層124接收之微指令執行的結果存入主記憶中。此外，EP皆層124計算得出之分支指令的目標位址與執行結果係提供給SP皆層126。再者，ΐρ_〇2之分支目標位址快取記憶體係可利用一分支指令的目標位址和執行結果而由别皆層126加以更新。S階層126可价測出由-較早之管線1〇崎層所作的預測是否為錯誤預測。此外，SP皆層126還可檢測出是否有異常(excepti〇n)發生。此處所明之異常係包括於正常程式執行時所發生之一個改變。異常發生的原因可能為硬體抑或是軟體事件所造成的，其包括有硬體中斷、軟體

Client’s Docket No·: TT’s Docket No..0608-A40743-TW/DraftFl/林璟輝/2〇〇6/11/14 1282514 中斷、非可罩幕中斷、指令追蹤執行、斷點、算數上溢或下溢、尋頁缺失、偏差之記憶體項目、記憶體保護違反、未定義指令、硬體故障、電源失效、被零除、段界錯誤、浮點錯誤、損壞描述符、元件(例如共處理器）失效。S階層126將配合圖二於後面内容詳細說明之。 ’、 [0028] 微處理器1〇〇還包括一卿皆層128(或稱回寫階層128)，其係李馬接至SP皆層126。此一WP皆層128係可將⑽皆層126所得之結果回階層108之暫存器以更新微處理器1〇〇之狀態。 [0029] 如圖一所示，微處理器1〇〇所包括之階層係超過一個，其可檢測出各種無效事件，例如分支預測錯誤或指令異常等，其將會要求微處理器100依據呼叫/轉回指令所作之推測性執行以更正對呼叫/轉回堆@(CRS)206所做的更新。這與習知技術之微處理器是有很大差異的，習知之微處理器係僅能自管線内之一階層中檢測出無效事件，二剷面所提及之美國專利案。因此若一無效事件於皆層丨14被檢測出時，本發明圖二中所描述之更正裝置將為J階層114(含)以上之呼叫/轉回指令而更正CRS 206。反之，若一無效事件於sp皆層126被檢測出時，本發明圖一中所描述之更正裝置將為别皆層126(含)以上之呼叫/轉回指令而更正CRS 206。 [0030] 請參考圖二，其係為本發明圖一中之微處理器1〇〇包括一呼叫/轉回堆疊更正裝置的方塊示意圖。圖二包括有圖一中管線階層至128之部分。此外如圖二所示，微處理器1〇〇係包括有控制邏輯2〇2、輕接至控制邏輯202之一雙端輸入多工器2〇4、搞接至多工器2〇4之一呼叫/轉回堆疊(CRS)206、耦接至CRS 206之一轉回位址更正堆疊(return address correction Stack，RACS)208、耦接至RACS 208之一三端輸入多工器212、耦接至多工器212之一指令指標暫存器214 '耦接至控制邏輯202之一高階更正命令堆疊(HCCs)216、耦接至HCCS 216之一六端輸入多工器222以及耦接至多工器222之一低階更正命令堆疊(LCCS)。

Client’s Docket No.: TT，s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 1282514 - / . t [0031] 當-呼叫指令被_時，F階層1〇4可於一呼叫信號232上產生一真值以提供給控制邏輯202。於一較佳實施例中，一呼叫指令係包括-x86算數邏輯CALL指令。控制邏輯2〇2可回應該呼叫信號232以推測性地更新呼叫/轉回堆疊(CRS)206，其詳細狀況將於後面說明之。此外’ FP皆層104係可提供次常式之位址給控制邏輯2〇2，其乃是由在一 subroutine一addr信號236上之呼叫指令所紀錄。再者:階層1〇4亦可提供在return一addr信號238上之呼叫指令所紀錄之轉回位址給控制邏輯202。最後’當-轉回指令被解馬時，F階層1〇4還可產生一轉回信號234以提供給控制邏輯202。於一較佳實施例中，一轉回指令係包括 -x86算數邏輯RET指令。控制邏輯2〇2可回應該轉回信號234而推測性地更新呼叫/轉回堆疊(CRS)206，其將於後面詳細說明之。 [0032] 當一呼叫或轉回指令到達j階層114時，j階層114係可於一 J—cal Ι/ret信號244上產生真值，以提供給控制邏輯2〇2。於一較佳實施例中，FP皆層104係產生一狀態位元來指示一指令為呼叫或是轉回指令’而該狀恶位元乃隨著該指令以提供給管線。若該狀態位元為真時， JP皆層即於一 J—call/ret信號244上產生真值。 [0033] 當JP皆層114發生暫停狀況時，其可於j—si：alled信號2犯上產生一真值給控制邏輯202 ;否則JP皆層114係於J_stalled信號242上產生一偽值。J—stalled信號242為真值時，係表示正存在於】卩皆層〖Μ上之指令在下一個時脈週期内將不會前進至下一個階層（即邮皆層丨丨6)。而當J—stalled信號242為偽值時，其係表示正存在於j階層114上之指令將會在下一個時脈週期内前進至下一個p皆層。 [0034] 若一分支指令到達jp皆層ι14且墙層檢測出分支指令為錯誤預測時，JP皆層114將於Jjnispredict信號246中產生真值，此時將會要求所有JP皆層以上的階層進行清洗(f lush)以使微處理器1 〇〇分支到正確的分支指令目標，亦即分支到該分支指令之後的指令(若該分支係

Client5s Docket No.: TT’s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 15 為錯誤預測）’或分支到正確的分支指令的目標位址(若該分支為正癌予，則但預測的位址有誤時）。為使分支可在J階層114被分解，J階層114 還可計算分支指令之正確目標並於一 J 一correct_addr信號291上提供正確位址給控制邏輯202。此外，包含j階層114及其以上之階層在此係疋義為官線100中的上層或高階階層，而奸皆層以下之階層則稱為低層或低<階階層。 [0035] 當一呼叫或轉回指令到達s階層126時，汾皆層⑽係可於一 S—call/ret信號上產生真值以提供給控制邏輯2〇2。在一較佳實施例中’ FP皆層所產生之狀態位元若顯示該指令係為呼叫/轉回指令，亦即為真值時，SP皆層126遂可於S_call/ret信號252上產生真值。 [0036] 而若一分支指令到達s階層126且S階層126檢測出該分支指令係於之前被錯誤預測時，汾皆層126將於一Sjnispredict信號254上產生一真值，如此一來Sp皆層126(含)以上之階層將會進行清洗並使得微處理器100得以分支至分支指令的正確目標。邡皆層丨26也可提供正確的分支指令目標，以於一S—correct—addr信號293上控制邏輯202。 [0037] 若一指令到達s階層126，且SP皆層126檢測到該指令係發生一異常時，SP皆層126將會於一S_exception信號256上產生一真值。此時SP皆層126(含)以上之所有階層將會被要求清洗以使得微處理器j 〇〇可分支至一異常處理程序。於一較佳實施例中，被JP皆層丨14或sp皆層i26 偵測到為錯誤預測之一分支指令，或一指令於SP皆層126所產生之一異常狀態，係為一呼叫/轉回指令。 [0038 ]多工器204之一輸入端係可接收由控制邏輯202所產生之一 new-return一addr信號262 〇當FP皆層104於一呼叫信號232上產生一真值時，控制邏輯202可將自F階層104所接收並經過return_addr信號238的轉回位址，經由new_retuiTLaddr信號262遞送至多功器204。多工器204 之第二個輸入端係可自轉回位址更正堆疊(RACS)208處接收一

Client’s Docket No.: TT’s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14

12825φ RACS—ret—addr信號258 〇 RACS—ret—addr信號258之數值係為RACS 208 頂端項目的轉回位址，其内容將於後面詳述之。多工器2〇4之輸出乃作為呼叫/轉回堆疊(CRS)206之輸入。控制邏輯202可產生一 CRSjnmSel 信號264以控制多工器204。當F階層104經由呼叫信號232說明一呼叫指令之存在以利用呼叫指令轉回位址來推測性地更新CRS 2〇6時，控制邏輯202於CRS—mux一sel信號264上可產生一個值，以使多工器204選擇 new—return—addr信號262，其狀況將於後詳細描述。控制信號2〇2於 CRS—muX-Sel信號264上產生一個值，而使得多工器2〇4可回應一無效之事件，例如由 J—mispredict信號246、S—mispredict信號254或 S—except ion信號256等所指示之無效事件來選擇RACS—ret—addr信號 258以更正CRS 206之先前的錯誤推測性更新。 [0039] CRS 206包括一儲存元件(或項目）之陣列，以用於儲存呼叫指令轉回位址。在一較佳實施例中，CRS 2〇6包括十六個項目以儲存十八個轉回位址’為求間化圖示’圖二中僅以三個項目表示之。該些[防 206之項目係排列為一堆疊型態。控制邏輯2〇2可於一push_CRS信號_ 上產生一真值以自多工器2〇4處將一轉回位址推進至crs 206。當控制邏輯202推進一轉回位址至crs 206時，現行於CRS 206之轉回位址將被往下推進一個項目（底部的項目將會被推出去），而由多工器204所提供之轉回位址將被載入CRS 206之頂端項目。控制邏輯2〇2還可於一 pop一CRS信號268上產生一真值，其係可爆出（卿)一轉回位址以離開呼叫/轉回堆疊(CRS)206。而當控制邏輯202爆出一轉回位址而離開CRS 206時，現行於CRS 206之頂端項目的轉回位址將被迅速導離並被提供給一CRS—ret—addr信號292，而位於其他項目之轉回位址將全部被移動一個項目。其詳細之操作情形將於後面說明之。 [0040] 轉回位址更正堆疊(racS)208包括有一儲存元件(或項目）之陣列用以儲存呼叫指令轉回位址。在一較佳實施例中，腫8 208包

Client’s Docket No·: TT’s Docket No:0608-A40743-TW/DraflF 1/林璟輝/2006/11/14 17 128251巴正替換頁 · ·1···Ι II tmmmmn ..............— ，二個項目以儲存三個轉回位址。而MCS 2〇8之項目係被排列為一堆豐型態。控制邏輯202可於一push—RACS信號272上產生一真值以自 CRS—ret—adcH鐵292推進一轉回位址至raCS 208。而當控制邏輯2〇2 推進一轉回位址至RACS 208時，現行於RACS 208之轉回位址將被往下推進-個項目（底部的項目將會被推出去），而提供體s—ret_addr信唬292之轉回位址將可被載^cs 2〇8之頂端項目中。控制邏輯2〇2還可於一pop-RACS信號274上產生一真值，其係可爆出(p〇p)一轉回位址以離開RACS 208。而當控綱輯2〇2爆出一轉回位址而離_(^ 2〇8 時，現行於RACS 208之頂端項目的轉回位址將被迅速導離並被提供給一RACS—ret一addr信號258 ’而位於其他項目之轉回位址將全部被移動春一個項目。其詳細之操作情形將於後面說明之。 [0041]多工器212之一輸入端係可接收由控制邏輯2〇2所產生之一 new—subroutine—addr信號276 〇當FP皆層104於一呼叫信號232上產生一，值時，控制邏輯202可將自FP皆層104所接收並經過sub^utine_addr 信號236的轉回位址，經由new— subroutine —addr信號276遞送至多功器212。多工器212之第二個輸入端係可自CRS 2〇6處接收一 CRS一ret—addr信號292。而多工器212之第三個輸入端係可自控制邏輯 202接收一invalidating^event一addr信號295。此外，多工器212之輸出乃作為指標指令暫存器214之輸入。控制邏輯2〇2可於ip」oad信號 ® 282上產生-真值，其係可使得多卫||212之輸出被載人指標指令暫^ 器214中。當FP皆層104經由呼叫信號232說明一呼叫指令之存在以使得微處理器100分支至呼叫指令次常式位址時，如下面配合圖三所述之^ 況’控制邏輯202可於IP—mux一sel信號278上產生一真值以使得多工器月 212選擇new— subroutine 一addr信號276 〇此外當FP皆層1〇4經由轉回传號234說明一轉回指令之存在，使得微處理器1〇〇分支至先前 : 206之轉回位址以回應一先前被執行之呼叫指令時，如下面配合圖^所

Client’s Docket No.: TT’s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 18 1282514 述之情況，控制邏輯202可於IP—mux-sei信號278上產生一真值以使多工器212選擇CRS— ret 一addr信號292。當一無效事件發生時，例如一分支錯誤預測或指令異常等，控制邏輯2〇2可於IPjnux—sel信號278上產生一個值，以使多工器212選擇invalidating__event—addr 295，而非在CRS 2(½被更正之後才產生，如後述關於圖六及圖七。的是，若於Jp皆層114檢測到之無效事件為一分支指令錯誤預測，控制邏輯202可將J—correct_addr信號291遞送至 invalidating__event—addr信號295 ;若於SP皆層126檢測到之無效事件為一分支指令錯誤預測，控制邏輯2〇2可將S—correct—addr信號293遞送至invalidating』vent一addr信號295 ;而若於SP皆層126檢測到之無效事件為一指令異常，控制邏輯2〇2可將微處理器1〇〇之一微碼記憶體内的一被碼異常處理器常式位址遞送至inval idat ing_event_addr信號295 ’其中該微碼異常處理器常式係用於處理特殊的異常事件。 [0042]高階更正命令堆疊(HCCS)216係包括一儲存元件(或項目）之陣列以用於儲存更正CRS 206之命令。於一較佳實施例中，jjccs 216 包括六個項目以儲存六個命令。而該些項目係排列為堆疊形式。Hccs 216之頂端項目的内容係提供於一t〇p一hccs__cmd信號297上，而該 top_hccs—cmd信號297係被提供給控制邏輯2〇2。控制邏輯202可於一 push—HCCS信號284上產生一真值，以推進一提供於cmd信號248上作為 HCCS 216之輸入端的一命令至HCCS 216。當控制邏輯202推進一命令之 HCCS 行;miCCS 216之命令會被往下推進一個項目（底部的項目將會被推出去），而被提供至cmd信號248上之命令則將被載入HCCS 216之頂端項目。控制邏輯202還可於一pop—HCCS信號286上產生一真值，其係可爆出一命令以離開HCCS 216。而當控制邏輯202爆出一命令而離開HCCS 216時，頂端項目内之命令將被去除，而位於其他項目的命令則會往上移動一個項目。HCCS 216可儲存用來更正CRS 206之命

Client5s Docket No.: TT’s Docket No:0608-A40743-TW/DraflFl/林璟輝/2006/11/14 19 1282514 Λ 令，其係與管線100内JP皆層114(含)以上之階層的現行呼叫/轉回指令相關。相對地，LCCS224所儲存用來更正CRS206之命令，係與管線1〇〇内JP皆層114(含)以下之階層的現行呼叫/轉回指令相關。HCCS 216與 LCCS 224的操作狀況將於後面詳細描述之。 [0043] 控制邏輯202在HCCS 216中儲存有兩個命令，第一個為 POP-to-correct命令，第二個為PUSH-to-correct命令。 POP-to-correct命令可指示更正裝置爆出一轉回位址離開crs 206以更正一被推測性執行過且正要自管線1〇〇處被清洗之呼叫指令。 PUSH-to-correct命令則可在自RACS 208爆出該轉回位址後，指示更正裝置推進一轉回位址至CRS 206上，以更正一被推測性執行過且正要自管線100處被清洗之呼叫指令。 [0044] 微處理器1 〇〇還包括有儲存元件以儲存與HCCS 216之每個項目相關之有效位元218。有效位元218亦依細CCS 216而排列為一堆疊形式。若有效位元218為真值，其表示相對應於HCCS 216之項目的命令係為有效，否則即為無效。控制邏輯2〇2經由vaiid—bitsJICCS信號288 可讀取與寫入有效位元218。特別的是，當控制邏輯2〇2推進一命令於 HCCS 216時，有效位元218將往下移動且將載入一真值於有效位元218 頂端。其主要是因為一有效命令係往下推進至一相對應2HCCS 216項目’所以該項目遂為有效。相反地，當控制邏輯2〇2爆出一命令離開hccS 216時，有效位元218將會往上移動且將載入一偽值至有效位元218底部。有效位元218初始化係為一偽值。此外，有效位元218可經由無效化)底部有效項目，如後所述。 [0045] 多工器222利用其六個輸入端可分別接收jjCCS 216六個項目内之六個命令。而多工器222之輸出端係作為低階更正命令堆疊 (LCCS)224之輸入。當jp皆層丨14於j—cai1/ret信號244產生一真值以及

Client’s Docket No.: TT，s Docket N〇:0608-A40743-TW/DraftFl/林璟輝/2〇06/11/14 1282514 於J一stalled信號242產生一偽值，以說明一呼叫/轉回指令正在穿越j 階層114時，控制邏輯202可產生一xfer一cmdjnux一sel信號228以使多工器222選擇六個輸入端之一的輸入端提供給LCCS 224，其係可轉移HCCS 216底部之有效命令至LCCS 224，如後所述。 [0046] LCCS 224包括一儲存元件(或項目）之陣列以儲存命令來更正CRS 206。在一較佳實施例中，LCCS 224包括四個項目以儲存四個命令。LCCS 224之項目係排列為一堆疊型態。LCCS 224之頂端項目的内容係提供於一top」ccs—cmd信號299上，而該top_lccs_cmd信號299係提供給控制邏輯202。控制邏輯202可於一push—LCCS信號294上產生一真值，以推進一自多工器222所提供而作為LCCS 224之輸入端的一命令至LCCS 224。當控制邏輯202推進一命令之LCCS 2224時，現行於LCCS 224 之命令會被往下推進一個項目（底部的項目將會被推出去），而自多工器222所提供之命令則將被載入LCCS 224之頂端項目。控制邏輯202還可於一pop-LCCS信號296上產生一真值，其係可爆出一命令以離開LCCS 224。而當控制邏輯202爆出一命令而離開LCCS 224時，頂端項目内之命令將被去除，而位於其他項目的命令則會往上移動一個項目。LCCS 224可儲存用來更正CRS 206之命令，其係與管線1〇〇内jp皆層ιΐ4(含)以下之階層的現行呼叫/轉回指令相關。相對地，HCCS 216所儲存用來更正CRS 206之命令’係與管線1〇〇内jp皆層ιΐ4(含)以上之階層的現行呼叫/轉回指令相關。HCCS 216與LCCS 224的操作狀況將於後面詳細描述之。儲存於LCCS 224之命令係與上面所述相關於HCCS 216之該兩個命令相同。 [0047] 微處理器1 〇〇還包括有儲存元件以儲存與LCCS 224之每個項目相關之有效位元(valid bits)226。控制邏輯202經由 valid一bits—LCCS信號298可讀取與寫入有效位元226。而有效位元226 之操作情形係與上述之有效位元218的情況類似。

Client’s Docket No.: TT’s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 21 戰 1282514 罟^〇!fir參考圖三’其係為本發明圖二中之呼叫/轉回堆疊更正裝 p==f _ °制細三所利_„細齡如圖^ 2 ’微處理謂G之操作情況。其流程始於柳02。们丨^ t方塊302中’ _104檢測出一呼叫/轉回指令係存在並預測該呼叫/轉回指令係被提取；接著F階層依據呼叫或轉回指令之存在與否’分別於呼叫信號232或轉回信號234上產生一呼叫指令，F_G4射產対他料^sub__dd;2= return—addr 238 〇之後流程進入到判斷方塊3〇4 〇 [0050] 在判斷方塊3G钟’控制邏輯係檢驗呼叫信號232與轉回信號234以決定其為呼叫指令亦或是轉回指令。若為呼叫指令，流程進入方塊306 ;若為一轉回指令，流程進入方塊314。 [0051] 在方塊306中，控制邏輯202將时_』此238遞送至 new一return—addr 262，其係可於push-CRS信號266上產生一真值並於 CRSjux—sel信號264上產生真值以選擇—ret_—脱來推進至 CRS 206，如此一來遂可回應於判斷方塊3〇4處所判斷出之呼叫指令而推測性地更新CRS 206。接著流程進入方塊3〇8。 [0052] 在方塊308中，控制邏輯2〇2於cmd信號248上產生一 to - correct命令並於即油―HCCS信號上產生一真值以推進該命令至 HCCS 216。因此，如配合圖二之前述内容，該有效位元218係用來作為最新被推進之命令。接著流程進入方塊312。 [0053] 在方塊312中，控制邏輯202可於IP一l〇ad信號282上產生一真值並於IP—mux一sel信號278上產生真值，其係可始多工器212選擇 new一subroutine—addr 276，進而使得微處理器1〇〇分支至呼叫指令次常式位址。此流程終止於方塊312。 [0054] 在方塊314中，控制邏輯202可於pop一CRS信號268上產生一真值，其係可爆出(pop)儲存於CRS 206之頂端項目内的轉回位址，以

Client’s Docket No·: TT’s Docket No:0608-A40743-TW/DraftFl/林環輝/2006/11/14 22

曰修(吏)正替換黃S 128251 回應於判斷方塊304處所判斷出之轉回指令而推測性地更新CRS 206，其中該轉回位址係提供給dret一addr信號292。接著流程進入方塊 316 〇 [0055] 在方塊316中，控制邏輯202於push一RACS信號272上產生一真值以將於方塊314中自CRS 206處所爆出之CRS—ret一addr信號292推進至RACS 208。接著流程進入方塊318 〇 [0056] 在方塊318中，控制邏輯202於cmd信號248上產生一 to - correct命令並於push—HCCS信號284上產生一真值以推進該命令至 HCCS 216。因此，如配合圖二之前述内容，該有效位元218係用來作為最新被推進之命令。接著流程進入方塊312。接著流程進入方塊322。籲 [0057] 在方塊322中，控制邏輯202可於IP一l〇ad信號282上產生一真值並於IP—mux—sel信號278上產生真值，其係可始多工器212選擇 new一subroutine一addr 276 ’進而使得微處理器1〇〇分支至轉回指令，該轉回指令係為方塊314中自CRS 206處所爆出。此流程終止於方塊322。 [0058] 請參考圖四，其係為本發明圖二中呼叫/轉回堆疊更正裝置的操作流私圖。特別是圖四所示係為當一呼叫/轉回指令到達圖一之j P皆層114時’微處理器1〇〇之操作情況。其流程始於方塊4〇2。 [0059] 在方塊402中’控制邏輯2〇2藉由檢測j—cau/ret信號244上翁之真值來確定-呼叫/轉回指令已到達j階層114，以及藉由檢測 · 】一318116队號242上之偽值來卻定】階層114並無暫停(伽11)。接菩、、古程進入方塊404。抓 [0060] 在方塊404中，控制邏輯2〇2可除去HCCS 216之底部有效項目内的命令。換言之，控制邏輯202可讀取有效位元218並清洗之以使底部有效位元218變為偽值，其中該底部有效位元218係具有一真值以使HCCS 216之底部有效命令變為無效，主要原因是該命令係被轉移至 LCCS 224。接著流程進入方塊406。

Client’s Docket No.: TT’s Docket No:0608-A40743-TW/DraflFl/林環輝/2006/11/14 23 I282,fM^7日修正替換頁 [0061] 在方塊406中’控制邏輯202可於pUSh—LCCS信號294上產生 -真值’以及於xfer—cmdjnuX-Sel信號228上產生一真值以自Hccs 216 之項目中選擇命令’其係可將該被去除之命令推進至LCCS没4，其中 HCCS 216之項目係於方塊4〇4中被去除。此一流程係終止於方塊4〇6。 [0062] 請參考圖五，其係為本發明圖二中呼叫/轉回堆疊更正裝置的操作流麵。翻是目五所示縣當—呼叫/轉回齡到達圖一之s

Pf層126時，亦即當一呼叫/轉回指令不再是推測性時，微處理器⑽之操作情況。其流程始於方塊5〇2。 [0063] 在方塊502中，控制邏輯2〇2藉由檢測心別/时信號脱上之-真值來確定-哞叫/轉回指令已到勤階層126。接著流程進入方塊籲 504 〇 [0064] 在方塊504中，控制邏輯2G2係將LCCS 224之底部有效項目内的命令去除。亦即控制邏輯讀取有效位元226並清洗之以使底部有效位tl226變為偽值’其中該底部有效位元2邪係具有—真值以使^⑽4 之底部有齡令_無效’主要賴是呼叫_齡不推雕；因此’若一無效事件發生，CRS 2〇6依照别皆層126内之呼叫/轉回指令將不被更新。此一流程係結束於方塊504。 [0065] 請參考圖六，其係為本發明圖二中呼叫 =乍流麵。特細六所示係為當—分支指令錯誤删於^置· 114中被檢測到時，微處理器100之操作情況。其流程始於方塊觀。，6]在方塊602中，控制邏輯2〇2藉由檢測j—如卿此信號娜 ’疋-膽層114係已檢驗出一分支指令錯誤預測。接著流程進入方塊604 〇 [0067]在判斷方塊604中，控制邏觸2係讀取細ccs 216頂端項目相關之有效位7G218以決定儲存於其巾之命令是否有效。若否’則流程前進至方塊642 ;否則流程前進至判斷方塊6〇6。

Clients Docket No.； XT’s Docket N〇:0608捕743_TW/Draftpi/林璟輝/2〇嶋 η# 1282514 [0068]在判斷柳Q6巾，控概獅舰Qp—h⑽ 檢驗HCCS 216頂端之命令以決定該命令之形式。若該命令係為- 命令’則流程前進至方塊612，若該命令為一 POP-to-correct命令，則流程前進至方塊6〇8 〇 [〇_在方塊608中，控制邏輯202於pop—CRS信號268上產生一真值以爆出轉回位址離開CRS 206，如此遂可更正依據jp皆層n4(含)以上某一階層中之一呼叫指令所造成之錯誤的推測性推進，其係將轉回位址推進至CRS 206。其中若於j階層114檢測到分支指令錯誤預測，】階層114(含)以上之階層將被清洗。接著流程前進至方塊614。 [0070]在方塊612中，控制邏輯202係於pop—RACS信號274上產生一真值以爆出頂端轉回位址離開船應，其中該頂端轉回位址係提供至RACS—ret—addr信號258 〇此外，控制邏輯2〇2係於push-CRS信號266 上產生一真值以將RACS—ret—addr信號258推進至CRS 206，如此遂可更正依據J階層114(含)以上某-卩㈣中之—轉回指令所造成之錯誤的推測性爆出，其係爆出轉回位址離開CRS 2〇6。其中若於】階層114檢測到分支指令錯誤鋼，J階層114(含)以上之階層將被清洗。接著流程前進至方塊614。 [0071] 在方塊614中，控制邏輯202係於pop—HCCS信號286上產生一真值以爆出頂端命令離開HCCS 216，因為此時根據推測性地被執行過之呼叫/轉回指令，CRS 206係已為正確的值。接著流程回到判斷方塊 604以判斷於HCCS 216中之另一有效命令是否存在。 [0072] 在方塊642中，微處理器1〇〇可更新係已導致分支錯誤預測發生之預測資訊。例如’若分支錯誤預測是由Ip皆層102之分支目標位址快取記憶體所做，且分支目標位址快取記憶體之錯誤預測項目係被無效化以便下次依據分支指令之提取位址可用於分支目標位址快取記憶體中，則該分支目標位址快取記憶體將產生一未命中(miss)，其係

Clients Docket No.: TT’s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 25 1282514 將2致預測分支指令不被提取錢得流程前進至下一個接續的指令而非刖進至該为支之目標指令。接著流程前進至方塊644。 [0073] 在方塊644中，微處理器薦係清洗存在於較上層管線階層之才曰令’亦即Jp皆層114(含)以上之p皆層。在—較佳實施例中，清洗指令之方法係包括設定一有效位元以使每個於其所對應到之管線階層的指令為偽值。接著流程前進至方塊646。曰 [0074] 在方塊646中，控制邏輯202係於IP一i〇ad信號282上產生一真值，並於IP—mux一sel信號278上產生一真值，其係可使多工器212選擇invalidating^event—addr信號295而讓微處理器1〇〇得以分支至正確的分支指令目標，其中該分支指令係由控制邏輯2〇2自 J—correct—addr信號291處遞送過來。此一流程遂終止於方塊646 〇 [0075] 睛參考圖七，其係為本發明圖二中呼叫/轉回堆疊更正裝置的操作流程圖。特別是圖七所示係為當一分支指令錯誤預測於s階層 126中被檢測到時，微處理器1〇〇之操作情況。其流程始於方塊7〇2。 [0076] 在方塊702中，控制邏輯202藉由檢測s—mispredict信號254 來確定一JP皆層114係已檢驗出一分支指令錯誤預測，或藉由檢驗 S—exception信號256來確定SP皆層126係以檢驗出一異常。接著流程進入方塊704 〇 [0077] 圖七中之方塊704至714係與圖六中之方塊6〇4到614的流程相似；因此不再重複敘述之。其唯一與圖六不同的是，當HCCS 216頂端之命令無效時，流程將由判斷方塊7〇4處前進至判斷方塊724。 [0078] 在判斷方塊724中，控制邏輯202係讀取與LCCS 224頂端項目相關之有效位元226以決定儲存於其中之命令是否有效。若結果為否，則流程前進至方塊742 ;否則流程前進至判斷方塊726。 [0079] 在判斷方塊726中，控制邏輯202經由top_lccs_cmd信號299 檢”驗LCCS 224頂端之命令以決定該命令之形式。若該命令係為一

Client?s Docket No.: TT’s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 26

ΡΙΗΗο-correct命令，則流程前進至方塊732，若該命令為一 POP-to-coirect命令，則流程前進至方塊728 〇、[_]在方塊728中，控制邏輯202於pop—CRS信號268上產生一真值以爆出轉回位址離職s 2〇6，如此遂可更正依據】階層ιΐ4(含)以下某P白層中之-呼叫指令所造成之錯誤的推測性推進，其係將轉回位址推進遞S 。其巾若於摊層126檢糊分支齡錯誤删，或於 sp_ 126檢測到異常發生時，JP㈣114(含⑽下之階層將被清洗。接著流程前進至方塊734。 [0081] 在方塊732中，控制邏輯2〇2係於pop一RACS信號274上產生一真值以爆出頂端轉回位址離開RACS膽，其中該頂端轉回位址係提供至RACS—ret_addr信號258 〇此外，控制邏輯2〇2係於push—CRS信號266 上產生一真值以將RACS—ret—addr信號258推進至CRS 206，如此遂可更正依據W層114(含)町某-階層巾之—轉回指令所造成之錯誤的推測性爆出’其係爆出轉回位址離開⑽206。其中若於Sp皆層126檢測到分支指令錯誤預測，或於Sp皆層126檢測到異常發生時，j階層114(含）以下之階層將被清洗。接著流程前進至方塊734。 [0082] 在方塊734中，控制邏輯202係於卿JLCCS信號296上產生一真值以爆出頂端命令離開LCCS 224，因為此時根據推測性_皮執行過之呼叫/轉回指令，CRS 206係已為正確的值。接著流程回到判斷方塊 734以判斷於LCCS 224中之另一有效命令是否存在。 [0083] 在方塊742中，微處理器1〇〇可更新係已導致分支錯誤預測發生之預測資訊。若圖七中之步驟係因為s階層丨26於方塊7〇2中檢測出一個異常而被執行，則方塊742中將不會有任何動作發生。接著流程前進至方塊744 〇 [0084] 在方塊744中，微處理器1〇〇係清洗現行於s階層126(含)以上之管線階層内的指令。

Client’s Docket No·: TT’s Docket No:0608-A40743-TW/DraflFl/林璟輝/2006/11/14 27 12825和擎V、修(#替涣頁丨 [0085]在方塊746中，控制邏輯202係於IP一load信號282上產生一真值，並於IP—mux—sel信號278上產生一真值，其係可使多工器212選擇mvalidating^event—addr信號295而讓微處理器1〇〇於一分支錯誤預測發生時，得以分支至正確的分支指令目標，其中該分支指令係由控制邏輯202 自 J—correct—addr 信號 291 或 S—correct—addr 信號293處遞送過來，或是讓微處理器1〇〇於一異常事件發生時，得以分支至微碼異常處理器常式(micro excepti〇n handler routine)以處理該異常情況。而此一流程遂終止於方塊746。

[0086]本發明的具體實施例已敘述如前，但本發明並未受限於此。，以上所述者，僅為本發明之較佳實施例，當不能以之限制本發明的細，其係為提供予熟習此項技術者使用或製造本發明之用。例如」雖然前面所提及之兩種事件(稱之為分支錯誤預測與異常)係需要 -微處理II來更if卜中彳/轉瞒撕_更新，其施據先前啤叫 /轉回指令所做之推測性執行，拇明當不只限定於此兩獅式之事件；確切的說，-微處理ϋ可使用呼叫/轉回堆疊更正裝置以回應麵態之事絲更正-呼叫/_堆疊。此外，賴本發财述^容係為x86架構微處理ϋ之哔叫和轉回指令，本發明還可使用包括呼叫盘轉回指令於其指令集内的任何微處理器。再者，雖然前述之實施例中、之，料更正堆疊中’堆疊的大小係可根據微處理器g線之各式程式段中的階層數目來決定。 [0087]本么明的具體實施例已敘述如前，但本發明並未受齡^ 此0唯以上所述者’僅為本發明之較佳實施例明的麵，為提供予_t棚赌伽或製造本發明了本發明巾使用硬_實施_卜，本料式

於用以儲存程式碼之電腦可用(如:可讀)媒介一Uter二J

Client’s Docket No·: TT，SD〇cketNo:_8_A407仏 TW/〇raftFl/林料/2隨心 28 12825

____________ J n^di:)上。此程式碼係可實現本發明所揭露之功能、構成或兩者之結 y舉例來說，其係可利㈣腦可讀矛呈式碼來完成之，而㈣腦可讀知式碼的形式則可為通用之程式語言(如c、C++、腿等等）、咖『格式或硬體描述語言(hardware description languages，_，如

Venlog HDL、佩、皿等等，亦可為習知技術中其他種資料庫、程式及/或電職存(circuit capture)工具等。而此程式碼亦可直接建於任何所知之麵可職介巾，其包括有半導體記舰、磁躺 (如CD·，__腦等），亦可喊於魏獅(如：可讀)傳輸媒介中 (如波或任何其他種包括數位、光學或類比基礎之媒介）。就其本身而言’此程式碼可於通訊網路，如：Inteme_ntranet中傳ς。本發明於前频提及之功能及/或結構係可於一内欲電腦碼之處理器中表現出來，也可雛為硬彡式絲魏—祕上之特定部^ 〇當然本發明更可以結合硬體與程式碼之形式來實施之。 > _8]最後，雜本發_為實縣發明之目_最佳模式熟習此項技術者應該了_岐，其在不脫離如後_ψ請專所定義之本發明的精神及細之下，其可立即使用所揭露的觀1 定的具體實_當作基礎’來進行與本發明之目__設計^修改其他結構。夕【圖式簡單說明】 [0015] 圖一係為本發明之一管線化微處理器的方塊示意圖。 [0016] 圖二係為本發明圖一中微處理器所包括一呼叫增回堆聂更正裝置的方塊示意圖。 i [0017] 圖三至圖七係為本發明圖二中之呼叫/轉回堆疊更正事置的操作流程圖。【主要元件符號說明】

Client’s Docket No.: TT’s Docket No.0608-A40743-TW/DraftFl/林璟輝/2006/11/14 29 1282514 100-德L處理器 104 - F階層 108_R階層 114-J階層 118-。階層 124-E階層 128 - W階層 204-雙端輸入多工器 208-轉回位址更正堆疊(RACS) 212-三端輸人多工器 216-高階更正命令堆疊(HCCS) 218-有效位元 224-低階更正命令堆疊(LCCS) 226_有效位元 232-呼叫信號 236-subrout ine_addr 信號 242-J_stal led 信號 246-J _mi spredi ct 信號 252-S_cal 1/ret 信號 256-S_except i on 信號 262-new_retum_addr 信號 102-1階層 106 - X階層 112-A階層 116-0階層 122-H階層 126 - S階層 202-控制邏輯 206-呼叫/轉回堆疊 214-指令指標暫存器 222-六端輸入多工器 228-xf er_cmd_mux_se 1 信號 234-轉回信號 238-retura_addr 信號 244-J_cal Ι/ret 信號 248-cmd 信號 254-S_mi spredi ct 信號 258- RACS—ret—addr 信號 264-CRSjnux_sel 信號

Client’s Docket No·: TT，s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 1282514 266-push_CRS 信號 268-pop_CRS 信號 272- push—RACS 信號 276-new_subrout i ne_addr 信號 278 - IPjnux_se 1 信號 274-pop_RACS 信號 282-IP_load信號 284- push_HCCS 信號 286-popJICCS 信號 288- valid_bits_HCCS 信號 291 - J_correct_addr 信號 292-CRS_ret_addr 信號 293-S_correct_addr 信號 294-push_LCCS 信號 295- inval idating_event_addr 信號 296- pop—LCCS 信號 297-top_hccs_cmd 信號 298_val id—bitS-LCCS 信號 299-top_lccs_cmd 信號 302-746呼叫/轉回堆疊更正裝置的操作流程

Client’s Docket No·: TT’s Docket No:0608-A40743-TW/DraflFl/林璟輝/2006/11/14

Claims

1282514 •一 _ 十、申請專利範固·· ㈣^ 一種用於更正一管線化微處理琴中之-政的4置，係包括·· β宁之—呼叫/轉回堆疊第堆邊’其包括有複數個裳 5 中複數個第一階; 有複2=目;==該f-堆疊，該第二堆疊包括一控制邏輯單元，其係輕接至該及邏輯單元係可接收用於指示一呼叫或轉时豐’該控制第-階層傳送至該複數個第二階層::自：複數個 ’該控制邏輯單元係可將相關二 == 該更正-貝訊由該第一堆疊搬移至第二堆聂。元將利範圍第1項所述之裝置且，其中該控制邏輯單 ==呼叫或轉回指令之該更正資訊由該第一堆疊搬 :第：方法’係包括該控制邏輯單元將該更正資訊白 2一堆豐中之該複數個第—項目之其中—條底部有效項目中去除’並將該被去除之更正資訊推進至該第二堆最。一 3.如申請專利範圍第2項所述之裝置，射該控且制邏輯單兀將該更正資訊自該第—堆#中之該複數個第—項目之其中一條底部有效項目中絲的方法，係包括使該複數個第二項目之其中一條底部有效項目無效。 4·如申請專利範圍第丨項所述之裝置，其中若該相關之呼叫或轉回指令係為一呼叫指令，則該更正資訊係包括一命令以爆出（pop)—轉回位址離開内部呼叫/轉回堆疊。 Client’s Docket No.: TT’s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 32 128251 '日修(¢)正替換_ 5·，申睛專利範圍第1項所述之裝置，其更包括：第一堆童，其係耦接至該控制邏輯單元，該第三堆疊包 ^有複數個第三項目以用於儲存相關於該複數個第一或第二管線階層中之呼叫指令的轉回位址。 6·如中请專利範圍第5項所述之裝置，其中若該相關之呼 Li轉回指令係為—轉回指令，職更正資訊包括有一命令以叫/轉=__三堆疊，並推_酿址至内部啤 7. 如申請專利範圍第1項所述之裝置，其位1數财效位元，其_接至該第一堆疊，該複數個有效凡係用於指明該複數個第一項目中相應之項目是否有效。 8. 如申請專利範圍第1項所述之裝置，其更包括： =個有效a，其_接至該第二堆疊，該複數個有效疋糸用於指明該複數個第二項目中相應之項目是否有效有扑請專利範圍第1項所述之裝置’其中該控制信號可心不該呼叫__令係已_該複數 ^虎了 -底端階層。 * 白層中之 10.如申請專利範圍第9項所述之裝置，1 ，示該複數個第-管線階層中之該底端階層係非暫^ k就可 Istal1) 〇 11·如申請專補㈣1G項所述可指示在射料轉回齡前面之—分支料=控制信號器檢測為錯誤預測。 11破Μ處理 12·如申請專利範圍第！項所述之裝置，其更包括： Clienfs Docket No.: TTs Docket No:0608_A40743_TW/DraftF1/林璟輝/2〇〇6/ι ι/ΐ4 33 12825141〒炉日修¥正替換頁I 卿 ==號，其係由該控制邏輯單元所接收，該第二控m用來扣不該複數個第回指令係被推測為錯誤地執行。甲之料4或轉信號二控制前面的一分支指令係被微呼叫或轉回指令 ΐ4·如申請專職_2項所述m巾不:存於，-複數個管線階層中之該呼叫或轉： _ 才曰中之一係被微處理器所預測錯誤。 15.如申請專利範圍第12項所述之裝置，其中該信號::由該複數個第一管線階層中之一底部階層所產生。工單元可nH專鄉㈣12項輯之裝置，料雜制邏輯早兀了回應該第二控制信號，利用儲個第一項目_更正資訊來更正呼叫/轉回堆疊。宜之該讀個第=如^_範㈣16項所述之裝置，其㈣於該複數堆属中爆效項目’該控觸輯單元係可自該第一第:項目中之一頂端的有效項目，並根據，、所儲存之該更正纽來更正該呼叫/轉回堆疊。 R如申請專利範圍第16項所述之装置，其更包括：純2三控制信號，其係由該控制邏輯單元所接收，該第三技制域可用來指示該複數個第一與該第二管線階層中之^一呼叫或轉回指令係被推測為錯誤地執行。〜如申/專利範圍第18項所述之襄置，其中該第三控制 W可W在該複數個第一與第二管線階層中之辦叫或轉 Client’s Docket No.·· TT s Docket N〇:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 34 1282514 ^ / 回指令前面的一分支指令係被微處理哭 20·如申請專利範圍第18項所述之穿置曰二則二一示在該複數個第-與第二管線階層回才"刚面的_指令會產生一微處理器異。^轉 21.如中請專利範圍第18項所述之裂置，：= - 0 7八中之一係被微處理器所錯誤預測。 22·如中請專利範圍第18項所述之裝置，信號=由該T個第二#_層中之—底部_所產生4制單元可回專利顧第18項所述H其巾該控制邏輯兮、姻2 控齡號，_儲存於該第—與第二堆最之 f數個與第二項目内的更正資訊來更正呼叫/轉回堆且 21如中請專纖圍第23項所述之個第一項目内之备侗古埒话θ，、甲關於該複數堆聶中爆二::制邏輯單元係可自該第-Γ第—項目中之—頂端的有效項目，並根據财更正該呼叫/轉回堆疊，此外關於該 1抢^項目内之每個有效項目’該控制邏輯單元係可自該第-隹豐中爆出該複數個第二項目中之—頂端的有效項目。 25.如申請專利範圍第丨項所述之裝置，其更包括：一第二信號，其係由該控制邏輯單元所接收，該第二信號可用來指示微處理器管線中該複數個第二階層内之該呼叫或轉回指令的射之-係不再是推測地，而其中該控㈣輯單元係根據該第二信號來更新該第二堆疊。 Client?s Docket No.: TT’s Docket N〇:0608-A40743-TW/DraftFl/林璟輝/2〇〇6/11/14 35 1282514 26.如申請專利範圍第25項所述單元根據該第二信絲更賴第控制邏輯數個第二項目之其中之且之方法係包括使該複資訊以用於指示該啤叫或轉回指^中更正第二二項目之—底部的方法，係包括使該複數個第 2一8·如申請專利制第丨項所述之打，其更包括：可要求呼係由該控制邏輯單元所接收，該第二信號或轉^據該複數㈣—管_層中之該呼叫 ^ J 斤’其中該控制邏輯單元係可依據該第二俨關於物或轉回指令其中之一的更正資訊存獨單mtf專利範圍第28項所述之裝置，其中該控制邏輯 7〇道以二信號，將相_該，叫或轉_令其中之 =正資訊存人該第—堆疊中的方法，係包括該控制邏輯單元將該更正資訊推進至該第一堆疊上。、 •種用於更正一管線化為處理器中之内部呼叫/ 堆疊之管線化微處理器，其包括有：一呼叫/轉回堆疊（CRS); 第-及第二管線階層，其係分別對第一及第二信號上產生 -真值，以分別對應於該第一與第二管線階層中之一分支指令的錯誤預職測結果，而其巾該第-階層在f線巾係位於該二階層上方； Client’s Docket No.: TT s Docket No:0608-A40743-TW/Draftpi/林碌輝/2006/11/14 36 1282514 ......... .一.... : ------------------------- 於维二該裝置係用令之第一眘1 、立 "之5線階層内的呼叫或轉回指 =虎係f真值時，該裝置係組態為可利二 -虚= 若該第二信號為真值時，該裝置可利用該第，、第一貝汛以選擇性地更正該CRS。，如申請專利範圍第30項所述之微處理器，更包括：轉回戒，其係由該裝置所接收，可用於指示該呼叫或轉叫令其中之—係已到達該第-階層；份轉可回應該第三信號’以將該第一資訊的一部 4^1—/訊’該部分係相關於該呼叫或轉回指令。 .如申味專魏圍細項所述之微處㈣， _ -第三信號，其係由該裝置所接收，該第匕· 示該呼叫或轉回指令其中之—係已到達該第二可用於指其中該裝置係可回應該第三信號，以將該第二t 伤自该第二資訊中去除，該部分係相關於已到達# = °凡之〜部該呼叫或轉回指令其中之一。 ~弟二階層之 33·如申請專利範圍第3〇項所述之微處理器，其一第三信號，其係由該裝置所接收，該第三信二更包括·· 示檢測出由該第二階層中之一指令所產生之一異可用於指 (exception)；其中若該第三信號係為真值，該裝置可利用讀資訊以更正該CRS。 Λ〜與第二 Client’s Docket No.: IT’s Docket No:0608-A40743-TW/DraftFl/林環輝/2006/11/14 37 128251作曰修(&正替換頁 34· -種用於更正-管線化微處理器中之内部呼叫/轉回堆疊（CRS)之方法，其係包括：内；接收凊求來更新CRS以回應一現存之呼叫或轉回指令· 回應前述之接收步驟，將更正資訊儲存至一第一衝器於儲存完之後，檢測該呼叫或轉回指令其中之一是否係已通過微處理器管線的-第-階層’其係組態為可檢測一無效件；以及回應前述之檢測步驟，將更正資訊之一部份自該第一緩衝器搬移至一第二緩衝器。、 35·如申請專利範圍第34項所述之方法，其中該無效事件係包括一分支指令錯誤預測。 36·如申請專利範圍第34項所述之方法，其更包括：若該第一階層檢測出該無效事件時，利用儲存於該第一緩衝器内之更正資訊以更正該CRS。人、 37·如申清專利乾圍第34項所述之方法，其更包括· 若微處理器管線中之一第二階層檢測到一第二無效事件時，利用儲存於該第一與第二緩衝器内的更正資訊:更正該 CRs，其中該第二階層係在第一階層下方。 38·如申請專利範圍第37項所述之方法，其中該第二無效事件係包括一分支指令錯誤預測。 39·如申請專利範圍第37項所述之方法，其中該第二無效事件係包括一異常（exception)。 40· —種紀錄執行更正一微處理器中之内部呼叫/轉回堆 Client’s Docket No.: TT，s Docket No:0608-A40743-TW/DraflFl/林璟輝/2006/11/14 12825 ιβψτΕ 日修(fii£替換頁足的電腦指令之電腦可讀取媒體，其係包括：一狄電腦可讀（computer—readable)程式碼以提供一用於更正包ς線化微處理器内之—糾/轉回堆#的裝置，該程式碼係個用於儲C:於提供一第一堆疊’其更包括有複數器〜子更貝欽項目，而該更正資訊係有關微處理 g、、、之複數個第一階層内的呼叫或轉回指令；帛二程式碼以用於提供—第二堆疊，其係祕至該第 _燮，該第二程式碼更包括有複數個用於儲存更正資訊之第 j目，而該更正資訊係有關微處理器管線之複數個第二階層内的啤叫或轉回指令；以及々第三程式碼以用於提供控制邏輯，其係耦接至該第一及第二堆疊，該第三程式碼可接收一控制信號，其係可指示一 :叫或轉回指令正從該第一複數個階層傳遞至該複數個二二 2層’其巾馳制賴仙應該控繼號以將與辦叫或轉回指令相關之該更正資訊自該第一堆疊移至該第二堆疊。

Client’s Docket No·: TT’s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 39 1282514 七、指定代表囷： (一) 本案指定代表圖為：第（2 )圖 (二) 本代表圖之元件符號簡單說明： 100-微處理器 104-F階層 108 - R階層 114-】階層 118-G階層 124 - E階層 128 - W階層 102-1階層 106-X階層 112-A階層 116-D階層 122-H階層 126-S階層 202-控制邏輯 204-雙端輸入多工器206-呼叫/轉回堆疊 208-轉回位址更正堆疊(RACS) 212-三端輸入多工器 214-指令指標暫存器 216-高階更正命令堆疊(HCCS) 218-有效位元 222-六端輸入多工器 224-低階更正命令堆疊(LCCS) 226-有效位元 232-呼叫信號 236-subrout i ne_addr 信號 242-J_stal led 信號 246-J jni spredi ct 信號 252-S_call/ret 信號 256-S一except ion信號 262-new_retum_addr 信號 266-push_CRS 信號 272-push_RACS 信號 228-xfer_cmdjnux_sel 信號 234-轉回信號 238-return_addr 信號 244-JLcall/ret 信號 248-cmd 信號 254-Sjni spredi ct信號 258-RACS_ret_addr 信號 264- CRSjnux—se 1 信號 268-pop一CRS 信號 274-pop一RACS 信號 Client’s Docket No.: TT’s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14 12825141 L 一 0,fr < r .7. . ΚΤ,Ι 淑機. 一―〜〜iUj一^—…-π...…* 276- new_subrout i ne_addr 信號 278-1P_mux_se 1 信號 282-IP_load 信號 284-push_HCCS 信號 286_pop_HCCS 信號 288-val id_bi tsJKXS 信號 291 - J_correct_addr 信號 292-CRS_ret_addr 信號 293-S_correct_addr 信號 294-push_LCCS 信號 295_inval idating_event_addr 信號 296-pop_LCCS 信號 297-top_hccs_cmd 信號 298- val id_bitsJLCCS 信號 299-top_lccs_cmd 信號八、本案若有化學式時，請揭示最能顯示發明特徵的化學式：略 Client’s Docket No·: TT，s Docket No:0608-A40743-TW/DraftFl/林璟輝/2006/11/14