TWI338249B

TWI338249B - System and method to prevent in-flight instances of operations from disrupting operation replay within a data-speculative microprocessor

Info

Publication number: TWI338249B
Application number: TW093105660A
Authority: TW
Inventors: Michael A Filippo; James K Pickett; Benjamin T Sander
Original assignee: Advanced Micro Devices Inc
Priority date: 2003-05-02
Filing date: 2004-03-04
Publication date: 2011-03-01
Also published as: GB0521712D0; KR20060009888A; GB2417113B; US20040221139A1; WO2004099977A3; KR101056820B1; WO2004099977A2; US7363470B2; GB2417113A; CN1784655A; TW200506715A; JP4624988B2; CN100432924C; JP2006525594A; DE112004000736T5

Description

1338249 玖、發明v說明：【發明所屬之技術領域】本發明係關於微處理器之領域，尤其係關於在微處理器中執行資料推測之領域。【先前技術】推測微處理器（speculative micr〇pr〇cess〇r)藉由同時執行並行指令及藉由使用符合本身設計之最短可能時脈週期而達到高的效能H在指令之間的資料及控制流程相依性可能限制有多少指令在任何給定的時間内可以發送’。果有些微處理克支援推測執行藉以達到額外的效能增益。丹甲一種形式 μ伸判苟衩制流程推測„仅刺流裎推；係預測（prediet)其中程式控制將要執行之方向。例如，；用分支預測以預測是否將採取分支。可用的分支預測有；多形式’如從每—次單純地採用相同的預測之方法乃至巧程式中維持該先前分支之繁複的歷史記錄以產生歷史㈣的預測之方法。分支㈣可料過硬體最佳化、編譯^ 佳=兩者而變得容易。基於藉由該分支預測機制所^ =’可以推測地提取及執行指令。當該分支指令最舍 =:不該分支預測能夠受到確認。若該預測是不正確時’ …I—正確預測所推測執行之任何的指令可以撤銷。料數值。推測為資料推測’該資料推測係預測實貝枓推測之形式包含推測產生用於記憶 92525(修正本） 5 1338249 體運算之位‘址及推測產生用於在計算運算中所使用之資料數值。使用控制推測時，最後是評估用以推測性產生數值之該潛在的條件，以便將該推測確認或取消。由於推測允許指令之執行而不需等待完成相依性檢驗’若來自正確推測所獲得之效果超過不正確推測所損失之效果，貝可以達到顯著的效果利益。因此需要減少因不正確推測之效果損失。【發明内容】本文將揭示在資料推測微處理器中用於避免進行中之運算例中斷運算重演之方法及系統之各種實施例。在某些實施例中，微處理器可能包含經由配置以執行運算之」個或㈤以上之功㉟性軍元'經&配置以發送運算至該功能性單元而用於執行之排程器、以及至少一個重演偵測單兀。忒排程可以經由配置以對於每個運算維持狀態資，。在其它事件中，此類狀態資訊可能指示是否相關的運算具有完全的執行。該重演偵測單元可以經由配置以偵測在該排程器中之其中一個運算應該被重演。當運算經由偵側為需要被重演時，若該運算例目前藉由其中—個功能性單元所執行，則該重演偵測單元經由配置以禁止對於該運之狀態資sfl之更新，以回應該進行中之運算例之執行。電知‘統之各種的實施例可能包含此類的微處理器。在其中一項實施例中’該重演偵測單元可以經由配置以藉由使該功能性單元執行該進行中之運算例成為運算之非讯唬完成至該排程器，而禁止對於該運算之狀態資訊之 6 92525(修正本) 更新。在另—個實以藉由使該排…」！重演偵測單元可以經由配置於兮運管」關於該運算之發送計數，而〜 ”玄運异之狀態資訊叩不止對合該運算例之發送計數=若該運算之發送計數並未符該狀態資訊來回庫爷：^可以經由配置以不更新思通運异例之完成》在某些實施例中，若資運算之不正確的資料推、01則確w早兀偵測到對於該關；μ & 、’推測，該排程器可以經由配置以更新關於運异之狀態資罝以更新 #剞、以扣不該運算需要被再次科详。a 偵測到該不正確資料推人’…画演偵單元可以右該運-例正在執行’該重 _ 置以確保關於該運算之狀態資气#垮 “在運算例執行之後該運算需要被再次發持續重一伯某—實例中’微處理器可包含數個重演偵測單元。重則貞測單^可以包含制早7L。載入儲在— 、貝枓推測確認單元之内（例如在秋八储存早疋或其他功能De _ 之内彳i? I Α β 早70之内或者在記憶體控制器之内）或者於該排程器本身之内。 —種方法之實施例可包含. 緊接於發送該運首例之後：，發…執行之運算例，‘ 不，以及回應於該指示，林^ * ^ π止在排程器内之該運算狀態之更新以回應該運算例之完成。移罝；袖/ m止该更新可包含使功能性哭。=該運算例成為該運算例之非訊號完成至該排程 :奸/，禁止該更新可包含··該排程器修正關於該運算 Μ 以回應接收該運算應該被重演之指以及若送計數並未符合該運算例之發送計纟，該排程 -不更新關於該運算之妝能次狀心貝汛以回應該運算例之完成ο 92525(修正本) 7 1338249 【實施方式】雖然本發明易於做各種的修正及替代的形式，本發明之特定的實施例藉由在該圖式中之例子而呈現並且於此做詳細描述。然而，應該瞭解的是對於該圖式及詳細的描述並未意在限定本發明於所揭示之該特定的形式，而相反地，本發明是意在涵括落在如同由所附申請專利範圍所定義之本發明之精神及範疇内之所有的修正、等同及替代。而要注意的是，該標題僅用於組織化的目的並且非意在使用於限定或說明該描述或申請專利範圍。再者，需要注意的是該文字“可以（may)”以允許的含意使用於整個申請案中（忍即，具有潛在可能的、能夠的广而非強制的含意（意即，必須（mUst))。該專有名詞“包含（inc丨ude)”及該名詞之衍生語意指“包含，但並未限定於（inc】uding，but η" limited to) 。έ玄專有名詞“連接（connecte(j)”意指“直接地或非直接地連接，，’並且該專有名詞“連結（c〇upied)” 意指“直接地或非直接地連結”。第I圖為微處理态1 〇 0之一個實施例之方塊圖。微處理器100經由配置以執行儲存於系統記憶體200内之指令β很多這些指令運算儲存在系統記憶體200内之資料。需要注意的是系統記憶體200可以是實體上分佈於整個

8 e整個電 ]00做存 7以包含指令快取（instruction 料快取1 28。微處理器1 〇〇可以包含連結至 92525(修正本） 1338249 ，指令快取106之預先取回單元1〇8(prefetchunh)。發送早元1〇4可以經由配置以接收來自指令快取]〇6之指令並且發迗運算至排程器（schedu】er)U8。一個或一個以上之排程器118可以連結以接收來自發送單元1〇4之發送的運算並且發出運算給一個或一個以上執行核心（execution c〇res)124。每個執行核心124可以包含經由配置以對資料快取執行存取之載入/儲存單元。藉由執行核心124所產生之結果可以輸出至結果匯流排1 3 0。這些結果可以使用作為用於後續發出的指令及/或儲存至暫存器檔案ιΐ6 之運算元數值（operand values)。退返佇例（retire queue)i〇2 可以連結至排程器118及發送單元1〇4。該退返佇列ι〇2 可以經由配置以決定何時每個發送的運算可以退返。在— 個實施例中，該微處理器100可以設計為相容於χ86架構。需要注意的是微處理器1 〇〇亦可以包含很多其它的組件。例如，微處理器1000可以包含分支預測單元（未圖示）。指令快取1 06在藉由發送單元】04接收到指令之前可以暫時地儲存指令。指令碼可以透過預先取回單元1 〇8藉由預先取回來自該系統記憶體200之指令碼而提供給指令快取1 06。指令快取1 06可以用不同配置（例如集合聯合 (set-associative) ' 完全聯合（fully-associative)或者直接對映（direct-mapped))而實現。在某些實施例中，可以有多重階層指令及/或資料快取106和128。某些階層可以與該微處理器1 00整合，如同所示，而其它階層快取可以外部連結至該微處理器。 92525(修正本） 9 1338249 預先取回單元1〇8可以預先從該系統記憶體2〇〇取回指令碼而用於在指令快取106之内儲存。在—個實施例中，預先快取以1G8以配置隸料H㈣叢發（burst)指令碼進入指令快取1〇6。預先取回單元ι〇8可以使用各種特定的指令碼預先取回技術及演首法。發送單元104可以藉由該執行核心124以及運算元位址資訊、即時資料及/或位移資料，而輸出包含可執行的位 7L編碼運算之輸出訊號。在某些實施例中，發送單元⑺4 可以包含解碼電路（未圖示）而用於解碼某些指令進入在執 =核心124之内之可執行的運算。簡單的指令可以對應於單運异。在某些實施例中，較複雜的指令可以對應於多重的運算。若運算包含暫存器之更新，在暫存器檔案116 内之暫存器位置可以保留（例如當該運算解碼時），以儲存推測的暫存器狀態（在另一項實施例中，重新定序緩衝器可以使用以儲存用於每個暫存器之一個或一個以上之推測的暫存器狀態）。暫存器對映可以轉譯來源及目的運算元之邏輯暫存器名稱成為實體暫存器名稱，以形成暫存器重新命名暫存器對映可以追蹤那一個在暫存器檔案116内之暫存器目前受到配置。第1圖之微處理器1 〇〇支援非按序執行。退返佇列1 〇2 可以保持用於暫存器讀取及寫入操作之該原始程式順序之追5(¾、介^田 &。干用於推測指令執行及分支錯誤預測回復以及促成精確排除。退返佇列]02可以實現以先入先出配置，當 δ玄先人To 疋出配置之運算有效時，該運算移至該緩衝器之 10 92525(修正本）叫 8249 底部（boftom)，，，而在該佇列之“ u + 新登錄之空間。退返仵列1〇2可、方（t〇P)’產生用於運笛〜可以撤回運算，以回應於該連·^元成執行及依程式順序迳丨何運首… 負序達到及包含該運算之執行於任暫存器内產生該數值之運曾撤=文到確認。當在該實體枓— 介擻回時，退返佇列102可以交付戸、體暫存器之推測的狀態成能。〜成為微處理器1〇〇之架構狀在某二貫,“列中’退返佇列】〇2可以實現成為序緩衝器（reorder buffer)之一邱八亦τ、， #分。此類重新定序緩衝器以#用於推測暫存器狀態之資料數值儲存，以支援 ^重新命名。需要注意的是在其它實施例中，退返仔 :可以不提供任何資料數值儲存。相反回時，退返仔列102可以移除配置 :運:撤 31 ϋι. At ^ ^ 丹而要儲存推測暫存暫存器對映而γ存裔樓案116内之暫存器並且提供訊號給暫存,ν二:示那一個暫存器8前是空的。藉由維持在 ::棺案U6内之推測的暫存器狀態(或者在另 :例中，在重新定序緩衝器之内)，直到產生之异文到確認，若分支預測不正確，則 -狀-之運推測執行的運算之結果在暫存:、預測路徑之的。孖。4案116内可以是無效若特定運算之所需的運算元為暫存器位置，可 :位，貧訊傳送至暫存器對映（或重新定序緩衝器）。例子如，一架構中，具有八個32位元邏): eax、ebx、Ec 科嘴存=(例如暫存哭产安 P、ESI'EDI及咖）。實體暫H m(或重新定序緩衝器）包含用於改變這些邏 92525(修正本) 11 輯暫存器之内容之^ 存器檔案116内〜…存，而允許非按序執行。在暫修正其中一他Λ之A體暫存器可以經配置成以儲存決定於 ,, 亥^輯暫存器之内容之每個運曾的έ士杲 m 此，在特定的程4 W硬开的結果。因 ⑴（或在另:之執行期間之各種時刻，暫存器檔案或-個以上之八：施例中’重新定序緩衝器)可以具有-個暫存哭 3有給定的邏輯暫存器之推測執行的内容之暫存器對昧7 之特定的邏輯暫=指定實體Γ存器給詳述目的運算元暫存器檔案116::而用於運异，發送單元104可以決定 '、’、有指定給邏輯暫存器之一個或一個以上，歧置的實㈣存器，而該邏輯暫存器在給定的運算 :述來源運4·元。該暫存器對映可以提供標籤㈣)給時 4定給該邏輯暫存器之實體暫存器。此標藏可以經由使用以存取在該暫存器檔案116内之運算元的資料數值或藉土傳遞至該結果匯流排13〇上之結果而接收該資料數值。右遠運算元符合記憶體位置，該運算元數值可以透過載入/ 儲存單元222而提供至該結果匯流排（用於結果傳遞及/或储存於暫存器檔案118内）。當該運算藉由其中一個排裎器 11 8而發出時，運算元資料數值可以提供至執行核心】24。需要注意的是在另一個實施例中，當運算發送時，運算元數值可以提供至對應的排程器11 8(而非當該運算發送時，提供至對應的執行核心1 24)。在發送單元1 04之輸出處所提供之該位元編碼運算及即時資料可以傳送至一個或一個以上之排程器Η 8。需要 92525(修正本） ]2 1338249 » · 注意的是此所使用的排程器為偵測何時運算已準備執行之元件並且發出備妥運算給一個或一個以上之功能性單元。例如，保留位置（reservation station)是排程器。在排程器或群組排程器内之運算亦稱為在指令内之運算或運算視窗 (operation window)或排程視窗（scheduHng wind〇w)。每個 2程器Π8對於等待發出至執行核心124之數個待決的運算具有能力保留運算資訊（例如編碼執行位元之位元以及運算元數值' 運算元標籤及/或即時資料）。在某些實施例中，每個排程器118可以不提供運算元數值健存。相反地，每個排程器可以監視發出的運算及在暫存器檔案"6内可獲得之結果，以決定何時運算元數值將可以藉由功能性單二從暫存器權案116或結果匯流排13〇)而獲得讀取。例巾，每個排程器118可以結合預設的功能性早兀126。在其它實施例中，瞀从1 排長态1】8可以發出運异給超過其中一個功能性單元126。運排程器m可以藉由執行核心】暫時健存運算資訊。如w Μ供··“寺執灯之可以儲存用於待）㈣排^⑴ 以錯存已經執扞作θ 孔。此外，每個排程器可資訊。運瞀秒從山丨甘出之用於運具之運算 π不嗌出至執行核心】24 及時獲得產生之用於執行之 =心，以回應可此，在運算係執行之順序中可以不=的運鼻元之數值。因列之順序。包含資# 5於邊原始程式指令系匕3 μ科推測之運嘗可内直到該運算變# 了以仍然在排程器】】8之夂成非推測性的為、. ’以便若該資料推測不 92525(修正本） 13 1338249 正確’該運算可以重新發出。在一個實施例中，每個執行核心124可以包含能性單元126(例如功能性單元126Λ至126C，如於第固力中所顯示）。某些功能性單元，例如126a，可以 1 ® 執行加法及減法之整數計算運算、以及平移 '旋轉、二運算及分支運算。其它功能性單元，例如126B，可以：。成包含浮點運算。一個或一個以上之該功能性單元（例己如置 126A)可以配置成以執行位址產生，而用於載入及儲存藉由功能性單元（例如126C)所欲執行之記憶體運算該功9能性單元126C執行載人及儲存運算以存取健存於資料快： :28及/或系統記憶體内之資料。在一個實施例中此類功能性單元⑽對於資料及位址資訊可以配置成具有數個儲存位置載入/儲存緩衝器而用於待決載入及/或儲存。一個或-個以上之功能性單元126亦提供關於條件分支指令之執行之資訊給分支預測單元，以便若分支錯誤預測’該分支預測單元可以接續已經進入該指令處理流程之錯誤預測的分支而除去指令並且重新指向預先取回單元 1 〇 6。該重新指向的預先取回單元〗〇 6接著可以開始從指令快取或系統記憶體取回該正確的指令集。在此種情況下’在該錯誤的分支預測之後，所產生之在該原始程式序列内之指令的結果可以捨去，包含推測執行及暫時儲存於暫存器檔案11 6内之結果。处若f存器數值受到更新時，藉由在執行核心124内之力靶ϋ單⑦】26所產生之結果可以輸出至該結果匯流】3〇 92525(修正本） J^>6Z49 w曰存益擋案11 6上。若該記憶體位置之内衮A 改變時，产从，分又巧在執核心1 24之内所產生之結果可以提供至該截入/儲存單元1 26C。、貝料快取1 28為快取記憶體，該快取記憶體經由提供以暫時地儲存在執行核心124及該系統記憶體2〇〇之間做轉移之資料。如同上文所描述之該指令快取1 06，該資料决取1 28可以在各種特定的記憶體配置内實現，包含集合聯&配置。此外’資料快取1 〇 6及指令快取1 2 8在某些實施例中可以在單一的快取内實現。在某些實施例中，微處理器丨00可以包含整合的記憶體控制器1 60 ’允許該微處理器直接對系統記憶體200介面接合。在其它實施例中，記憶體控制器1 60可以包含於非直接連結微處理器1 〇〇與系統記憶體2〇〇之匯流排橋接内。資料推測如同在此所描述的，若具有資料數值可能發現是不正確的並且因而重新計算之可能性，則該資料數值是經由推測的。推測的資料數值是無法鑑別具有可為正確或不正確之確認性的數值。若該資料數值為運算之結果，對於該運算某些資料推測已經執行或者若該資料數值視另一個推測的資料數值而定（例如若該資料數值產生成為具有一個或一個以上之推測的運算元之運算之結果），則資料數值可以重新計算。在微處理器]〇〇内之各種機制可以執資料推測。例 15 92525(修正本） 1338249 士: ’發迗單元104、記憶體控制器i6〇及上之功能杈_ 调或—個以單7L 126,母一個對於特定的料推測。hi ”n" * 可以執行資以使用做Γ 到其中一個運算之結果可文為用於另一個運算之推元藉由I^例如，發送單别儲存運算可以預測載入運算將存快取⑵之資料。該發送單心4可以=存於貝料該暫在哭口應地確認儲存於子窃内之資料數值，該暫存、夾嗝而Λ、于裔便用作為該儲存運笛夕來/原而成為該載入運算之推測的運4 測在此稱為相佑果此種形式的資料推運算之來源而延伸至該發送單元一由連結該储存推測的運曾K 内而作為用於運算之算元。另二二^ f ㈣“運算之結果成為運未計算的位址測可以藉由允許載入至具有依賴較早的儲存，』年又柯的載入並未储存而在載入儲存單元126C内執行。在多重處理㈣、統中，記憶體控制器Μ 致性檢查以維持快取 ^ ^ 』以執仃— 它…… 憶體控制器160在… 匕微處理㈣快取之—致性檢查完成之前可 “ 體200推測地回傳快本統汜憶 ρ 路線之複本。若該-致性檢杳接芸決疋欲取回之該快取路一接者 L取路線之正確祓本目前儲理器快取内，則從么姑々也邮力個處攸不統圯憶體200所推測地取路線之複本可以是盔5π 取口之忒快取疋…、效的。因此，從存取該快生之任何載入運首处里收β』私砂綠所產、.，〇果將疋推測的，直到該一成為止。此形式之推制乂 * , * ^ 任知查兀 <推測在此稱為記憶體預測（_ prediction) 0 ^ J6 92525(修正本） 1338249 發送早元1 04可d a , 错由預測運算之結果而執行資料推測。例如，某些運算可 1貝向產生相同的結果，並且因此令每次其+ —個運算受至，丨泠饰 ^ .〃 1處理’該結果可以藉由發送單元 1 04在該運算藉由功能性單一 > 26之貫際執行之則而推測地產生。此形式的資料推測、J於此％為資料預測。需要注意的是資料預測亦可以執行於兮丁方、6亥微處理器之其它部分内（例如在載入儲存單元12 6C内）。載入儲存單元1 26c可抽」以推測地產生該位址並且基於該推測的位址’其位址仍麸夫〜 5…、禾4過计鼻之載入指令之結果基於早期處理的載入夕捃，， m之拉 <。例如，若該先前的N個載入運算具有藉由固定平移量C所她„ 夕里C所彼此間隔之目標位址 A 1 -AN(例如 A 1，A2=A 1 +Γ， A χτ C ’ AN=A(N-1) + C) ’ 該載入儲存單元1 26C可以推測地回僂 θ l uj得位在取近存取的位址an 加上自玄固定的平移量C夕咨4sL二& 之貝科而作為該載入運算之結果。此種形式的資料推測於此摇為 '此％馮位址預測。需要注意的是位址預測之其它形式可以使用於很多實施例中。視資料推測已經執行於運算上之結果而定之運算，亦可以產生推測的結果。例如，萁 ' J戈右位址預測經由使用以產生載入運算之推測結果’任何使用作為運算元之該載入的推处。果之執订之相依運异可以產生推測的結果’該推測的、”。果可以藉由其它相依的運算而依序使用作為運算元。因此，右在該載入運算内之該優先的推測係決定為不正確者，S玄相依運算的結果亦可能η尤不过、, 卜衣力J牝疋不正確的，亚且因此視該入而定之運异之整個相依性連鎖可能需要重新執行以產 92525(修正本） 1338249 生正確的結果。在時’該相依性運算的.二，若該優先推測經發現為“ 基於任何其以^ 的（假設㈣結果並非八匕推凋的數值）。當運算藉由功能性單元而一執行之該很多運苜订，，對於資料推測已經生運算之結果之哕資# %〜j如，使用於推測地產確認，該功能性藉由該!能性單… 推測結果而執行該運算：：運异之真實結果與該該貝料推測為不正確時，此 =付，右行。其它運算可以確㈣不而要重新執士+ 要元整地執行。例如，芒且 .^ 載較早的儲存（例如由於相依性或位址預測）傳遞本身的結被, ⑷*該載入位址計算時，哕載入之推測的結果可能需要確〇λ 時，此類運算可能需要重新勃，科推測不正確的結果。一重新執-(至少部分)以產生該正確由於對於資料推測已經執 .. <連τ以及本身的相依性運鼻可能需要重新執行，退返一僅為退返運算，而對於該運瞀任η ^以經由配置成連^任何優先的資料推測已經決定。在微處理器100内之經由配置以確認—種或一種以上此稱為用於確認資料推測之資料推測確認單元或工具。重演违行中運篝由於不正確資料推測運算可以從排程器118透過重新發出而重演。A了要造成已經藉由該排程器118所發出之 92525(修正本） 18 運具以重洁，+ , 在排程器1 1 Λΐ 以顯示該運曾之該運算之狀態可以做修正咬π應泫重新發該排程器！ u可rw_丄 °回應於該更新的運算狀態， J以經由配筈元126。若用於該運首1 U重新發出該運算給功能性單播並且該運算已經發ζ之來源資料在結果匯流排130上廣記用於重演之運算。運昝則該排裎器亦可以經由配置以標不正確的資料推測之執^ =來源資料可以因為對於偵測到常，欲重演運算之需长。或重新執行運异而重新廣播。通資料推測及該運質咖可U错由偵測用於運算之不正確的測或者藉㈣測該執行之資料推測確認單元而推正確的資料推測而重：二’需要因為用於其它運算之不偵測該需要重演目依性關聯的排程器而偵測。在、 ^心傲處理哭1Λ 於偵測需要重演之.益100内之組件於此稱為用、异之重演偵測單元或工且0 某些資料推測運算早兀飞/、。功能性單a m内為正在進一：為重演，同時該運算例在藉由排程B 118發送至功能:„。。進行中的運算例為已經算在該功能性單元126内並未：：126之運算，但是該運運算例完成執行時，該指八不：全的執订。當該進行中的之運算的其餘狀態。否則=應該影響在該排程器m内新在該排程器内之運算之：仃中的運昇例之完成可更 45 E2 L成為完成的狀璩，衿忐4t ^ ^錯誤而無法重新發出該谋首，&成S玄排的運算為需要重演者：。因此’若该測到進行中以經由配置以禁止該進行中^之重㈣測單元可新該運算㈣態之能力。例在該排程ϋ m内更 92525(修正本） 19 1338249 在一個實施例中，每個重演偵測單元可以經由配置以更新儲存在結合運算之排程器入口内之發出計數，以回應偵測對於運算為不正確之資料推測。第2圖說明包含排程入口 6 0 〇之排程器〗1 8之一個實施例。排程器入口 6⑽ 包含用於運算的標籤•運算元識別器（及/或運算元，在某些實施例以及運算碼604之儲存。排程器入口 600亦包含關於該運算及發出計數602之用於狀態資料606之儲存。當接收到運算應該重演（例如由於其中一個運算的運曾元重新廣播於結果匯流排1 3 〇上或資料推測確認單元顯示用於該運算所執行之該資料推測是不正確的）之指示時，該排程器1 1 8可以增加與該運算相關之發出計數。當該排程器118初始配置入口提供運算時，用於該運算之發出計數可以設定為最小數值（例如零）。當該排程器1 1 8發出用於執行之運算給功能性單元 126時，該排程器可以提供與該運算相關之發出計數給該功能性單元1 26。當廣播該運算之結果時，每個功能性單元126可以經由配置以廣播該發出計數。該功能性單元1 μ 可以處理該發出計數成為部分該運算的標籤，並且該發出計數在特定功能性單元内對於該運算之處理沒有影響。然而，當該排程器118遇見該運算廣播之結果時（例如當該結果數值與該運算之發出計數及標籤及/或本身的運算元廣播於結果匯流排130之上時），該排程器m可以經由配置以比較與該運算例相關之發出計數與目前儲存於該運算的排程器入口 600内之發出計數。若該兩個發出計數數值並 92525(修正本） 20 1338249 未相等時，、該排程器118可以禁止更新在該排程器内算之狀態。因此，若該運算的狀態及發出計數算之發出但在該運算之執行—成 Α 運钒仃凡成之則而在該排程器U8 做更新，則错由功能性單元126之運算之完成將不倏正在㈣…内之運算之狀態。需要注意的是該排程：可以更新用於不正確推測的運算之發出計：某些實施例中該運算目前為進行中的。其它的总=否在限制此類對於運算已經在進行中之更新。“列可Μ 在某些實施例中，由於該非相等的發算之結果因為不正確的資U不該運則若在該排程器】】8内之運嘗M t 了此疋不正確的，運算例之結果之該發的發出計數並未符合結合該木U發出3十數廣播，該排程發出視該運算之結果而定之任 8可以禁止不正確的資料數值所執7" °然而’使用該可能出，下一次該不正確推相依性的運算亦將重新發以W 運异之結果為廣播的。因此，， ……’由於正確性將仍在以允許相依性運算以使 -排私窃〗〗8可行。㈣正確地推測運算之結果而執除了在該排程器内使用發用運算技巧特徵《禁止更。十1 ’某些實施例可以使以回應於進行中之運算例之:用於重演之運算之狀‘態， ⑶之方塊圖，該，儿成。第3圖說明功能性單元 b江早元】2 6堙由阶除0⑴），，經由識刿為需要重宫、^由配置以有效地“去性單元126藉由避免關於該進運算例。該功能 ◊運昇例之任何改變的 92525(修正本) 21 1338249 狀態資料廣播至該排程器U8而去除進行中的運算你。功能性單元126接收來自重演偵測單元確認需要:。舍出的運算之-個或-個以上訊號。包含在該功能性=之髮 ⑶内之運算去除邏輯7〇〇可以運算以避免該功能性^ :26廣播顯示在該排程器内之該運算狀態應該更新之：几訊。由於該排程器將因此不接收該運算已經完成執行：不，該排程H U"字不更新在該排程器内之運曾才日 …由於在需要重演該運算之㈣之前發出之：。元，之故，當在該實施例中使用發出計數以禁正修程器狀態時，實現運算去除邏輯7〇〇之 _ # 置而禁止發出相依性運算進♦ °以紅由配完成。然而，由於此功处性叮处^^丁中的運算例之由於此功月,性可能不需要處理器實施例可以允許相依性運算使用藉由該的:其它產生之結果而發送及執行。在下一次所測的發出及執行時，任何相依性運算可確推已二Γ正確推測受到偵測之前，在功能性單元内已4在進仃中之運算例之完成，帛4A圖說：内於不正確推測的運算之排 V更新對在步驟801，接收到Λ狀〜、之方法之—個實施例。按收到達仃中的運算需 ^ 於該需要重演該運I 重次之指示《回應可以重置以心：rr在該排程器内之運算之狀態 ”"貝不4運算應該重新發 ^ 顯示。此外，杏今。同在步驟803所器内之該運算二推測憤測為禁止更新在該排程、开之狀態時，如同在步中的運算例之完成為正在進 < 5所顯示’該進行力月b 805可以藉由有效 92525(修正本） 22 1338249 地去除在功能性單元内目前執行該運算之該進行中的運算例，藉由使用在該排程器内之機制（例如發出計算）以區^ 運异例而實現，諸如依據第4B圖所描述之例子。由於在偵測到需要重演該運算之前，在功能性單元内 ==中之該運算例之完成，第則說明禁止更新對於該運异之排程器狀態之方法之另—實施^如㈣_ 4A圖中，重演該運算之需要在步驟8()1㈣測到並且該運异之狀態在步驟803A處於該排程器内回應而更新。此外，在該排程器内用於區別運算例之發出計數或其它工做仏正以回應偵測用於該運算之不正確資料驟803A處所顯示…、確貝枓，如同在步 .貝不 s該運具例完成執行時，盥哕g & 相關之發出計數可以盥少—μ Λ /…亥運异例計數做比較，如同少本挪之4發出 ^ 门在步驟805所Α顯示。若該兩個發出叶數匹配時，在兮M e。 U * °τ ”m 為'内之運算的狀態可以更新以回庫於 «鼻之元成，如同在步驟斯所顯示。例如 ^ 狀態可以做更新以s 4運开的 ^ LA , 頜不έ玄運算已經完成執行。若节而佃钵出計數並未匹配，訪，富# 右这兩個發該運具的狀態可以不需更新，驟805Β所顯示，因新如同在步 U此’基於不正確的資料推測士行之該運算例蛊廊2壬* 別所疋成執 ”應έ玄重新發出以執行而未有不正砝& μ 推測之該運算例係右略戌，节个正確的貝枓 ’、有所區別。此種區別允許移μ t Α 算之狀態之更新n •別允。午-止對於該運回應具有不正確資料數佶& 運算例之完成。貝汁数值而執仃之該例示性電腦系弟5圖顯示雷^ ^統_之—財施例^塊圖，該 92525(修正本） 23 1338249 電腦系統々00包含透過匯流排橋接902而連結至各項系統組件之處理器1 00。處理器1 00可以包含如同上文所描述之經由配置以重演運算之重演偵測單元及排程器。電腦系統之其它實施例是可能並且可考慮的。在該描繪的系統中’主記憶體200透過記憶體匯流排906連結至匯流排橋接902，並且令繪圖控制器908透過圖形加速埠（AGP)匯流排9 1 0而連結至匯流排橋接9 0 2。數個週邊組件介面（p c I) 裝置9 1 2A至9 1 2B透過週邊组件介面匯流排9 1 4連結至匯流排橋接902。第二匯流排橋接9 1 6亦可以透過延伸工業 ‘準木構（EISA)/工業標準架構（ISA)匯流排920而提供以相容於電氣介面成為一個或一個以上之延伸工業標準架構或工業^準架構裝置9 1 8。在此例子中，處理器1 〇透過中央處理器（CPU)匯流排924而連結至匯流排橋接9〇2並且 ’該處理器100 連結至選擇L2快取928。在某些實施例中可以包含整合的L 1快取（未圖示）。匯流排橋接902提供介面於處理器丨〇〇、主記憶體 200、繪圖控制器之裝置之間。當i 908及連結至週邊組件介面匯流排

之協定。 92525(修正本） 24 除了提供介面給用於调、甚俨進加、、邊，、且件介面匯流排9 1 4之工業才示旱木構/延伸工業標準牟可以敕人1 L 不丰木構匯流排，第二匯流排橋接916 *T 乂正&額外的功能性。私λ 盥則輸出控制器（未圖示），不論疋 > '苐一匯流排橋接9丨6外外。Ρ連接或與第二匯流排橋接 9 1 6正合者，亦可以包令 / Μ # I& 、電月面糸統900之内以提供用於鍵_πέ與滑鼠922以及用大μ — r。序列與平行蟑之操作的支友。，丨、取早兀（未圖示）在其他實施例中亦可以連纟士至位在處判1〇〇及匯流排橋接9〇2間之中央處理器匯流排 924。另外，該外部快取可以連結至匯流排橋接9〇2並且用於該外部快取之快取控制邏輯可以整合至匯流排橋接902 内。L2快取928以背部配置於處理器⑽而顯示。需要注意的是L2快取928可以與處理_ ι〇〇分離、可以與處理器1〇〇整合成卡£式（例如溝槽！或溝槽A)或甚至可以與處理器100整合在半導體基板上。主記憶體200為應用程式儲存在其中並且處理器】〇〇主要由該記憶體執行之記憶體。適當的主記憶體2〇〇可以包含動態隨機存取記憶體（Dynamic Rand()m Aeeess

Memory’ DRAM)。例如，複數組同步動態隨機存取記憶體 (Synchronous Dynamic Random Access Memory > SDRAM) 或Rambus動態隨機存取記憶體（rdram)可能是適當的。週邊組件介面裝置91 2A至9 12B為說明各種週邊置，諸如網路介面卡、視訊加速器、音訊卡、硬式或軟式磁碟機或磁碟機控制器、小型電腦系統介面（Srnaii Computer Systems Interface，SCSI)轉接器及電話卡。同樣地，工業 92525(修正本） 25 1338249 標準架構裝置918為說明各種型式的週邊裝置，諸如數據機、音效卡及各種資料擷取卡（諸如一般用途介面匯流排 (General Purpose Interface Bus，GPIB)或區域匯流排介面 (field bus interface)卡）。繪圖控制器908經由提供以控制文字及影像之轉譯於顯示器926上。繪圖控制器908可以使用一般在該技藝中已知的典型繪圖加速器，以轉譯可以有效地轉移至主記憶體200内及由主記憶體2〇〇轉移之三維資料結構。繪圖控制器908因此可以是圖形加速埠匯流排91〇之控制者，其中該圖形加速埠匯流排9丨〇能夠請求及接收存取在匯流排橋接902内之目標介面，藉以獲得存取主記憶體2〇〇。預設的繪圖匯流排相容於來自主記憶體2〇〇之資料之快速恢復。對於某些運算，繪圖控制器9〇8更可以經由配置以產生週邊組件介面協定事項於圖形加速埠匯流排9丨〇上。匯抓排橋接902之圖形加速埠介面可以因此包含功能性以支援圖形加速埠協定事項以及週邊組件介面協定目標與初始者事項兩者。顯示器9 2 6為任何影像或文字能夠呈現於其上之電子顯示器6適當的顯示器926包含陰極射線管 (_〇心 ray tube ’ “CRT”）、液晶顯示器（liquid crystal display，“LCD”）等等。而要注意的是雖然該圖形加速埠、週邊組件介面及工業钻準木構或延伸工業標準架構匯流排在該上文的描述中已’二使用作為例證，任何匯流排架構可以依照所需而替換更而要注意的是電腦系統900可以是包含額外的處理 26 92525(修正本） 1338249 益（例如顯示為電腦系統900之選擇的組件之處理器】幻夕工電取系統。處理器】〇〇 a可以類似於處理器1 〇〇。再者，處理器I 00a可以是處理器】〇〇之等同的複製。處理器】0〇a可以經由獨立的匯流排（如同於第$圖中所顯示）而連接至匯流排橋接902或者可以與處理器丨〇〇分享中央處理益匯流排924。再者’處理器1〇〇a可以連結至類似於L2 快取928之選擇的L2快取928a。現參閱第6圖，該圖顯示電腦系統9〇〇之另一實施例，該電腦系統900可以包含如同上文所描述之具有一個或個以上之經由配置以重演運算的重演偵測單元及排程器之處理器100。其它實施例是可能並且經過考量的。在第6圖之實施例中，電腦系統9〇〇包含數個處理節點 ⑻2A、1012B、1012(：及1〇12〇。每個處理節點藉由在每個相對的處理節點㈣A至·0之内所包含之記憶體控制器1016A至1016D而連結至相對的記憶體2〇〇八至 2嶋。此外’處理節點1012八至1〇12〇包含經由使用以在該處理節點1〇12八至1012D之間通訊之介面邏輯。例如，處理節點1012A包含用於與處理節點1〇〗26通訊之介面邏輯1018A、用於與處理節點1012C通訊之介面邏輯” W18B、以及用於與另一個處理節點（未圖示）通訊之第三介面邏輯1018C。同樣地，處理節點1〇12β包含介面邏輯 ⑻8D、m8E以及1()18F;處理節點1Ql2c包含介面邏輯 1〇18〇、ΗΗ8Η以及〗並且處理節點1〇〗2〇包含介面邏輯Η)]8Κ以及I(n8Le處理節】〇i2D藉由連 92525(修正本） 27 1338249 結透過介面邏輯】0丨8L以與複數個輸入/輸出裝置（例如在菊環式（daisychain)配置内之裝置1〇2〇a至1〇2〇b)通訊其它處理節點可以以類似的方式與其它輸入/輸出裝置做通訊。處理節點10]2A至1012D實現用於内部處理節點通訊之封包型連結。在本實施例中，該連結實現成為單向性線路之集合（例如線路1024A使用於從處理節點1〇12八傳送封包至處理節點1〇123以及線路1〇248使用於從處理節= 1012B傳送封包至處理節點1〇12a)。其它集合的線路” 】〇2JC至1〇24Η如同於第6圖中之說明者使用於在其它處理節點之間傳送封包。通常，每組線路1〇24可以包含—個或一個以上之資料線路、對應於該資料線路之一個或一個以上之時脈線路、以及顯示該型式封包欲傳送之—個或— 個以上之控制線路。該連結可以以快取一致之方式操作而用於在處理節點之間通訊或以非—致方式而用於在處理節點及輸入/輸出裝置之間通訊(或匯流排撟接至習知的架構之輸入/輸出匯流排’諸如週邊組件介面匯流排或工聿桿準架構匯流排)。再者，該連結可以以非一致之方式使用如同所示在輸入，輸出裝置間之菊環式結構而操作。需要注意的是欲從其中—個處理節點傳送至另—個之封包可以穿越通過一個或-個以上之中介節點。例如，藉由處理節點⑼Μ f處理節點i〇12D所傳送之封包可以穿越通過不論是處理卽點1 0】2 B或處理節點】〇】，ρ 奴即黑占1〇】2C，如同於第6圖中所顯示。可以使用任何適當的繞路演算法。電康_之其它實 92525(修正本） 28 1338249 施例可以包含比顯示於第6圖中之實施例更多或更少的處理節點。通常’該封包可以在節點間之線路1024上傳送成為一個或一個以上之位元次數^位元次數可以是在該對應的時脈線路上之時脈訊號之上升或下降緣。該封包可以包含用於初始化事項之指令封包、用於維持快取一致性之探測封包以及來自回應於探測及指令之回應封包。除了記憶體控制器及介面邏輯外，處理節點丨〇丨2A至 1 0 1 2D可以包含一個或一個以上之處理器。廣義地說處理節點包括至少一個處理器並且可以選擇性地包含用於與所需的記憶體及其它邏輯進行通訊之記憶體控制器。尤其，每個處理節點1012八至10〗2〇可以包含一個或一個以上之處理器1 00之複製。外部介面單元可以包含在該節點 1 〇 1 8内之該介面邏輯’以及該記憶體控制器1 〇〗6。記憶體200A至200D可以包括任何適當記憶體裝置。例如，記憶體200A至200D可以包括一個或一個以上之 RAMBUS動態隨機存取記憶體（RDRAMs)、同步動態隨機存取記憶體（SDRAMs)、靜態隨機存取記憶體等等。電腦系統900之位址空間在記憶體200a至200D之間分割。每個處理節點1012A至1012D可以包含使用於決定那個位址對映至那個記憶體200A至200D之記憶體對映，並且因此對映至那個處理節點1 01 2A至1 〇 1 2D而用於特定位址之記憶體請求應該繞路。在一個實施例中，對於在電腦系統9〇〇内之位址之一致性指標為連結至對應於該位址之記憶體儲 29 92525(修正本）存位元組l己憶體控制器1016六至1G]6D。換言之1 3己憶體控制器聰A至1(H6D負責用於確保存取該對應的 ^己憶體2嫩至2嶋之每個記憶體以快取-致之方式產生。冗憶體控制器l〇]6A至i〇16D可 a 9λλδ s 玍1U16D可以包括用於與記憶體至200D介面接合之控制電故 1_至1〇_可以包含用二此外，記憶體控制器 „ 憶體請求之請求佇夕,J ° 介面邏輯1018A至1018L可以勺』 4+ ^ Λ m M包括用於從該連結接收封匕及用於緩衝欲傳送至該連器。電^ $ Μ τ 上之封包之各種的緩衝二= 用用於傳送封包之任何適當的流寿钇制機制。例如，在—個實施例中在該介面邏輯連接至該連結之另―’母個"面邏輯1018 之每個形式的緩衝器之數量之'處儲存在該接收器内封包，& # H 。該介面邏輯並未傳送耵匕除非該接收介面邏輯具有自 — ^ 包。當接收緩衝器藉由繞路封也的緩衝器以儲存該封介面邏輯傳送訊息至該傳送介面2 Μ置時’該接收的經閒置。此類的機制可以稱之為“ ％ ’以顯示該緩衝器已系統。咐加型（coupon-based)，，輸入/輸出裝置1 020A至1〇2 入/輸出裝置。例如，輸入/ 可以是任何適當的輸包含用於與ϋ電腦^1^_至卿可以或數據機）。再者，輸入/輸出裝置、置（例如網路介面卡含視訊加速器、音訊卡、硬式或軟1〇2〇八至1020Β可以包小型電腦系統介面（SCSI)轉接/ <㈣機或驅動控制器、及笔話卡、音效卡及各種 92525(修正本） 30 1338249 二貝料擷取卡，諸如一般用途介面匯流排或區域匯流排介面卡。需要注意的是該專有名詞“輸入/輸出裝置，，及該專有名詞“週邊裝置”於此為同義者。如同於此所使用的，該專有名詞“時脈週期”意指時間間隔，該指令處理路線之各種行程在該時間内完成本身 ^任務。指令及計算數值依據定義該時脈循環之時脈訊號藉由記憶體元件（諸如暫存器或陣列）而捕獲。例如，記憶體疋件可以捕獲依據該時脈訊號之上升或下降緣之數值。該上文的討論說明受到宣告之訊號。當訊號傳遞顯示特定片段資訊之數值時，該訊號可以定義為受到宣告。當特定訊號傳遞二位元i數值時’或者反過來當特；：號；遞二位元零數值時，該特定的訊號可以定義為受到宣告。許多變化及修正對於熟習該項技藝者在完全瞭解咳 ^述之揭示時將變得顯而易1。該下列的中請專利範圍x將解釋為意在涵括所有此類的變化及修正。【圈式簡單說明】 s考置下文的洋細說明並結合下列的圖式時之較佳的瞭解可以獲得，其中：第1圖顯示依據一個實施例之微處理器。第2圖說明依據—個實施例之排程器。第3圖說明依據—個實施例之功能性單元。第4A圖為依據一個實施例之阻止在該排程界内之不正確推測的運算之狀態更新之方法的流程圖。弟4B圖為依據另一實施例之阻止在該排程器内之不 92525(修正本） 31 1338249 正確推測6¾運算之狀態更新之方法的流程圖。第5圖顯示依據一個實施例之例示性的電腦系統。第6圖顯示依據另一實施例之另一個例示性的電腦系統。 (元件符號說明） 100 微處理器 1 00a 微處理器 1 02 退返佇列 104 發送單元 106 指令快取 108 預先取回單元 116 暫存器檔案 118 排程器 124 執行核心 126A 功能性單元 126B 功能性單元 126C 功能性單元；載入/儲存單元； :載入儲存單元 128 資料快取 130 結果匯流排 160 記憶體控制器 200 主記憶體 200A 記憶體 200B 記憶體 200C 記憶體 200D 記憶體 222 載入/儲存單元 600 排程器入口 602 發出計數 604 標籤、運算元識別器及運算碼 606 狀態資料 700 運算去除邏輯 801 步驟 803 步驟 803A 步驟 805 步驟 805A 步驟 805B 步驟 805C 步驟 807 步驟 900 電腦糸統 902 匯流排橋接 32 92525(修正本） 9061338249

910 912B 916 918 920 922 926 928a 1012B 1012D 1016B 1016D 1018B 1018D 1018F 1018H 101 8J 1018L 1020B 1024B 1024D 1 024F 1 024H 鍵盤/滑鼠顯示器 L2快取處理節點處理節點記憶體控制器記憶體控制器介面邏輯介面邏輯介面邏輯介面邏輯介面邏輯介面邏輯裝置線路線路線路線路 s己憶體H:流排 , ·Η叫，工奶盗圖I加速埠匯流排9 1 2 Α 週邊組件介面裝置，邊组件介面裝置914週邊组件介面匯;^ 第一匯流排橋接延伸工業標準架構或工業標準架構裝置工業標準架構/工業標準架構匯流排 924 中央處理器匯流排 928 L2快取 1012A 處理節點 1012C 處理節點 1016A 記憶體控制器 101 6C 記憶體控制器 1018A 介面邏輯 101 8C 介面邏輯 101 8E 介面邏輯 1018G 介面邏輯 101 81 介面邏輯 101 8K 介面邏輯 1020A 裝置 1024A 線路 1 024C 線路 1024E 線路 1 024G 線路 92525(修正本） 33

Claims

1338249 ff年fw日修正拾、申請專利範圍·· 附件 ^ ⑼曰案) 』· 一種微處理器，包括：一個或一個以μ 執行運算：Χ上之功能性單元，每—個經由配置以排程器’經由配置以藉由該性單元中之-個功能性單开…1個以上之功能 i軍曾夕— . 疋而發出用於執行之複數個 :母#運异，其中該排程器經由配置以 =數：運算之每-個運算的狀態資訊，其中該 …不疋否相關的運算已經完成執行·以々 “ 之一 ΓΓ,Λ元’經由配置以偵測出該複數個運算中 ^ 為了偵測出該複數個$ 异中之-個運算應該被重演 β〇是数個運 Μ ^ ^ ^ 、以肩偵測單元係配置成 »疋忒複數個運算中之該一個成被重筲# 士 A ^依存於另-個將債測^ 該複數個運算中之該-個運算受 '、：.，、而要被重演時，若該複數個夕、眾μ ,, 疋开甲之s玄一個運算運具例目前正由該一個或—個以上之功能性 :^功能性單元執行，則該重㈣測單元經由配置以 =對於該複數個運算中之該一個運算的狀態資訊之之執行。之。玄個運异之該運算例 2♦如申請專利範圍第丨項之微處理器，其中該重 ^由配置以藉由使料錢性單元巾之該_個功能為至^排程11之該運算例之非。代琥元成而禁止用於該等運筲中迷t中之忒一個運算之該狀 92525(修正本） 34 苐93105660號專利申請案 (99年9月！7曰）態為Sfl之更新β 3.如申請專利範圍第丨 _ 1 貝之微處理器，其中該重演偵測單凡、·里由配置以藉由使兮i 。 .°Λ排耘益修正相關於該等運算中之S亥一個運算之發屮 °十數而不止用於該等運算中之該一個運算冬該狀態資 '之更新，其中若該運算之發出計數並未符合該運算例、 < ^出°十數’則該排程器經由配置以不更新該狀態資訊以庫口馮4運异例之完成。 4·如申請專利範圍第1 „ Μ之微處理器’其中回應資料推測確認單元偵測到用於該斿赵 _ °茨複數個運算中之該一個運算之不正確的買料推測，該排程哭姑丄 > ▲ 排％裔經由配置以更新相關於該被數個運鼻中之該—/frjl J.J. Y哀個運异之該狀態資訊，以指示該相關的運算需要被重新發出。 5.如申料利範圍第4項之微處理器，其中當僧測到該不正：的貝料推測時’若該複數個運算中之該一個運算之運算例，由該一個或一個以上之功能性單元中之一個 ”元執行，該重演偵測單元經由配置以確保在該等運算中之忒一個運算之運算例之執行完成之後’相關 'β複數個運异中之該一個運算之該狀態資訊持續指示該相關的運算需要被重新發出。 •如申請專利範圍第！項之微處理器，復包括複數個重演偵測單元。如申：專利範圍第丨項之微處理器，其中該重演请測單 ^ 3方、’二由配置以確認資料推測執行於該複數個運算中之該一個運算之資料推測確認單元中，並且其中該 92525(修正本） 35 1338249 第93丨05660號專利申請素 (99年9月17曰) 之指示，以重演器以回應偵測正確的資料推資料推測確認單元經由配置以提供需求該複數個運算中之該一個運算至該排程用於該複數個衫令之該一料算之不測0 8. 如申請專利範圍第7項之微處理器，認單元包含於"配置 ββ _ 置以確D心貝枓預測之該等功能性旱兀中之一個功能性單元中。 9. 如申請專利範圍第7項處項之微處理态，其中該資料推測確早7"包^於經由配置以執行載入及儲存運算之該等功，性單it中之-個功能性單元中，以㈣㈣㈣認單兀經由配置以確認相依性預測。 !〇.如中請專利範圍第！項之微處理器，其中該重演債測單元包含於該排程器中’其中該重演價測單元經由配置以賴測該複數個運算中之-個運算應該被重演以回應該複數個運算中之該一個運算之來源運算元被重播於結果匯流排上。 11. 如申請專利範圍第i項之微處理器，其中該排程器經由配置以更新相關於該複數個運算中之該一個運算之該狀 k讯，以指示該相關的運算需要被重新發出以回應接收到該需要重演該複數個運算中之該一個運算之指示。 12. —種電腦系統，包括：記憶體；以及處理器，連結至該記憶體並且包括：一個或一個以上之功能性單元，每一個經由配置以 92525(修正本） 36 U^8249 第93105660 ¾專利申請案 (99年9月π日）執行運算； ° ”’二由配置以藉由該一個或一個以上之功能性單元φ夕__ Μ丄 ~ 個功能性單元發出用於執行之複數個運舁之每一個速首，〇·丄、卜逆异其中該排程器經由配置以維持用於該稷數個運算之每-個運算之狀態資訊，其中該狀態資訊指示是否相關的運算已經完成執行；以及重决偵測單元’經由配置以偵測該複數個運算中之 -個：算應:玄被重演’其中，為了偵測出該複數個運算中，個運具應該被重演，該重演偵測單元係配置成判疋:複數：運异中之該一個運算係依存於另-個將被重肩之運异’其中當偵測到該複數個運算之中之該—個運算需要被重演時，若該複數個運算中之該_ 運算例目前正由該一個或—個以上之功能性單元中^ -個功能性單元執行，該重演偵測單元經由配置用於該複數個運|中夕兮 ^連异中之忒一個運算之該狀態資訊新以回應该複數個運4 & 運开中之該一個運算之運算例之執行。 1 3.如申請專利範圍第12項之雷 „ _ 電月®系統，其中該重演偵，-p,丨單兀經由配置以藉由使啰肩彳貞測 …π 能性單元中之該-個功能性早兀執行該運算例成為固力非訊號完成而禁止對於該等運算之峨例之狀態資訊之更新。寺運异中之该-個運算之該】4.如申請專利範圍第12項之電腦系統單元經由配置以藉由0 /巾4重决偵測态修正相關於該等運算 92525(修正本) 37 第93l0566〇號專利申，安 ("年9月17日"j 中之該-個運算之發出計數而該一個運算之該狀態資訊之更新寺運具中之出計數並未符合該運算例之 :μ ^之該發配置以不更新$狀能4 出计數，則該排程器經由文新6亥狀態貧訊以回應該運算 1 5.如申請專利範 π成。測確切輩4 其中回應資料推、J確—早兀偵測到用於該複數個咬开甲之泫一個谨首不正確的資料推測，該排 ^ 该複數個運算中之該_ 4相關於 RS Λ, 建异之忒狀態資訊以指示哕相關的運算需要被重新發出。曰丁》亥 “.= t:專利範圍第15項之電腦系統，其中當偵測到$ 1的貧料推測時，若該複數個運算中之該一個運曾運异例正由該一個或一個以上之功能性單 f單元執行，該重演偵測單元經由配置以確保在。亥寻運异中之該一個选董夕，軍曾/丨 ,、 sq… 亥自運具之運异例之執行完成之後，相 ,t . ^ U運异甲之忒個運昇之該狀態資訊持續才曰不該相關的運算需要被重新發出。 ' 17^申請專利範圍第12項之電腦系統’其中該重演债測 =7L包含於資料推測確認單元中，該資料推測確認單元經由配置以確認執行在該複數個運算中之該一個運算推測，並且其中該資料推測確認單元經由配置1 提供需要重演該複數個運算中之該一個運算之指示至。玄排器以回應偵測到用於該複數個運算中之該一個運算之不正確的資料推測。 18·如申請專利範圍第12項之電腦系統’其中該重演偵測 38 92525(修正本) 1338249 苐93105660珑專利申請案 (卯年9月17日') 單元包含於該排程器中，其中 T…Τ这重演偵測單元經由配置以偵測該複數個運算中之一個 ^ 咬"ΓΤ'應忒被重凟以回廊或複數個運算中之該一個運苜 ^ 結果匯流排上。 ^之來源運算元被重播於 AH專利範圍第12項之電腦系統，其中該排程器經 _ · 建昇中之該一個運算之泫狀態資訊，以指示該相關的庙姐々W ]運弄需要被重新發出以回，接收制需要重演該複數個運算中之該一個運算之指示。 20.—種於資料推測微處理器中運質n + 防止進行中之運算例中斷運算重/臾的方法，包括：發出用於執行之運算之運算例；接續於該發出以及在該運曾建#例之執行期間，判定該運#係依存於另一個將被重該也要被重演；、之運县，且因此該運算應在該運算例完成之前，接示. 收°玄運异應該被重演之指回應該接收，禁止對於在令击此社徘矛玉益中之該運算之狀態之更新以回應該運算例之完成。 2 1.如申έ青專利範圍第2 〇項之方土其中該禁止包括使功月匕性早几執行該運算例成為非訊號完成。以成為至该排程器之該運算例之 …=利範圍第20項之方法，其中該禁止包括： 4目關於該運算之發出計數以回應接 92525(修正本） 39 1338249 收該運算應該被重演之該指示；以及若該運算之該發出叶數並# 。未付合該運算例之發出 τ歎該排魟益不更新相關於應該運算例之完成。 H亥狀態貧说以回 23:::_2°項之方法，復包括該排程器更新 ==之該狀態資訊，示該運算需要被重新 2“ ：運算應該被重演之該指示。 24.如申請專利範圍第2〇項之方法單元產生該運算應該被重演，括貧料推測確認 …資料推測執行=算…以回㈣測到不範圍第2°項之方法，復包括該排程器產生 μ异“被重演之該指示，以回應元被重播於結果匯流排上。 L之Μ運异 26.—種微處理器，包括：用於發出用於執行之運算之運算例之工具；用於執行該運算例之工具；以及八，測之測該運算應該被重演之工具，其中該用於偵 _ ^配置成若該用於偵測之工具判定該運算依二二—個將被重演之運算，則判定該運算應該被重 ’當該用於債測之工具偵測到該運算應該被重 ’、」’右該運算例在該偵測之前發出且目前正 :該用於偵測之工具係配置成禁止在該用於發出之：’ 中之4運算之狀態之更新，以回應該運算例之完成。 92525(修正本） 40 1338249 柒、指定v代表圖： (一）本案指定代表圖為：第（1 )圖。 (二）本代表圖之元件代表符號簡單說明： 100 微處理器 1 02 退返仔列 1 04 發 %«/ 迗單元 106 指令快取 108 預先取回單元 116 暫存器棺案 118 排程器 124 執行核心 126A 功能性單元 126B 功能性單元 126C 功能性單元 128 資料快取 130 結果匯流排 160 記憶體控制器 200 主記憶體捌、本案若有化學式時，請揭示最能顯示發明特徵的化學式: 本案無化學式。 4 92525(修正本）