TW200951811A

TW200951811A - System and method of selectively committing a result of an executed instruction

Info

Publication number: TW200951811A
Application number: TW098107159A
Authority: TW
Inventors: Lucian Codrescu; Robert A Lester; Charles J Tabony; Erich J Plondke; Mao Zeng; Suresh K Venkumahanti; Ajay A Ingle
Original assignee: Qualcomm Inc
Priority date: 2008-03-11
Filing date: 2009-03-05
Publication date: 2009-12-16
Also published as: US20090235051A1; JP5653762B2; JP2015043216A; KR101225075B1; CN101965554B; KR20100132032A; WO2009114289A1; JP5889986B2; US8990543B2; CN101965554A; EP2269134A1; JP2011517493A

Description

200951811 六、發明說明：【發明所屬之技術領域】本揭示案大體係關於一種選擇性提交已執行指令之蚌果之系統及方法。 "° 【先前技術】許多演算法基於某一條件選擇性地執行運算。在軟體程式碼中，可藉由使用比較指令，接著使用基於比較運算之結果視情況跳過程式碼之部分的分支指令，來實現此選擇性執行。一些架構可允許運算自身有條件地執行，藉此消除分支運算。然而’仍然存在對特定條件之結果的相關性。通常，在極長指令字（VLIW)處理器架構中，可執行比較運算’ 來自比較指令之結果可在某一正數目的處理器循環後利用。纟電腦程式中，比較運算後常為分支運算，在該情況下，比較運算之結果用以判定是否執行分支運算。通常，使用編譯器來組織指令以減少歸因此等相關性之管線暫停。在非VLIW處理器架構中，通常利用分支預測技術推測性地消除分支之相關性。然而，此分支預測增加了複雜性且增加了處理器核心之功率消耗。由於VLIW處理器架構具有按軟體分組之許多正在進行中的指令，故分支預測通常在VLIW處理器架構中受到限制或不存在 '然而，比較與分支運算之間的相關性仍然存在。因此，存在對於減少歸因於^日7相關性的皆線暫停之改良的處理器架構之需 138806.doc 200951811 求。【發明内容】在一特定實施例中，揭示—種方法，其包括在—具有包括第執行官線及一第二執行管線之複數個並行的執行 s線之處理器處接收一指令封包，該指令封包包括一第一指令相關於該第一指令之第二指令。該方法進一步包 ^並仃地執行該第—指令之至少—部分及該第二指令之至 ; ^方法亦包括基於與藉由該第一執行管線執行 4第#曰令有關之一第一結果選擇性地提交藉由該第行管線執行該第二指令之至少一部分的一第二結果。二另-特定實施例中’揭示一種方法，其包括在一具有 :數個並行的執行管線之處理器處接收—包括—比較指令弟一指令之；^^ 人曰7封^。該第二指令相關於該比較指々。該方法推_ 卜 ❹ —步匕括：解碼該比較指令及該第二指令以第:指交該第二指令有關—並行地执行選擇性操控:提:;線令:及部分基於該第二指令及該預測執行指令之ί個：例中’一種處理器包括經調適以並行地比較指令之第_ =官線。該多個執行管線包括—執行一第二指令之執仃管線及-執行-相關於該比較指令的時執行:該處該比較指令及該第二指令經同較指令之執行邦定m電路，其經調適以將自該比該第二執、弟結果自该第一執行管線提供至執仃管線用於由該第二指令使用。 138806.doc 200951811 由該系統及該等方法之實施例提供之—特定優勢在於，編譯器可將比較指令與使用比較指令之結果的分支指令一起分組至—單—封包中，用於由處理器同時執行，^引入與相關性有關之潛時。，提供另-特定優#，其在於，比較指令可與相關於比較運算之結果的諸如算術及記憶體載入指令之其他指令分組在一起且與其他指令並行地加以執行。提供再定優勢，其在於，此等指令可在同一循環中及在執行單元需要提交其結果前使用比較指令之結果，藉此防止不必要的寫入操作。在審閱整個申請案之後，本揭示案之其他態樣、優點及特徵將變得顯而易見，整個申請案包括以下部分：圖式簡單說明、實施方式及申請專利範圍。【實施方式】圖1為包括有條件地提交並行執行的指令之邏輯的處理器100之一特定說明性實施例之方塊圖。處理器1〇〇包括一經由匯流排介面108耦接至一指令快取記憶體i丨〇之記憶體 102處理器1 〇〇亦包括一經由匯流排介面1 〇 8麵接至記憶體102之資料快取記憶體ι12。指令快取記憶體11〇經由匯流排111耦接至序列器114。序列器114亦接收可自中斷暫存器（未圖示）擁取之一般中斷116。在一特定實施例中，指令快取記憶體110可經由複數個當前指令暫存器耦接至序列器114 ’該複數個當前指令暫存器可耦接至匯流排1〗J且與處理器10 0之特定線緒相關聯。在一特定實施例中，處 138806.doc 200951811 理器100為包括六個線緒之交錯的多線緒處理器。在一特定實施例中，匯流排U1為—百二十八位元028 位元）匯流排，且序列器114經組態以經由包括每一者具有三十二（32)個位元之長度之多個指令的指令封包自記憶體 • 1〇2擷取指令。匯流排111耦接至第-指令執行單元118、 . 苐二指令執行單元12G、第三指令執行單元122及第四指令執行單元124。每一指令執行單元118、12〇、μ、【μ可 _ 、經由第一匯流排⑶糕接至通用暫存器檔案126。通用暫存器播案m亦可經由第二匯流排130輕接至序列写114、資料快取記憶體m及記憶體102。在—特定說明性實施例中，資料快取記憶體112可包括—記憶體儲存緩衝器132以基於尚未判定之條件為待儲存之資料提供—臨時置。處理器100亦可包括-監督器控制暫存器134及全域於制暫存器136以儲存可由序列器内之控制邏輯存取以散是〇否接受中斷及控制指令之執行的位元。處理器⑽亦包括一述詞邏輯電路138及述詞暫存器140，該兩者麵接至執行單元m、m、122及124。在—特定實施例中述詞暂存 • ^40可包括四個讀取/寫入8位元暫存器，其保持純量及 ' 向量比較運算之結果。比較結果可由執行單元118、12〇、 ⑵及以經由匯流排142寫入至述詞暫存器14〇。述詞邏輯電路勵調適以自述詞暫存器14〇掏取資料且將比較提供提供至需要比較結果之選定執行單元。在-特定實施例中’述詞邏輯電路138可經礙入於每一執行I元川、 138806.doc 200951811 及124中，且可基於與分支指令相關聯的指示符之存在自述詞暫存器14〇擷取資料。舉例而言，分支指令可包括識別待用於分支指令之條件資料為在同-指令封包中包括的比較結果之位元設定或某一其他指示符。此指示符可觸發述詞控制邏輯自述詞暫存器14〇擷取比較結果。述詞邏輯電路138及述詞暫存器⑽由處理器⑽用以將來自第-執行管線之執行的早期階段的比較指令之結果提供至第二執行管線’用於與分支指令、邏輯運算指令（亦即，邏輯「及（AND)」、邏輯「或（〇R)」、邏輯「反及「互斥或（exclusive- (NAND)」、邏輯「反或（N〇R)」、邏輯〇R)」或其他邏輯運算）、載入指令、儲存指彳、算術指令、另一條件性指令或其任何組合一起使用。在一特定實施例中，述詞邏輯電路138經調適以擷取來自一執行管線之結果，用於由另一執行管線使用以允許分支在與產生比較結果（述詞）相同的執行循環内使用述詞。在一特定實施例中，分支指令可由執行單元12〇使用來自由執行單元118 執行的比較指令之結果在計算比較結果後的大致零觀測循環執行。雖然在習知VLIW架構中的比較運算之結果可在許多循環後利用，但處理器100利用述詞邏輯電路138以允許分支指令在自執行管線可利用之時間中接收比較運算之結果。因此，比較結果可由同一指令封包之分支指令在該等指令正並行執行的同時使用，亦即，分支指令在與正判定比較之結果相同的執行循環中接收比較結果。在一特定實施例中’述詞邏輯電路138經說明為在執行 138806.doc 200951811 單元118、120、122及124外部之電路組件。在一替代實施例中’述詞邏輯電路138可經嵌入於執行單元118、ι2〇、 122及124中之每一者内。在另一替代實施例中，述詞邏輯電路138可包括於序列器U4中。在一特定說明性實施例中，指令之封包係由序列器114 經由匯流排111自指令快取記憶體11〇提取。序列器丨丨4將指令提供至指定之指令執行單元118、12〇、122及124。該

等指令執行單元118、12G、122及124並行執行該等指令，

且視指令之間的相關性而定，指令執行單元US、I 122及124經調適絲於第—指令之結果有條件地提交來自第二指令之結果。舉例而言，在一特定實施例 H 第—杉令，其中第二指令相關於第一指令之结 =。處理器刚經調適以接受與流改變指令（諸如，跳躍指 I 令或其他流改變指令）、載人指令、健存指 " 、另—相關性運算或其任何組合-起分组之比較指令。詳古少 . ^刀，且之

-點處將比如。处理益100經調適以在執行管線尹之點處將比較運算之社I 夠早以Mm 述㈣存器⑽，該點足约早以使侍可將結果用於一分立、執仃擔裱中來判定是否選取疋入或儲存特定資料，判定第—έ士果i g _ 結果是否正確，或其任何组合。 -果或第- 在特疋實例中，處理器1〇〇可利用 132臨時儲存來自 …體儲存緩衝器之計算與將個執料元之結果，以提供結果隐肢102之寫回操作之間的延 138806.doc 200951811 遲舉例而5，*待將一條件或值提供至記憶體〗〇2時，記憶體儲存緩衝㈣2提供料。在無記憶體儲存緩衝器 Π2之情況下，可能過早地需要條件及值以致結果尚未準備好。記憶體儲存緩衝器132提供獲得條件之結果的足夠延遲。述詞邏輯電路〗38可控制執行單元ll8、i2〇、122及 124將結果寫入至記憶體儲存緩衝器132 ,直至判定一條件’及接著根據判定之條件將結果中之僅—者寫人至記憶體位置。舉例而言，處理器100可允許並行地執行比較指令及相關於來自比較指令之結果的分支指令。舉例而言，比較指令可由執行單元丨18處理，且分支指令可㈣由執行單元 120執行。》支指令可包括指示應自同—封包中之比較指 v而非自來自另一封包之先前執行之指令的結果導出比較 …果之位元或其他記法。在執行管線内，述詞邏輯電路 138可使比較私令之結果被提供至執行單元HQ，使得可在提交指令之結果前將結果用於分支指令中。藉由使比較運算之結果在執行管線中早早地可利用，在提交結果前，分支指令可使用該結果判定正相結果。由於通f早早地在管線中判定了分支方向，故分支指令通常不具有提取正確的下-個指令封包之時間以避免在選取一分支的情況下的 b ’’泉暫杇然而，在一特定實施例中，述詞邏輯電路丨3 8 亦可經調適以使用早先的比較結果判定是否選取該分支及/或預測7C否將提父執行管線之資料。述詞邏輯電路可與序列器114通信（例如’經由未圖示之匯流排）以起始提 138806.doc 200951811 取操作來根據預測擷取指令。圖2為有條件地提父並行執行的指令的處理器之一第二特定說明性實施例之方塊圖。處理器2〇〇包括一指令快取記憶體202，其經由匯流排2〇3與序列器2〇4通信。指令 . 快取記憶體逝可將指令之封包提供至序列器2G4。序列器 . 204與第一執行管線210及第二執行管線212通信以提供自才曰令之封包導出的指令。第一執行管線21〇及第二執行管 φ 線212執行該等指令且有條件地將指令之結果提交至錯存緩衝器216 若滿足條件，則提交至記憶體2 i 8。在—特定實施例中，記憶體218(諸如，資料快取記憶體）可耦接至一匯流排以將資料傳遞至一記憶體位置，諸如，在圖1之記憶體102處之位置。處理器200亦包括一控制邏輯電路2〇6及一述詞暫存器 2〇8。述詞暫存器·經調適以接收由帛一執行管線21〇及第二執行管線212執行的比較指令之結果。控制邏輯電路 Φ 2❽6經調適以將來自述詞暫存器2 〇 8之此等結果選擇性地傳遞至第一執行管線210及第二執行管線212中之一者，用於在並行執行的指令中使用。控制邏輯電路206亦可經由匯 * 流排207與序列器204通信。 - 在一特定實施例中，序列器204可經由匯流排2〇3自指令快取記憶體202接收包括第一指令及第二指令的指令之封包。第—指♦可相關於與第一指令之執行有關的結果。舉例而。，第一指令可為使用第一指令（諸如，比較指令）之結果判定是否選取一特定分支之分支指令。第一執行管線 138806.doc -11 - 200951811 可人執仃第—指令，及第二執行管線川可並行地執行第 ::二第一執行單元210將第—指令(亦即，比較指令)之至述詞暫存器208。第二執行管線212接收來自述 a司暫存器2〇8之έ士罢，釐-4b人要刻〜β 、·。果纟在第之執行期間使用該結制邏輯7 H指令之結果。在—特定實施例中，控制邏輯電路寫將結果提供至第二執行管線212。在另一特 ΐ=中’第—執行管線210及第二執行管_可包括控制邏輯電路206。 ❹ 人：二定實例中，序列器204可接收包括一第一比較指 ν及第一分支指令的指令之封包。第二八於第一比較指令之結果。在_特刀曰7 °目關 ^ 符疋貫例中，第二分支指今可使用嵌入於指令内之記法（諸如 ^ 位兀旗軚或其他指示 Γ八:二較指令之相關性。在第-比較指令及 ΐ:=Γ執行期間，第—執行管線21°將比較結果 ❹ ㈣與第二執行管線叫用二仃:Υ，：制邏輯電 Α八八用H ’第二執行管線2Ϊ2 在刀支“之執行中使用該結果。同時，控制挪可經由匯流排2G7將—信號提供至序列器2Q4以起始一美取細作’以自—記憶體擷取與流改變有關的指令。早先的指示（亦即，執行單元有可八之預測)可由序列器用以提改變程式流時。 #取相關的指令以減少管線潛在另一特定實例中，當第_指令為比較指令且第二卜為儲存指令時，第—執行管線川可心較結果寫入^ 138S06.doc -)2- 200951811 詞暫存If 208 ’且控制邏輯電路咖可在第二執行管線一結果前將該結果提供至第二執行管線犯。在此例中，可在起始寫回前取消與第二執行管線相關聯之寫回操作。 4者’可臨時地將f料提交至儲存緩衝器叫以在 . 目操作前提供額外的延遲，藉此允許將第—執行管線之比 .1 交結果用以防止不必要的寫回操作，在該情況下，不需要或可拋棄來自第二執行管線之資料。 Φ 在另—特定實财，可將比較指令與㈣於比較指令之結果的算術或記憶體載入指令一起分組在一封包中。第一執行管線210可執行比較指令且在執行循環中相對早時將結㈣供至述詞暫存器，且可在管線中之提交結果的階段之如取消條件性指令之結果。一般而言，執行比較指令，讀行單元21Q及212基於比較結果在述詞暫存器208中設定述詞位元。此等述詞位元可接著用以有條件地執行某些指令。分支指令、載入指 ® v儲存♦曰7，術指令及多工指令為此等可有條件地執打之指令之實例。可在述詞暫存器咖内之特定位元（諸 ."°，最低有效位元）上調節某些純量運算。相比之下，視特疋程式碼而定，向晉；重瞀量運异了利用來自述詞暫存器208之 . 較多位元。入般而。處理益2〇〇可用以並行地執行資料相關性指 ::舉例而言，此等資料相關性指令可包括使用來自載入或—較才曰7之資料的异術或其他數學或邏輯指令。在一特定實例令，载入指令可基於比較之結果自記憶體位置 138806.doc -13- 200951811 提取資料。在一特定實施例中，可使用特定組合語言記法 (諸如 ’ dot-new(亦即’「.new」）記法、d〇t_dependenta 即，「.dep」）記法、其他記法或其任何組合）來識別此等條件性或資料相關性指令。在一特定實例中，組合語言編譯器可經調適以辨認此記法且按一順序次序排列包括此記法的指令之封包。說明基於一比較指令（使用一「new」組合語言記法）之結果有條件地載入字的條件性載入操作之組合語法之一實例出現如下：若p〇為真，則載入字一在另一特定實例t，比較指令可用以判定選擇哪一運】元:且選定運算元可用於算術運算中。說明此條件性算相運算的組合語法之一實例出現如下·· if(P0.new)R0=SUB(R2，R3)//若抑為真則減 if(!P2.new)R2=ADD(R2，#4)//若”為假則加、在：一特定實例中，可計算多個結果，且比較結果可用以：疋應將哪一結果寫入至記憶體。或者，比較結果可㈣定是否應儲存該結果。說明—條件性儲存指令的租人 s吾法之一實例出現如下·· 、、’ 口 J^2.new)MEMw(R4)=R〇"若 p2 為假，則館存字通节’可執行任何數目個條件性指令，包移、移動或组人沪八％ bB 條件性轉之多動：,·且“令。說明一組合及轉移指貫例出現如下： σ D〇 ^ 則

^人 if (PO.new) R1:〇 = C〇MBINE(R3 R5)"若 Μ為真 if (丨P2.neW)R2=R5//若Ρ2為假，則轉移 i38806.doc -14· 200951811 -般而言’可辨認位元旗標、指示符或特定記法(諸如’·new(「.new」）記法），且可在封包中分組此程式碼以利用早先的比較結果來增強處理器效能。理器可並行地執行包括此等資料相關性指令之指钱包，使得計算-條件^在同—指令封包之執行期間使料算的條件之結果。舉例而言，來自一比較指令之執行的結果可在另-指令中用以判定是否提交該等結果（亦#，將結果

寫入至記憶體）。若條件指示不應提交結&，則可取消寫回操作。可使用dot-new記法的方式夕一寄丨。=» Q床叼万式之實例呈現於下表i及表2 中。表1呈現C程式碼之一會你丨（¾ p±„ κ 1例1:2羊又，及表2呈現使用dot- new記法的實例 C程式碼之一組合實施。表1 C程式碼。 C程式碼 if (R2==4) { R3 = *R4; else { R5=5; 用於支援dot-new類型之記法的# T田口„ , Α 犬只土 I ‘沄的處理益之組合級程式碼之一代表性實例呈現於下表2中。表2 組譯程式碼一Dot-New記法。組譯程式碼 138806.doc -15- 200951811 P0 = cmp.eq(R2,#4) if (PO.new) R3 = MEMW(R4)//使用新產生的 p〇 if (IPO.new) R5 = #5 } 在此實例中，比較指令及新產生的述詞之多個使用經分組於同一封包中。如上關於圖丨及圖2所論述，執行單元可在同一執行循環中執行比較及相關性指令。一般而言，封

包中之指令不能寫入至同一目的暫存器。組譯器或編譯器可將此等封包用旗標表示為無效。然而，允許條件性指令目標針對同一目的暫存器，其限制條件為提交結果中之不超過一者。

圖3為與執行管線300相關聯的多個執行階段之一特定說明性實例之圖。執行管線3〇〇經調適以執行一第一比較指令及一相關於第—指令之結果的第二指令。執行管線300 包括解碼階段302、一暫存器讀取階段3〇4、一第一執行階段3〇6、一第二執行階段3〇8、一第三執行階段310及一寫回階段312。在此實例中’省略了一或多個提取階段，且將執行B線3 〇〇說明為如同其開始於解碼階段3。在一特疋實例中’階段302、304、306、308、310及3 12中之每一者可表示時脈循環。在此灵例中’在第二執行階段期間判定比較結果（在3 14 )且該，’Ό果在3 1 0處之第三執行階段中用以基於該比較結果判定是提交還是取消該結果（在316處）。視正處理何類 138806.doc •16- 200951811 i之相關^日令而疋’在3 14處之比較結果經在執行管線 3⑻中足夠早地提供以允許控制邏輯操控提取管線減少暫停。在314處之比較結果由相關性指令使用「___」記法或指示來選擇。另外，在解碼階段302,可進行關於是否將選取跳躍或分φ > μ. 6堆及刀支之預测。在一特定實施例中，可使用靜態預測來進行預測。當有可能選取分支或跳躍時，預測可用以操控提取管線以進一步減少暫停。詳言之，由於比 ❹ 較之結果直至第二執行階段期才可利用，故可能太晚了 ;致不能在無管線暫停之情況下提取下-個指令。然而， ^由添加預測（亦即，「選取跳躍/分支」、「不選取跳躍/分」其他預測或其任何組合），控制邏輯可提取隨後指令以防止在流改變發生的情誤昧，π、主^ s線暫知。當靜態預測錯 =時’可清除提取管線，且可提取下—個指令封包用於處㈣中’多線緒處理器之每—線緒可解碼整個封…刀以預測及/或判定其可需要的結果。在另一特定〜,Λ X否將具有其 ^ , 5 特疋只例中，可取消寫回操作，藉此防止至通用暫存器檔案的寫入操作。在一特定實例令，為了計時目的，可能有必要在比較之从— 處）則在第二執行階段中提交至寫回摔圖艸說明夕了將、·•。果儲存於臨時暫存器中，諸如，在某-稍㈣^體儲存緩衝^32°記憶體儲存緩衝器可提交以儲存資I:點h至記憶體内。在此實例中，可延遲存㈣且制經緩衝之寫Μ防止應被取消的寫 138806.doc -17- 200951811 回操作。圖4為將指令編譯至包括一比較指令及一相關於比較指令之結果之第二指令的封包内之一方法之一特定說明性實施例之流程圖。該方法包括經由一或多個編譯階段將複數個極長指令字（VLIW)指令編譯至機器可讀指令中（在4〇2 處）。繼續進行至404,該方法進一步包括使機器可讀指令形成（亦即，分組）至包括指令之複數個封包中，該等指令可由多線緒處理器並行地執行。該複數個封包中之至少— 〇封包包括能夠同時執行之一第一指令及一第二指令。該第二指令相關於該第-指令。第—及第二指令經同時執行。在一特定實例中，第-指令之結果用以在同一處理循環中處理第二指令。方法終止於4〇6。在一特定實施例中，複數個^ 咖致個封包中之一封包包括目標針對同一目的暫存器之至少兩個 1、陶個條件性指令。雖然習知編譯裔可返回誤差，但可允畔 ° μ至夕、兩個條件性指令目標針對同—目的暫存器，其限制條# ^ 市仵為可提交僅一條件性指令。 ❹ 圖5為有條件地提交並行 ^ 0« μ ^ . 丁的私々的一方法之一特定 π月哇貫施例之流程圖。該執行管線之處理匕括在具有複數個並行的艮<處理器處接收包括一 #北人封包，其中第二指令相關於第H " 弟之複數個並行的執行管線可包括；：：結果(在502處)。該行管線。該第一指令可仃管線及-第二執於比較指令之姓里 7 ’及該第二指令可為基之結果之條件性指令。括並行地執行兮則進至504，該方法包 τ »褒第—指令卜 ^ 4分及該第二指令之至 138806.doc -18- 200951811 部分。在一特定實例及該第二指令之—部分，且第執行管線可解碼該第-令，及第二執行管線可同時執執行管線可執行第一指二執行管線可解碼第—指令二指令。舉例而言，第定與第一指令之—部分相關聯的：：以擷取—位元值或判 /繼續至506 ’執行管線判定是否提心令之第-結果指示應提交執。果。若執行第一 ❹ ❹ 即，寫入至通用暫存器槽案第J“之第二結果(亦體、至另一記憶體或其、 °己隐體、至快取記憶且提交執行第二指令之第_7^ ° )’則方法可前進至508，一結果。或者，若笛—& 不=交第二結果，則方法前進至”。，且取示之提父。在此個例中，方法包括基於與第—扑:结果關的第一結果選擇性提交執行第二指令之第二果Π 終止於512。心弟—結果。方法在一特定實施財括在執行得(讀取)第一及第二指令。第一指令之第一結果=取述詞結果。第-指令可為比較指令或產生述詞之另一類型之扣令。述詞可提供是是否將選取分支或流改變的早先指不。在-特定實例中，儲存指令可係基於比較指令而為條

件性指令。在此個例中，可基於比較之結果取消在執行管線之寫回階段的寫回操作。 S 在另一特定實施例中，指令之封包可包括使用來自同時執行的指令之述詞資料的第三指令。在一特定實例中基於該資料將第一向量與第二向量合併以產生合併之資科， 138806.doc -19· 200951811 且根據來自述詞暫存器之資料基於合併之資料輪出第量0 在另-實例中，第-指令為tb較指令，且第二“_ 躍指令。在此實例中’該方法包括解碼第―及第二扑入之一部分以預測是否將提交第二結果及根據㈣提包。在-狀實施例中，第二指令可包括㈣比較指令之第一結果應由第二指令使狀—位元或指示符。使第—果可用於第二齡，使得在提交第二結果前第二指令可^定一正確結果。在另-特定實例中，該方法可包括當不提2 第二結果時，取消由第二指令之執行而觸發的異常。在另-特定實例中，該方法可包括並行執行指令及基於述詞暫存器中之-位元判定第—指令及第：指令中之一者是否具有-有效述詞。該方法亦可包括根據有效述詞提交第一結果及第二結果中之一者，而非兩者。在另-特定實财，該方法可包括並行地將第—結果寫入至-第-位址及將第二結果寫入至一第二目的地位址。另外，該方法可包括當第-結果指示應抛㈣二結果時抛棄该第二結果。提交結果可涉及執行以下操作中之一者：寫回操作、儲存操作、載人操作、算術運算及流改變操作 (諸如，跳躍或分支操作）。圖6為根據預測的條件性流改變操控一提取之-特定說明性實施例之流程圖。在6〇2處，該方法包括在具有複數個並行的執行管線之處理器處接收一包括一比 138806.doc -20- 200951811 !指：及一第二指令之封包。該第二指令相關於該比較指 7 則進至604，該方法谁—半—1 指令以判定盥β ν匕括解碼比較指令及第二實例中八疋否將提交第二指令有關的預測。在-特定進^雜制可為㈣列㈣或在執行單元錢預測邏輯 = =預測。繼續進行㈣6,該方法包括並羽•仃第一指令及第二指令。，該方法包括部分基於第二指令且基於預測參 ❿ 、:可載入t選取」路徑操控提取管線。舉例而言，提取管「㈣敌選取路徑有關的指令。繼續至610，若果選擇性提交第二卜=至612,且基於第-結選定钟不正端h 結果°㈣’在㈣處’若繼續心財法前進至614,且清除提取管線。 Γ處：至616’該方法包括沿著「未經選取」(亦即，在未預測之路徑）路徑操控提取管線。、列將撰抱4實例中’分支可為推測性分支。若預測邏輯預測將選取推測性分彡，丹頂根據預測載入提取線。若預剩確則管線可經清除且經操控至不同路徑。 ^特疋實例中，選擇性操控提取管線指：且當預測指示流改變指令有可能被提交二 ^，通的机改變起始自記憶體的指令之操取。在另—實預測起選擇性操控提取管線包括當預測指示流改變時基於 :、始自記憶體的與流改變有關的指令之擷取。或者，菖預测不指示流改變時，τ ^ "" 在判定預測為不正確後始操取。在一特定實例令，後自提取管線刪除擷取之指令。 138806.doc -21· 200951811 在另一實例中，第二指令包括一指示第二指令使用比較指令之第一結果的指令記法。第一結果可用於第二指令，使得在提交第二結果前第二指令可判定一正確結果。在一特定實施例中’當不提交第二結果時，取消由第二指令之執行而觸發的異常。在另一實例中，該方法亦包括判定第一私令及第二指令中之一者是否具有一有效述詞及根據該有效述詞提交第一結果及第二結果中之一者，而非兩者。

圖7為經說明為攜帶型通信裝置7〇〇的經調適以同時處理相關性指令的一系統之一實施例之方塊圖。該攜帶型通信裝置700包括一數位信號處理器（Dsp)71〇，其具有述詞暫存二760、一述S5j邏輯電路762及一資料儲存緩衝器。在一特定實施例中，DSP 71〇可為多線緒處理器，諸如，圖1及圖2中所說明之處理器1〇〇及2〇〇。Dsp 71〇可經調適以利用述詞暫存器76〇及述詞邏輯電路762有條件地提交相互相關之並行執行的指♦，諸如，比較指令及使用比較之結果的分支指令。攜帶型通信裝置7〇〇包括一晶片上系統 722,其包括一處理器，諸如，數位信號處理器7丨〇。 710已括述4暫存器76〇及述詞邏輯電路762，如關於圖1至圖3及圖5至圖6所描述。在_特定說明性實施例中，述詞暫存器760及述詞邏輯762可心藉由允許第—執行管線斑正在執行循環中使践較結果處理相關性指令的第二執行管線共用比較結果來增強處理效率。另外，述詞暫存器、述詞邏輯762及資料儲存緩衝器—可用以有條件地將結果提交至記憶體，及“滿足條料取消或去掉寫 138806.doc -22· 200951811 回操作。圖7亦展示一耦接至數位信號處理器710及至顯示器728 之顯不器控制器726。此外，輸入裝置73〇耦接至數位信號處理器710。另外’記憶體732耦接至數位信號處理器 71〇。編碼态/解碼器（C〇DEC)734亦可耦接至數位信號處 . 理器710。揚聲器73 6及麥克風738可耦接至CODEC 734。圖7亦指示一無線控制器74〇可耦接至數位信號處理器 ❿ 710及至無線天線742。在一特定實施例中，電源744耦接至晶片上系統722。此外，如在圖7中所說明，顯示器 728、輸入裝置730、揚聲器736、麥克風738、無線天線 742及電源744可在晶片上系統722外部。然而，每一者耦接至晶片上系統722之組件。在一特定說明性實施例中，述詞邏輯電路762及述詞暫存器·可用以消除或減少不合需要之寫回操作，藉此增強擴帶型通信裝置700之整體效能。另外，述詞邏輯電路 Φ 762及述詞暫存器可心有條件地執行各種功能，此允許並行地執行相關性指令且拋棄不合需要之結果而無_ 處罰（就管線暫停而言）’此增強了裝置7〇〇之效能。 .應理解’雖然述詞邏輯電路762及述詞暫存器76〇經描繪 . ADSP 710之分開的組件’但述詞控制電路762及述詞暫存器760可替代地經整合至-控制電路内，諸如，圖【中說明之序列器114。類似地’應理解’述詞邏輯電路犯及資料儲存緩衝器764可經整合至多線緒處理器之執行f元中。熟習此項技術者將進-步瞭解，結合本文所揭示之實施 138806.doc -23- 200951811 2所福述之多種說明性邏輯區塊、組態、模組、電路及演异法步驟可實施為電子硬體、電麟軟體或兩者之組合。為青晰地”兒明硬體與軟體之此可互換性，各種說明性組件、區塊、組態、模組、電路及步驟已在上文大體按其功能性加以了描述。將此功能性建構為硬體還是軟體視特定應用及強加於整個系統上之設計約束而定。熟習此項技術者可以變化的方式針對每—特定應用實施所描述之功能性，但是此等實施決策不應被解釋為會導致脫離本揭示案之範嘴。結合本文中所揭示之實施例所描述之方法或演算法的步驟可直接體現於硬體令、由處理器執行之軟體模组中或兩者之組合中。軟體模組可駐留於ram記憶體、快閃記憶體、ROM記憶體、PR0M記憶體、EpR〇M記憶體 E㈣OM記憶體、暫存器、硬碟、抽取式碟片、cd_r〇m 或此項技術中已知之任一其他形式的儲存媒體中。將例示性儲存媒體耗接至處理器，使得處理器可自儲存媒體讀取資訊及將資訊寫入至儲存媒體。在替代例中’儲存媒體可整合至處理器。處理器及儲存媒體可駐留於ASK中。 ASIC可駐留於計算裝置或使用者終端機中。在替代例中，處理器及儲存媒體可作為離散組件駐留於—計算裝置或使用者終端機中。提供所揭示之實施例的先前描述，以使任何熟習此項技術者能夠進行或使用所揭示之實施例。對於熟習此項技術者而言，對此等實施例之各種修改將易於顯而易見且在 138806.doc -24- 200951811 不脫離本揭示案之精神或範疇的情況下，本文中界定之一般性原理可適料其他實施例。目此，本揭讀並不欲限於本文中所展示之實施例’而應符合可能與如由下列申請專利範圍界定之原理及新穎特徵相—致之最廣泛範嘴。【圖式簡單說明】。圖1為包括有條件地提交並行執行的指令之邏輯的處理器之一特定說明性實施例之方塊圖；

圖2為有條件地提交並行執行的指令的處理器之一第二特定說明性實施例之方塊圖；一圖3為包括多個執行階段之—執行循環之—特定說明性實例之圖，其說明基於來自第-比較指令之執行之一第一結果的一第二結果之選擇性提交；相關於比較指特定說明性實圖4為將指令編譯至包括一比較指令及— 令之結果之第二指令的封包内之一方法之— 施例之流程圖；圖5為有條件地提交並行執行的指令的—方法之一特定 s兒明性實施例之流程圖；圖6為根據預測的條件性流改變操控—提取管線的方法之—特定說明性實施例之流程圖；及圖7為包括有條件地提交並行執行的指令之邏輯之代表性攜帶型通信裝置之方塊圖。【主要元件符號說明】 1〇〇處理器 102 記憶體 138S06.doc -25- 匯流排介面指令快取記憶體匯流排資料快取記憶體序列器一般中斷第一指令執行單元第二指令執行單元第三指令執行單元第四指令執行單元通用暫存器檔案第一匯流排第二匯流排記憶體儲存緩衝器監督器控制暫存器全域控制暫存器述詞邏輯電路述詞暫存器匯流排處理器指令快取記憶體匯流排序列器控制邏輯電路 -26- 200951811

207 匯流排 208 述詞暫存器 210 第一執行管線 212 第二執行管線 216 儲存緩衝器 218 記憶體 300 執行管線 302 解碼階段 304 暫存器讀取階段 306 第一執行階段 308 第二執行階段 310 第三執行階段 312 寫回階段 314 步驟 316 步驟 700 攜帶型通信裝置 710 數位信號處理器（DSP) 722 晶片上糸統 726 顯示器控制器 728 顯示器 730 輸入裝置 732 記憶體 734 編碼器/解碼器（CODEC) 736 揚聲器 138806.doc -27- 200951811 738 麥克風 740 無線控制器 742 無線天線 744 電源 760 述詞暫存器 762 述詞邏輯電路 764 資料儲存緩衝器 138806.doc -28-

Claims

200951811 七、申請專利範圍： 1· 一種方法，其包含：在7具有包括一第-執行管線及一第二執、數個並行的執杆其始夕老 g線之複執仃e線之處理器處接收-指令封4 令封包包括一第一指令月+ 封包，該指令； l及-相關於該第-指令之第二指 φ 並行地執行該第一指令之至少一部分至少一部分；及乐一札令之士於與藉由該第一執行管線執行該第一第結果而選擇性地提交奇之— 一才曰令之該至少—部分的—第二結果。仃該第 2·如π求項1之方法，其中該第 _ 結果待由嗲筮_ 7己括‘不該第— 由忒第一指令使用之指令記法。 3.如請求項丨之方法，其進—牛之資、 ^匕3將與該第一結果有關之貝科寫入至—述詞暫存器。衣百關 4·如請求項3之方法，其收與該第—社果^、“第二才曰令自該述詞暫存器接呆、、、》果有關之該資料。 5.如請求項〗之方法，A 將診八選擇性提交該第二結果包含： μ第—結果寫入至— 举妹吐己匕體儲存緩衝器；及田°〆第一結果可利，一寫回操作。選擇性地取消至一暫存器的 6.如請求項1之方法，其令變指a _ μ第一 A令包含一條件性流改 7，該方法進—步包含：在該第一執行管線及該第二執行管線中之-者的-解 138806.doc 200951811 碼階段處解碼該第_指令及㈣基於該經解竭之部分執行一指示是f部分；及件性流改變指令之靜H_。否有可能提交該條 7. 如請求項6之方法，其進_步包含可能提交該條件性流改變指令時，預測指示有以彌取與-流改變有關的指令。^控-指令提取管線 8. 如請求項1之方法，其進—击台人一 έ士果#古故、’ 3在判定是否提交該第 ^後’有條件地將該第二結果寫回至-目的暫存 9. 如請求項1之方法，直中嗲筮，、甲这第一指令包含一比較指令且該第二指令包含-流改變指令，該方法進一步包含：基於該第一結果而在一述詞暫存器中設定-述詞位元；及在執行該流改變指令後，基於該述詞位元之—值而選擇14提父以執行由該流改變指令指示的一流改變動作。 10. —種方法，其包含：在一具有複數個並行的執行管線之處理器處接收一包括一比較指令及一第二指令之封包，該第二指令相關於該比較指令；解碼該比較指令及該第二指令以判定一與是否將提交該第二指令有關的預測；並行地執行第一指令及該第二指令；及部分基於該第二指令且基於該預測而選擇性地操控一提取管線。 138806.doc -2- 200951811 11.如凊求項10之方法，其中選擇性操控該提取管線包含當該第二指令為一流改變指令且當該預測指示該流改變指令有可能被提交時基於一預測的流改變起始自記憶體的指令之擷取。 12·如請求項10之方法，其中選擇性操控該提取管線包含當該預測扣示一流改變時基於該預測起始自記憶體的與一机改變有關的指令之擷取，但當該預測不指示該流改變時不起始擷取。 13. 如印求項u之方法，其進一步包含在判定該預測不正確後自該提取管線刪除該擷取之指令。 14. 如請求項10之方法，其進„步包含至少基於與與一第— 執行管線相關聯的該第一指令有關之一第一結果而選擇性地提交藉由-第二執行管線執行的該第二指令之 '—結果。 15‘如請求項14之方法，其中該第_ 弟—指令包括一指示該第二 # 指令使用該比較指令之該第—社 …果的指令記法，且其中在提交該第二結果前該第一处里- 、。果可用於該第二指令。 16.如請求項15之方法，其進—步 ^包含當不提交該第二结果 . 取消由該第二指令之執行而觸發的異常。 Π.如請求項10之方法’其進一步包含. 判定該第一指令及該第二指人由— 曰7中之—者是否具有一有效述詞；及 < 1心又琢弟一指兮之一第結果及該第二指令之一第-姓s a 結果中之一者，而非兩 138806.doc 200951811 者。 18. —種處理器，其包含：多個執行管線，其細執行管線包括-執行指令，該多個，广線及-轨行—相關於第—結果之第 -結果的第二指令之第 /令匈定之該第二指令經同時地執行；1 s、’ ’邊第1令及該第邏輯電路，其經調適以將該第一結果自該第1料線提^至之執行判定的於由該第二指令使用。 Μ第一執行管線用 ❹ 其中在提交與該第二執行管線相该邏輯電路將該第—結果提供至 19. 如凊求項18之處理器關聯的一第二結果前該第二執行管線。 20. 如請求項18之處理器，苴述詞暫存器對該多個執；述詞暫存器’該館存與該第一結果有關之資料^係可存取且經調適以〇 21. 如請求項18之處理器，其進一步包含一接收包括該第一才曰々及δ亥第二指令的_ _ ^ ^令之封包之序列器，該序列器將該第一指令提供至兮钕、弟一執行管線且將該第二指令提供至該第二執行管線。 22. 如請求項21之處理哭， °° '、中e玄第一指令包含一比較指 7且'、中°玄第-指令相關於該比較指令之一執行結果且，、中β亥第一指令包含一算術指令、一邏輯運算指 7 載入心令、一儲存指令、-分支指令及-跳躍指 138806.doc -4· 200951811 令中之至少一者。 23. 如請求項18之處理器，其進一步包含一記憶體缓衝器，其柄接至該多個執行管線以在提交來自該第二指令之執仃的-第—結果前提供—^夠獲得來自該第—指令之執行的該第一結果之延遲。 24. —種處理器，其包含： * 肖於在一具有包括-第-執行管線及-第二執行管線 ❹ 之複數個並行的執行管線之處理器處接收一指令封包之構件幻"封包包括一第一指令及一相關於該第令之第二指令；扣用於並行地執行該第一指令之至少一部分及該令之至少一部分之構件；及 ^ 用：基::藉由該第一執行管線執行該第— :广結果而選擇性地提交藉關該第二指令之該至少_部分的卩官線执仃 9 S ^ 第—結果之構件。〇月未項24之處理器，其進一步包含：用於將該第二結果寫入至a 件；及罵入至—5己憶體儲存緩衝器之構 • 用於當該第一結果可利用時選擇.Ht从衝、、、占 - 的—寫回操作之構件。 /至一暫存器 138806.doc