TW299421B

TW299421B -

Info

Publication number: TW299421B
Application number: TW085107767A
Authority: TW
Original assignee: Hitachi Ltd
Priority date: 1995-06-28
Filing date: 1996-06-27
Publication date: 1997-03-01
Also published as: JPH0916471A; US5893143A; KR970002618A; JP3598589B2; KR100248440B1

Description

經濟部中央標準局員工消費合作社印袈 A7 ____B7 五、發明説明（1 ) 本發明之背景：本發明係關於一種處理器，一種輔助處理器，和一個裝載著此類處理器的延伸板，這些裝置是使用在一種例如是個人電腦的資訊處理系統。相關技術之敘述：目前處理器架構的主流已指向精簡指令集計算機（簡稱爲R I SC系統），R I SC系統的特點是它並沒有很複雜的指令且固定其指令的長度•因爲各個指令很簡單，所以R I S C系統的處理速度非常快，且因爲各個指令的長度是固定的，所以在一次記憶體的存取動作中即可讀取 —個指令，這些特點提升了處理速度· 爲了改善RISC處理器的處理性能，在RISC處理器中使用一種超純置系統成爲目前的趨勢•超純量系統在運作上可使得其處理器內部的工作單元在執行運算時，能針對硬體作動態的排程。這種系統的好處是可使用過去的軟體資源而無需作更改，而其缺點是它無法使用足夠的資訊進行排程，因爲是在運算執行時才進行排程，進而強化其平行的程度。爲獲致較超純童系統更髙的性能，已有人提出一種極長指令字（簡稱爲VLIW系統），本系統是在程式進行編譯時，以軟髖處理的方式對包含在處理器中的工作單元 -C 1~~ 採取統計式的排程步驟，將會平行執行的一組指令集合成一個指令集，在處理器執行該程式時一次讀取一個指令集本紙張尺度適用中國國家標準（CNS > Λ4規格（210X297公釐） ----„------^-- 請先閲讀背面之注意事\.填寫本頁) 訂線 -4 - A7 _____B7 五、發明説明（2 ) ，然後執行該指令集。VL IW系統並不需要硬體來作f I，因此具有提升平行程度的好處，相反的，其缺點是一個指令集將變得很長，因爲多個指令集合成一個指令集。超純置系統和VL IW系統的介紹可見MLIW: The wave of the Future?^ Microprocessor Roport ，第 18至21頁，1994年2月。 —般而言，一個程式裡具有平行程度高的一部份以及平行程度低的另一部份，各部份的實例可以圖1和圖2加以說明，在圖中，各列代表一個處理，例如，圖1中的第 1列處理8 0 0 a代表著將1與一變數X0的內容相加，並且將相加的結果取代一個變數Y0 ，這些處理是一個接著一個來執行。圖1顯示高平行程度的部份，在此部份中的處理是彼此不相關的，因此可平行地執行。例如，在第2列處理 8 0 0 b中所使用的變數X 1值可在第1列處理8 0 0 a 執行前加以確定，因此，第1列處理8 0 0 a和第2列處理800b可平行來執行· 經濟部中央標準局員工消費合作社印製 --.--„------裝-- (請先閱讀背面之注意事&填寫本頁) 此外，圇2顯示平行程度低的部份，在此部份中，是由前一個處理來計算出各個處理的數值，因此*直到前一個處理完成，前的處理才能進行，例如，使用在第2列處理8 1 Ob中的變數XI值在第1列處理8 1 0 a執行後才能被定義，在正常情況下，在第1列處理8 1 0 a結束前，是不允許開始執行第2列處理8 1 0 b的。圖3顯示針對圖1中的程式•顯示轉換後的一個本紙張尺度適用中國國家標準（CNS ) Λ4規格（210X 297公釐） A7 j----------B7 五、發明説明（3 ) VL IW系統指令（簡稱爲—個IW指令），圖4則針對圖2中的程式，顯示—個轉換後的vl I W指令•這些VL I W指令可以在同一時間執行4個處理，在這個圖中’一列代表著一個VL I W指令，這些指令由上而下即時地被執行，圖3所示的V L I W指令是由高平行程度部份轉換而得（見圖1 )，在這些指令中，一個指令一次可執行4個處理’因此，相較於傳統僅具單—處理單元的處理器，這些VLIW指令可獲致4倍的性能。另一方面，圖4中的VL IW指令是由一個低平行程度的處理轉換而得（見圖2 )，在這些指令中，一個指令一次僅能執行一個處理，因此，雖然處理器使用的是可一次執行4個處理的VL IW系統（簡稱VL IW處理器') ’也僅能達成與僅具單一處理單元之處理器相同的性能。因爲即使在沒有處理可執行的部份中也必須保持指令長度爲固定’有必要插入一個不動作指令（non_operati〇nal instruction )(簡稱爲NOP )以表示沒有任何動作發生’因此，指令的長度會比實際的處理內容爲長。

當VL IW處理器執行的是一般的程式時，NOP會有極髙的佔有率，換言之，Ν Ο P佔據了一個資訊處理設備的主儲存容量，而此資訊處理設備具有一個VL I W處理器（簡稱爲VL IW系統）或者存在於此VL IW處理器內部大部份的指令快捷記憶體（簡稱一個快捷記憶體），因爲Ν 0 P的存在，而浪费主記億體的空間，或者快捷記憶tl的容置將會過於龐大，其引發的問題是· V L I W 本紙張尺度通川中國國家標孪（CNS ) A4規格(2丨0X297公慶) " * 6 - 請先閲讀背面之注意事填寫本頁 .裝· 訂線經濟部中央標準局員工消費合作社印製 299421 A7 經濟部中央標準局員工消費合作社印製 B7五、發明説明（4 ) 處理器的性能無法如預期般的高、V L I W系統的成本過髙，而VL IW處理器晶片過大且造價昂貴。因V L I W處理器所引發的問題可見” Basic Arrangement of Reconstructed VLSI Computer based on Execution Delay", Reports of Information Processing Society, Computer Architecture, NOS. 89 to 13,第 87 至 93 頁，1991 年 7 月 19 日’ Information Processing Society。若能排除主記憶體因N 0 P所造成的負擔，則可有效率地使用VL I W系統的主記億體，在”A VLIW Architecture for a Trace Scheduling Compiler", IEEE, Transaction on Computers, VOL 37， No.8,第 967至979頁，1988年8月之論文中提及將 N 0 P自主記憶體中去除可節省記憶體容置的技術。爲減少存在於VL I W處理器中的快捷記億體容置，在此提出一個方法，此方法採用的步驟包含了在將指令存入快捷記憶體時壓縮該指令，自快捷記億體中讀取被壓縮 - — 的指令，然後解壓縮此指令，此技術見於"Phillips Holes to Displace DSPs With VLIW", Microprocessor Report,第1 2至第15頁，1994年11月5曰， Micro Design Resources" - I ί -- -I 1--- - - _ - —ί I (請先閱讀背面之注意事ί,1·填寫本頁) 線升量提容本憶成記低捷降快可的統中系器的理 Ρ 處ο W Ν I 除 L 清V 中爲區因儲，存能主性。自的變匕匕导 TTMl 理處並本紙張尺度適用中國國家標準（CNS ) Λ4規格（210X 297公釐） -7 - 經濟部中央標準局員工消費合作社印¾. A7 _____________B7 _五、發明説明（5 ) 此外，在系統中，當指令存入處理器內的快捷記憶體時壓縮該指令，以及當自快捷記億體讀出指令時解壓縮該指令的作法會發生一個問題，亦即在分支點上會造成大的損失，因爲在管線（pipeline)中會插入一級解壓縮的處理以便執行該指令，且因此位於管線處理中的較深處。換言之，指令的解壓縮將浪费一個或兩個週期，這也包括處理器晶片內部出現的拉線延遲，因此，執行指令所使用的管線將延長了一或二級。若這些指令是以適當的次序來執行，則經常可將這個延伸的狀況忽略。若指令的執行次序因分支指令的出現而更改時，則會發生一段未執行指令的時間，一般而言，此執行管線越深，則這段時間將會越長。對於用以平行執行指令例如是V L I W處理器此類旳處理器而言，將造成一個更大的問題，假設無指令執行的一段時間超過二個週期時，僅能執行一個處理的傳統處理器在最差的狀況下將會禁能只執行二個處理，然而，能一次執行4個處理的VLIW處理器在最差的情況下將禁能最多8個處理，當平行執行的處理數目愈大，則這種損失會愈大。爲取代減少的快捷記憶體，用以解析指令的附加硬體是必要的。本發明的總結：本發明的目的之一是提供一個具有快速處理能力的廉請先聞讀背面之注意事\/4填寫本頁) -裝. 訂線本紙悵尺度適用中國國家標準（CNS ) A4規格（21〇Χ297公釐） A7 B7 五、發明説明（6 ) 價V L I W處理器。本發明的目的之一是藉由有效使用协様IH僚體，以提供一種具有較小容量快捷記憶體和較小晶片面積的廉價一 .. _ V L I W處理器* 本發明的目的之一在提供一種方法，以配置適用於 V L I W處理器的快捷記憶體。本發明的目的之一在提供一種具有快速處理能力且不需加深管線的VL IW處理器^ 爲達成上述目的，本發明所提出的處理器具有若干個能平行執行的處理單元，這些處理單元的執行次序僅由一〜 — ------ 數器來控制；這個處理器亦包含配合上述處理單元以存放處理單元所執行之指令的若干快捷記億體，一個可針對存放在快捷記憶體中之指令，存放其位址資訊的檫記記憶體；和一個能將指令分割爲若干個配合處理單元之指令欄位的儲存控制電路，若自外部讀取由一程式計數器指示之位址所指定的指令，此儲存控制電路亦用以將這些指令欄位存入配合處理單元的快捷記憶體。依據本發明，若能㈣快捷記憶體的容量’則可在不

_ —I 需作指令解析的情況下自快捷記憶體讀出的指令’因此，用以執行指令的管線可減少長度’如此因執行分支指令所發生的損失將降至最低。再者，在各個處理單元中的NO P發生率是各別的’ NOP並未存放在快捷記憶體中，因此，可依據除了 n 〇 p之外的指令發生率來設定快捷g拿，這種本紙張反度適用中國國家標準（CNS ) Λ4規格（210X297公釐） ^-- (請先閲讀背面之注意事.^蜞寫本頁) 訂線經濟部中央標準局員工消費合作社印裝 -9 - 經濟部中央標準局員工消費合作社印製 A7 __B7 五、發明説明（7 ) 作法可提升快捷記憶體的使用率，進而在相同的晶片面稹中獲致較高的處理性能· 如上述，依據本發明，編譯器在工作時將針對任何非 Ν Ο P的指令，賦予其分配至一特定群集的優先次序，這種作法使得我們能夠變更各個群集內快捷記億體的容量， -- **--- 進而改善快捷記憶體的使用效率，最後可以實現相同性能，但卻可減少快捷記憶體的容量，此外，也因此而降低了處理器的成本。此外，我們可以降低在處理器中配置在快捷記憶體至處理單元的電路數目，這些電路的作用是可供讀取自快捷記憶體的指令通過，因此，可降低指令管線的I塞，且可 m. —' ^少在執行i分支指令時所造成的損失，進而提升處理器的泰― 薩— 速度。因爲降低了快捷記億體的容量，所以快捷記憶體的位置可以很靠近各個工作單元，進而減少拉線的區域，並且有效提升工作速度。上述的作法實現了一個成本低而具快速處理能力的 V L I W處理器· 附圖之簡述：圚1顯示一個高平行程度的處理部份實例：圖2顯示一個低平行程度的處理部份實例；圖3針對圖1中的部份，顯示一個VL丨界指令的實例；本紙張尺度適用令國國家標準（CNS ) Λ4規格（21〇X 297公釐） ----------^------IT------^ (請先閣讀背面之注意事h填寫本頁) -10 - 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明（8 ) ®4針對圖2中的部份，顯示一個VL I W指令的實例；闽5中的方塊圖依據本發明的一個實施例，顯示快捷 15憶贈周邊的電路配置：阖6顯示一個使用在本發明之實施例中的壓縮指令實例；阖7顯示一個使用在本發明之實施例中的程式計數器實施例；圖8顯示快捷記憶體的配置：阖9顯示在快捷記憶體中標記部份的配置；圖1 0中的流程圖顯示了整個快捷記憶體的操作程序 » 圖11中的方塊圖顯示了標記記憶體和位元確定電路的配置；圖12的方塊圖顯示一群集A之快捷記憶體的配置；圖13的方塊圖顯示群集B至D之快捷記億體的配置

I 圖14中的列表顯示出群集A之選擇器的控制信號；以及圖15中的列表顯示出群集B至D之選擇器的控制信號。最佳實施例之詳述：以下將配合圖5至9 ，說明本發明之—實施例中的處本紙張尺度適用中國國家標準（CNS ) Λ4規格（210X 297公漦） -1 1 _ 批衣-- (請先閲讀背面之注意事5k.填寫本頁) -β 線經濟部中央標準局員工消費合作社印製 A7 ______B7_ 五、發明説明（9 ) 理器配置。圖5中的方塊圖針對使用一處理器1的資訊處理設備顯示其中處理器1的配置以及處理器1與主儲存區5相連的方式，數字5代表一個主儲存區，用以存放處理器1將執行的指令以及執行所需的資料，主記憶區5的位置是在處理器1的外側，在處理器1和主儲存區5之間的連接匯流排具有3 2位元的寬度，數字1 〇 a至1 0 d代表著組成處理器1之基本部份的群集，各個群集是由一個用以存放一個指令的指令快捷記憶體1 0 0(簡稱爲快捷記憶體），一個用以執行各類處理例如一個運算的處理單元1 1 0 ，以及一個用以選取一個指令供處理單元110執行的選擇器1 2 0。爲分辨存在於各個群集中的各個元件，可加入下標，例如a至d，以及快捷記億體100a (代表群集A的快捷記億體），在本實施例中，假設處理器1是一個可一次執行4個指令的VL I W處理器，因此存在有4 個群集A至D · 數字2 0代表一個快捷記憶控制電路，這個快捷控制電路2 0包含一個擊中（hit )確定電路2 2 0，一個填入控制電路2 1 0以及一個檩記記憶體2 0 0 ;其中，擊中確定電路2 2 0用以確定待執行的指令是否存在於快捷記憶體1 00 a至1 00d中。填入控制電路2 1 0用以自主儲存區5中讀取一個指令，並將此指令存入快捷記憶體1 0 0 a至1 0 0 d ·而標記記憶體是用以存放與存放在快捷記憶體1 0 0 a至1 0 0 d中之指令相同的資訊。本紙張尺度適用中國國家標準（CNS ) A4規格（210X 297公釐） ----------^-- (請先閱讀背面之注意事填寫本頁) 訂線經濟部中央標準局員工消費合作社印敦 A7 ____ _B7_ 五、發明説明（i〇) 數字4 0代表一個控制著處理器1所有工作的總控制 «— — 器，這個總控制器4 0具有一個程式計數器3 0，程式計數器3 0是一個指標，用以指向進入指令的一個位元組位址，且當指令被執行一次，就會更新一次，爲了存取快捷記憶體1 0 0中的指令，將會直接使用程式計數器3 0中的數值· 總控制器4 0和填入控制電路2 1 0兩者內部均具有 —個順序器，控制器40和電路210均在此順序器控制下工作。圖6顯示了一個VLIW指令的組成· 數字7 0 0代表一個當平行處理進行排程時的特定 ¥乙1贾指令，這個乂1^1界指令7 0 0是由4個以一對一方式與群集1 0 a至1 〇 d對應的4個指令欄位所組成。各個指令欄位N (N20) — a至d是一個使用在各個處理單元1 0 a至1 〇 d中的指令檷位，在本實施例中，一個檷位包含有3 2個位元（4個位元組），數字7 10 代表了一個壓縮指令字串的儲存型式，其中，可在主儲存區5中去除Ν Ο P所作用的指令欄位。數字7 0 2代表一個顯示在各個指令中的指令欄位是否存在有Ν Ο P的旗標組，此旗標組被稱爲遮罩資訊，這個遮罩資訊7 0 2係存在於各個VL IW指令中且由4個位元所組成，其中的各個位元對應於4個群集中的各個群集•在執行指令時，遮罩資訊允許Ν Ο P再被插入指令檷位，在群集A所屬的指令欄位n — a中，即使是NO P亦 ^紙张尺度適用中國國家標準（CNS > Λ4規格（210X297公釐) ：~ -13 - ----------1^------1T------^ (請先聞讀背面之注意事^:填寫本頁) 經濟部中央標準局員工消費合作社印聚 A7 _B7 五、發明説明（11 ) 未予以清除’以下將有所說明。數字720代表一個 VL I W指令的讀取型式，這個VL I W指令是存在於處理器1的快捷記憶體中’以下有較詳細的說明。圖7顯示程式計數器3 0的配置，它具有2 4位元的寬度且可分割爲3個檷位。在圖7中’數字3 00 a代表一個用以和位址標記資訊2 0 1相比較的位址檩記，比較的結果用來確定是否擊中（hit )快捷記憶體，而上述的位址標記資訊2 0 1是存放在標記記億體2 0 0 (以下有所說明）。數字300b代表一個位址項選擇部份，以選取標記記憶體2 0 0和快捷記憶體1 0 0中的各個位址項。數字3 0 0 c代表各個位址項中所放置之指令的偏移值，在本實施例中，位址標記3 0 0 a，位址項選擇部份 300b和偏移值300c分別具有13位元、6位元和 3位元的寬度。指令檷位的大小可固定在3 2位元，並分佈在4個位元組的範園內。程式計數器3 0的最低2個位瓦固定爲零· 圚8針對位於群集a至d中的快捷記憶體1 〇〇 a至 1 0 0 d，顯示各個快捷記憶體的配置和容量，群集A中的快捷記億體1 0 0 a具有4 k位元組的容量，群集B至 D中的各個快捷記憶體1 〇〇 b至1 〇〇 d則具有2 k位元組的容量，快捷記憶體1 0 0 a使用的是一種雙道J相關系統，而快捷記憶體1 0 0 b至1 0 0 d使用的是單道組相關系統，各組的容量等於2 k位元組· 由1 0 0 a至1 〇〇 d之各個快捷記憶體中的線寬是本紙張尺度適用中國國家梯孳（CNS ) A4規格（210X 297公釐） ---------^-- 請先閱讀背面之注意事^ι-ν,.ρ填寫本頁) 訂線 -14 - 經濟部中央標準局貝工消費合作社印製 A7 __B7_ 五、發明説明（l2 ) 等於8個指令檷位（4個位元組x8 = 3 2個位元組）· 1 0 0 a至1 0 0 d中的各個快捷記憶體同樣是由6 4個記錄項（2 k位元組/3 2個位元組）所組成，各個記錄項是由一個共有的記錄項位址來指定。在本實施例中，快捷記憶體是由一個位址512和一個讀/寫資訊以及4個位元組寬度所組成，這樣的作法可避免在讀取指令時需要一個8選1的選擇器，且可避免若讀/寫資訊寬度被設定爲適用於線寬度之32位元時所造成電力消耗增加的問題〇圖9顯示在群集1 0 a至1 0 d中共用之標記記憶體 2 0 0的配置，標記記憶體2 0 0使用一個對應於群集A 的雙道配置，標記記憶體2 0 0具有6 4個記錄項，各個記錄項包含二個區域，用以存放1 3位元旳位址標記資訊 2 0 1以及遮罩資訊2 0 2，位址標記資訊2 0 1將用來與程式計數器3 0的位址標記3 0 0 a相比較，而遮罩資訊2 0 2則用以遮罩存放在主儲存區5中的資訊7 0 2。爲更新快捷記憶體中的內容，將使用、( least

Receutly used, LRU) I演算法，對此演算法而言，針對 ---—________ 二各個必要的記錄項，標記記憶體2 0 0包含有一個一位元的L R U資訊。遮罩資訊2 0 2是由對應於8個VL I W指令的遮罩資訊7 0 2所組成，遮罩資訊7 0 2在圖6中有所說明。在圚9中，instO至ins17表示任何一個目標記記憶體 200中讀取的8個VLIW指令，各個msk (X)代本紙浪尺度適用中國國家標準（CNS ) A4規格（2丨〇><297公釐） " ---------¾-- (請先閱讀背面之注意事\「％寫本頁) 訂 -15 - A7 B7 五、發明説明（13) 表一個群集X的遮罩資訊，其中X代表A至D中的任何一個。群集A所靥的遮罩資訊202a爲msk (A)，其用以顯示出整組是否有效，若m s k (A)爲1則該組爲有效，若爲0，則該組爲無效。圖1 1顯示標記記憶體2 0 0以及擊中確定電路 2 2 0的配置。圖1 2顯示群集A的配置，選擇器1 2 0 a用以自厘筆資料中選取一個所需的指令，而此兩筆資料是由快捷記 c. ——----------- 憶體1 00 a- 0和1 00b - 1中所輸出，而該快捷記憶體1 00 a- 0和1 0 Ob - 1是以雙道的方式構成。圖1 3顯示群集B至D的配置，在圖1 3中，選擇器 1 2 0 b用以選取資料以及P所靥的指令欄位，該資料及NOP是由快捷記憶體1 〇〇 b中所讀出，而此快捷記憶體係依據對應的遮罩資訊以單道的方式構成。圚1 4顯示選擇器1 2 0 a選取一輸出所依據的法則，而此選擇器1 2 0 a係顯示於圖1 2中。圖1 5顯示選擇器1 2 0 b選取一輸出所依據的法則，而此選擇器120b係顯示於圖13中。在說明處理器1的操作之前，先說明透過編譯器產生 VLIW指令的過程。一般而言，在產生一個指令串時，編譯器依據編譯器中支配硬體資源的法則，將一個處理分配給各個處理單元，在這個實施例中，當編譯器產生VL I W指令時，對於程式中具低平行程度的部份而言，所使用支配硬體資源的本紙張尺度適用中國國家梯準（CNS ) A4規格（210X297公釐）請先閲讀背面之注意事項一%·,寫本頁) -* 經濟部中央標率局貝工消費合作社印裝 -16 ~ 299421 A7 B7 經濟部中央標準局員工消費合作社印装五、發明説明（14 ) 法則是將褒先權賦予給贫配一個處理給群集A .的處理單元 1 1 0 a ·而對於髙平行程度的部份而言，則是儘可能平均地將處理分配給處理單元1 1 0，而且將對分配出去的次處理進行排程，以獲致髙處理性能。如圇6中的7 0 0，群集A較之其他的群集更有可能包含一個有效的處理，相反的，在指令欄位中置入Ν Ο P 的機率對於群集A而言則相對較低，因此，依據平行的程度，一個指令碼大小和處理的性能可調整到一個最適當的數值。接著如圖6中的7 1 0，編譯器用以自指令中清除 NOP，且壓縮指令的數量，在某一時間點上，編譯器亦可產生解壓縮已壓縮之指令所需的遮罩資訊7 0 2。若遮罩資訊702爲0，則NOP存在於對應的指令 H.I..I II —* _ * 欄位701，若其爲1，則除了NOP之外的其他任何資 ------* 料是存在於檷位7 0 1中·在群集A中，對應於群集A的遮罩資訊部份將固定爲1，與指令檷位的型式無關（即使是NOP)。如上述，VLIW指令是由4個指令檷位所組成*因此，遮罩資訊7 0 2包含了 4個位元。根據本發明* NOP將在主儲存區5中被清除，因此，在處理器1中由程式計數器3 0所指示之快捷記億髖 1 0 0的位址所具有的一個列表是與存放指令之主儲存區 5的位址不同，這意謂著當存取主儲存區時，必須作位址的轉換* 我們可以使用具有^列表(page table)之位址轉換本紙張尺度適用中國國家樣準（CNS > A4規格（210X297公釐) ~ -17 - 請先閱讀背面之注意事^枷寫本頁) 裝· 訂線經濟部中央標準局員工消費合作社印製 A7 __B7_ 五、發明説明（15 ) 機制相同的方法來完成位址轉換，頁列表使用的時機是處理器具備有虛擬儲存區和稱爲T L B的位址轉換緩衝器。根據本發明，在編譯進行時，編譯器將針對主儲存區5中的頁列表*產生一個位址轉換表。由指令串7 0 0連同其中的NOP以及將NOP自指令串710中清除之指令串 7 1 0兩者間的關係，可產生該列表。位址轉換緩衝器（未顯示）是存在於填入控制電路2 10中，以下將有所說明•此外，當開機時，緩衝器必須予以初始化（清除爲0)。如上述，編譯器用以提升在群集A中置入一有效指令檷位的機率，因此在本實施例中，群集A 1 〇 a的快捷記憶體1 0 0 a可擁有較之其他群集之快捷記憶體1 〇〇 b 至1 0 0 d更多的有效指令•具體而言，快捷記憶體 1 0 0 a的相關程度二倍於其他的快捷記憶體1 〇〇 b至 1 0 0 d。接著將說明處理器1如何執行指令，圖1 〇總結了快捷記憶體整個操作的流程。當處理器1執行程式時，首先，總控制器4 0將依據程式計數器3 0的數值去存取快捷記憶體1 〇〇，以取得執行處理所需的指令，在此狀況下，擊中確定電路2 2 0 將先去存取標記記憶體2 0以確定所需的指令是否已載入快捷記憶體1 0 0中’換言之，快捷記憶體是否被擊中（步驟900和910)。若快捷記憶體被擊中，則擊中確定電路2 0 0將會更本紙&尺度適用中國國家標準（CNS ) Λ4規格（210X 297公釐) 一 "~~ -18 - 請先閲讀背面之注意事^,%寫本頁) -裝· 訂線_ A7 B7 經濟部中央標準局員工消費合作社印製五、發明説明（l6 ) 新在標記記億體2 0 0中對應記錄項的LRU資訊2 0 3 (步驟960)，總控制器40將自擊中組中讀取一個指令，並將此指令饋入各個處理單元中（步驟970)，各個處理單元可依據擊中信號4 0 0而得知已擊中快捷記憶體100,然而開始執行該指令。以下將配合圖11至15來說明用以確定快捷記憶體是否擊中（步驟9 0 0和9 1 0)的步驟。如上述，當處理器1執行程式時，首先，總控制器 4 0藉著取用存在於程式計數器3 0之記錄項選擇部份 3 0 0 b的數值，以便在已存放於標記記憶體2 0 0的 6 4個記錄項中選擇一個記錄項，然後讀取位址標記資訊 201，遮罩資訊20 2，以及取自於標記記憶體200 的LRU資訊203。標記記億髖200是以雙道的方式構成，有二組的位址檫記資訊2 0 1和遮罩資訊2 0 2被讀取*此時*總控制器40執行快捷記億體100中相同記錄項的存取。其次，擊中確定電路2 2 0將自標記記憶體2 0 〇所讀出的位址標記資訊2 0 1與各組中程式計數器3 0的位址標記部位3 0 0 a作比較以檢査此兩者是否符合，互斥非或閘2 0 0 0有某一對應數目的输出將與一同等寬度的數字相比較（在此實施例中爲1 3 )，若其所有的輸出爲 1時，則兩者符合· 此時，選擇器2 2 1 0將自各組所讀取之8個 VLIW指令的遮罩資訊202 (指令0至指令7)，選本紙張尺度適用¥國國家標隼（CNS ) Λ4規格（210X29*7公釐1 ' -19 - (請先閲讀背面之注意事h填寫本頁) .裝· 訂線 A7 B7 經濟部中央標準局員工消費合作社印裝五、發明説明（ Π ) 1 I 取所關心之 V L I W 指令的遮罩資訊 2 0 2 9 若比較所得 1 1 I 的結果和所選取遮罩資訊 2 0 2 的遮罩資訊 2 0 2 a 一者 1 1 均爲 1 則其意謂著所關心的一組因一個及閘 2 2 0 1 的 1 I 請 1 I 動作而被擊中 9 擊中信號 ( 組 0 ) 4 0 0 a 或 4 0 0 b 爲先閱 1 I 讀 1 1 0 背 © 1 1 之 1 若此二組中有任何 _. 組被擊中 y 則致能 — 個或閘注意 1 1 2 2 0 4 進而使得快捷記憶體被擊中，興擊中組相關的 1 1 資蜞 I 訊將透過擊中信號 ( 組 0 ) 4 0 0 a通知群集 A 〇若此寫本裝 I 快捷記憶體爲擊中則擊中組的遮罩資訊 2 0 2 b 至 d 將頁 s^· 1 1 藉由擊中信號 ( 組 0 ) 4 0 0 a 成爲有效遮罩資訊 1 1 2 0 2 b 至 d 則透過線 4 1 0 b 至 d 通知群集 B 至 D 〇 1 1 — 個 9 位元的數值將提供給快捷記憶體 1 0 0 a 至訂 I 1 0 0 d 而此 9 位元數值是由程式計數器 3 0 的記錄項 1 I 選擇部份 3 0 0 b 結合偏移值 3 0 0 c所構成 0 在群集 A 1 1 | 中將同時白二組記憶體中讀取指令欄位選擇器 1 1 線 1 1 2 0 a 則依據顯示那一組記憶體被擊中的擊中信號 ( 組 0 ) 來選取其中一個指令撕位圖 1 4顯示了這個選取的 1 1 法則〇 1 I 快捷記憶體 1 0 0 b 至 1 0 0 d 將自 — 組記憶體中讀 1 I 出的指令欄位和 Ν 0 Ρ 的處理碼傅送至選擇器 1 2 0 b 至 1 1 2 0 d t 選擇器 1 2 0 b 至 1 2 0 d係依據有效的遲罩 1 I 資訊 4 1 0 b 至 4 1 0 d 來工作圖 15 中顯示了選擇的 1 1 法則處理碼是事先設定好的 9 因此，可藉由連接的邏輯 1 1 予以實現〇 1 1 本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） -20 - 經濟部中央標準局員工消費合作社印装 at ___B7 五、發明説明（is) 如上述’自快捷記憶體1 ο o b至1 0 0 d讀出的指令僅透過選擇器1 2 Ob至1 2 0 d中的一級而提供給處理單元，因此，可減少所需的處理時脈數目並縮短管線的 .一 ... .— — · ------------------------------- 1 · ————- 長度· 接著將說明快捷記憶體不中（miss)的處理。若快捷記憶體並未擊中，則由擊中確定電路2 2 0將不中的訊息經由一個擊中信號4 0 0 c傳送至填入控制電路 210，之後’填入控制電路210將開始動作，在此同時，記錄項選擇部份3 0 0 b和程式計數器3 0的偏移值3 0 0 c將被傳送至快捷記憶體1 〇〇 a至1 〇〇 d ，然後，自快捷記憶體1 0 0 a至1 0 0 d中讀出內容· 在此同時，不中的訊息將透過一個擊中信號4 0 0 c傳送至處理單元1 1 0 a至1 1 〇 d，以便停止這些處理單元，因此不會發生任何問題· 接著，填入控制電路2 1 0自主儲存區5中讀取另一個VL I W指令和對應的遮罩資訊，然後將其存入快捷記憶體1 00 a至1 00 d和標記記憶體200中所關心的記錄項，以下將說明這個過程· 首先，檢査是否確實存在有空的記憶區以供新指令存放在快捷記億體中所關心的記錄項。針對標記記憶體 2 0 0中所關心的記錄項而言，將檢査任一記憶組中 instOmsk至inst7msk的所有遮罩資訊m s k ( A )，若所有的遮罩資訊m s k ( A )爲0時，則所關心之記億組中所關心的記錄項爲空的，若未剩餘有空白的區域，則本紙倀尺度適用中國國家標準（CNS ) A4規格（210X297公釐） ~ ~ -21 - 請先閱讀背面之注意事^寫本頁) .裝· A7 B7 經濟部中央標準局員工消費合作社印製五、發明説明（ 19 ) 填入控制電路 2 1 0 將使得若干組所關心的記錄項變爲 <trrT. m 效以取得 — 個空白的面域 » 這個動作稱爲快捷記億體的 % 使 Λητ. 撕效 0 當快捷記憶體進行使失效時填入控制電路 2 1 0 將選取一個即將使其失效 ( 步驟 9 2 0 ) 的資料組 » 然後對此選出的資料組記錄項進行使失效 ( 步驟 9 3 0 ) 9 以下將說明使失效的方法〇若仍剩餘有空白區或者藉由快捷記億體的使失效處理而取得空白區則填入控制電路 2 1 0 將位址標記資訊 2 0 1 經由線 4 5 4 存入標記記億髖 2 0 0 並產生一個新的記錄項 ( 步驟 9 4 0 ) 然後在步驟 9 5 0 中填入控制電路 2 1 0 同時讀取 8 個指令所需的遮罩資訊 7 0 2 以符合 — 個 3 2 位元寬的匯流排填入控制電路 2 1 0 再將讀出的遮罩資訊 7 0 2 存入檫記記憶髖 2 0 0 以及填入控制電路 2 1 0 本身接著 -1»戈輸出 V L I W 指令 7 0 1 依據 8 個指令所需的遮罩資訊而包含有 8 個連績的指令〇當填入控制電路 2 1 0 讀取 V L I W 指令 7 0 1 時填入控制電路 2 1 0 將分析遮罩資訊 7 0 2 且根據分析所得的結果送出一個寫入信號給所關心的快捷記憶體 9 由主儲存區 5 導引出的指令饋入路徑且 3 2 位元的寬度 t da 與指令欄位的大小是相同的因此 1 對於可寫入資料的快捷記憶體而言 9 其規格的執行僅被允許使用快捷記億體 1 0 0 a 至 1 0 0 d 的各個寫入信號〇若兩組記億區有剩餘的空白區或者經由使失效的動作請先閱讀背訂本紙張尺度逋用中國國家榡準（CNS ) Λ4規格（210X297公釐）裝 -22 - 經濟部中央標準局貝工消費合作社印製 A7 _B7__ 五、發明説明（2〇 ) 而使其成爲空白區’則事先會決定指令是存放在那一組記憶區中。如上述，處理器包含了 Ν Ο P指令的處理碼,因此，不需要再存入NOP指令。若各個VLIW指令包含有 NO P指令所需的一個指令禰位，則填入控制電路2 1 0 將依據遮罩資訊，禁止將指令寫入快捷記億體。因此，至多有8個VL I W指令被存放在快捷記億體中，而這些快捷記億體是位於與指令相對應的群集中，此外，各個VL I W指令則是置於對應的指令檷位中· 根據本發明，如上述，因爲NOP已由存放在主儲存區5的指令串7 1 〇中被除去，則存放在快捷記憶體中之指令的位址是由程式計數器3 0的數值所決定，而其位址列表是與存放在主儲存區5中的指令位址不同，所以在存取主儲存區5時，將透過存在於填入控制電路2 1 0中的位址轉換緩衝器以及存放在主儲存區5中的位址轉換表來進行位址的轉換。填入控制電路2 1 0透過相關的機制，進行程式計數器3 0的位址數值轉換，透過路徑4 5* 0以讀取主儲存區 5之後由轉換位址所顯示的指令，然後將此指令存入快捷記億體1 0 0中，在路徑4 5 0中，除了轉換位址之外，亦包含有主儲存的一個控制信號，後績的處理則與擊中當時所執行的處理相同。若干上述的處理被允許能夠平行或重新安排次序地予以執行•例如，可同時更新LRU資訊（步驟9 6 0 )以本紙張尺度適用中國國家標準（CNS ) A4规格（210X 297公釐） ---------^-- (請先閲讀背面之注意事^.楱寫本頁) 訂線 -23 - A7 B7 經濟部中央標準局員工消費合作社印裝五、發明説明（ 21 ) 1 | 及饋入指令 ( 步驟 9 7 0 ) 〇 1 1 其次 * 將說明選取 — 使失效之記億組的方法 y 透過 1 1 L R U 資訊 2 0 3 的使用 * 可執行選取使失效之記億組的 1 | 動作 ( 步驟 9 2 0 ) 9 它顯示出巨前所使用的是那 ―― 組記請先閲 1 I 憶 9 若巨前所使用的是第 % 0 組 9 則擊中確定電路背面 1 1 I 2 2 0 存入 0 ，若 @ 刖使用的是 % 1 組 » 則存入 % 之注意 1 1 I 1 離 » 換言之 9 當擊中快捷記憶體時 > 記億組 A 的擊中信 1 1 1 號 4 0 0 a 的數值將被寫入相對應之記錄項的 L R U 資訊填窝本 1 裝 2 0 3 0 頁 1 1 以下將說明使失效的過程 > 首先填入控制電路 1 1 2 1 0 將檢査是否有個新指令被输入至具有舊存取歷史 1 I 的 — 組快捷記億體而此舊存取歷史是由記錄項中的訂 I L R U 資訊 2 0 3 所表示〇若 % 新指令的標竿資訊中的 1 1 I 各個位元與 % 具有舊存取歷史之指令中的標竿資訊 • 之各 1 1 I 個位元二者作 % A N D • 運算所得的結果爲零時新指令 1 1 可被存放在該組的快捷記憶體中而上述的舊存取歷史是線 1 由 L R U 資訊 2 0 3 所顯示 0 然後對該組具有由 L R U 1 1 資訊 2 0 3 所顯示之舊存取資料的記憶體執行使失效處理 1 I t 爲使此組記憶體成爲撕效相對應記憶組中標記記憶體 1 I 2 0 0 和標竿資訊亦即 i ns t 0至 i ns t7的 m S k ( A ) 1 1 | 2 0 2 a 將成爲零 0 1 1 對於檢査的結果而言若 Arr. m 新指令可 •U-Λ. 輸入該組記憶體 1 1 > 則可針對具有由 L R U 資訊 2 0 3 所表示之新存取歷史 1 1 的 — 組記憶體進行相同的檢査 9 若新指令可被 Μ·Λ. 輸入至此組 1 1 本紙張尺度適用中國國家標华（CNS〉A4規格（21〇X297公釐） -24 - 經濟部中央標準局貝工消費合作杜印製 A7 ______Β7__ 五、發明説明（22) 記憶體，則該組具有由LRU資訊2 0 3所顯示之新存取歷史的記億體將變爲失效，假使在該兩組記憶體已成失效的情況下，仍無新指令被輸入至記憶組時，這二組記憶體將成爲失效。爲了使該二組記憶體失效，填入控制電路2 1 0將所有的mask (A) 202a設定爲零，而mask (A )2 0 2 a 係對應於 i n s 10 m a s k 至 i n s 17 m a s k 的群集 A，而instQmask和inst7mask係存在於選自於槺記記憶體 2 Ο 〇中的記憶組遮罩資訊•若其中有任何一組記億體失效時，則自該組記憶體中讀取一個新的指令，此時遮罩資訊是被重置的，因此，不需要將該資訊設定爲零，當開機時*遮罩資訊2 0 2將進行初始化（被清除爲零）以利後績的使失效處理。在上述的說明中，處理單元1 1 0 a在配置及控制上能使得有效的指令被集中在一起，當然，本發明並不受限於此種配置及控制。再者，在本實施例中，快捷記憶體1 〇〇 a的容置是二倍於其中快捷記憶體中各記憶體的容量，然而，這不限於容量。本發明中的快捷記憶體在配置上可符合將多個指令集中在一特定處理單元中的速率* 本紙張尺度適用中國國家標準（CNS > Λ4規格（210X297公釐） I---------^-- 請先閱讀背面之注意事七；填寫本頁) 訂· 線

Claims

8888 ABCD Η 經濟部中央標準局貝工消費合作社印製六、申請專利範圍第85107767號專利申請案中文申請專利範圍修正本民國85年12月修正 1 . 一種處理器包含：二個或多個處理單元，這些處理單元的執行順序可僅由一個程式計數器加以控制，且可平行地執行：二個或多個用以儲存即將爲處理單元所執行之指令的快捷記憶體，這些快捷記憶體分別對應於上述的處理單元 1 一個標記記憶體，用以儲存指令的位址資訊，而該指令係存放在快捷記憶體中：以及一個用以儲存指令欄位的儲存控制電路，若—個由上述程式計數器所顯示之位址所指定的指令自外界讀入時，在快捷記憶體中的指令將被分割爲上述的指令欄位，而這些快捷記憶體係對應於處理單元。 2.如申請專利範圍第1項中的處理器，其中一個快捷記憶體的容量是不同於另一個快捷記憶體的容量。 3 .如申請專利範圍第1項中的處理器，其中的一個快捷記憶體容量是N (二個或多個自然數）倍於其他快捷記憶體的容量。 4 .如申請專利範圍第3項中的處理器，其中的N値爲2 ° 5.如申請專利範圍第1至第4項中任一項的處理器本紙張尺度適用中國國家標準（CNS ) Α4規格（210X297公釐） HH ^^1 m ^^1 ^^1 (請先閲讀背面之注意事項再填寫本頁) 訂經濟部中央標準局員工消費合作社印製 A8 B8 C8 D8 六、申請專利範圍，其中的儲存控制電路執行以下的步驟：讀取顯示那一個處理單元對應至指令欄位的儲存資訊，而其中的指令欄位是在讀取指令時，由該指令劃分出來的；將該儲存資訊存入標記記憶體中，這個標記記憶體存放在對應至該指令的位址資訊；以及控制各個指令欄位在快捷記憶體中的儲存動作，這個快捷記憶體係對應於用以執行該指令欄位的處理單元’而該指令欄位將根據儲存資訊被儲存起來。 6. 如申請專利範圍第1至第4項中任一項的處理器，其中快捷記憶體的容量係對應於存放在快捷記憶體中之指令欄位的儲存容量。 7. 如申請專利範圍第1至第4項中任一項的處理器，其中各個快捷記憶體的儲存容量與儲存在該快捷記憶體本身中的指令欄位有相關的對應。 8. 如申請專利範圍第1至第4項中任一項的處理器，其中的儲存資訊提供一個區域以指定出來存放在任何一個快捷記憶體中之指令欄位是包含在該指令中，以及儲存控制電路控制著指令欄位的儲存動作，而此指令欄位是由將存放在該快捷記憶體中的儲存資訊所指定° 9. 如申請專利範圍第1至第4項中任一項的處理器，其中的處理單元提供了可執行一個指令欄位的功能’而此指令欄位並未存放在任何一個快捷記憶體中，該儲存資訊提供一個區域，用以指定出並未存放在快本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐）-2 - --------{-裝------訂-----γ銶 (請先閲讀背面之注意事項再填寫本頁) A8 B8 C8 D8 六、申請專利範圍捷記憶體中的指令欄位，以及若該儲存資訊顯示出即將在處理單元中進行處理的指令欄位並未存放在任何一個快捷記憶體時，則處理單元將產生並執行這個未存放在該快捷記憶體中的指令欄位。 ίο·—個處理器，包含：二個或多個處理單元，其執行的順序是僅利用一個程式計數器來加以控制，並允許作平行地執行：以及二個或多個快捷記憶體，以便平行地將一個指令平行地饋入二個或多個處理單元。 11. 如申請專利範圍第1〇項中的處理器，其中一個快捷記憶體的容量與其他快捷記憶體的容量不同。 12. 如申請專利範圍第11項中的處理器，其中與其他快捷記憶體不同容量之一個快捷記憶體的容量係N ( 2或更大的自然數）倍於其他的快捷記憶體。 13. 如申請專利範圍第12項中的處理器，其中的 N爲2 。 (請先Μ讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印裝本紙張尺度適用中國國家標準（CNS ) Α4規格（210X297公釐）