經濟部中央標準局員工消費合作社印袈 A7 ____B7 五、發明説明(1 ) 本發明之背景: 本發明係關於一種處理器,一種輔助處理器,和一個 裝載著此類處理器的延伸板,這些裝置是使用在一種例如 是個人電腦的資訊處理系統。 相關技術之敘述: 目前處理器架構的主流已指向精簡指令集計算機(簡 稱爲R I SC系統),R I SC系統的特點是它並沒有很 複雜的指令且固定其指令的長度•因爲各個指令很簡單, 所以R I S C系統的處理速度非常快,且因爲各個指令的 長度是固定的,所以在一次記憶體的存取動作中即可讀取 —個指令,這些特點提升了處理速度· 爲了改善RISC處理器的處理性能,在RISC處 理器中使用一種超純置系統成爲目前的趨勢•超純量系統 在運作上可使得其處理器內部的工作單元在執行運算時, 能針對硬體作動態的排程。這種系統的好處是可使用過去 的軟體資源而無需作更改,而其缺點是它無法使用足夠的 資訊進行排程,因爲是在運算執行時才進行排程,進而強 化其平行的程度。 爲獲致較超純童系統更髙的性能,已有人提出一種極 長指令字(簡稱爲VLIW系統),本系統是在程式進行 編譯時,以軟髖處理的方式對包含在處理器中的工作單元 -C 1~~ 採取統計式的排程步驟,將會平行執行的一組指令集合成 一個指令集,在處理器執行該程式時一次讀取一個指令集 本紙張尺度適用中國國家標準(CNS > Λ4規格(210X297公釐) ----„------^-- 請先閲讀背面之注意事\.填寫本頁) 訂 線 -4 - A7 _____B7 五、發明説明(2 ) ,然後執行該指令集。VL IW系統並不需要硬體來作f I,因此具有提升平行程度的好處,相反的,其缺點是一 個指令集將變得很長,因爲多個指令集合成一個指令集。 超純置系統和VL IW系統的介紹可見MLIW: The wave of the Future?^ Microprocessor Roport ,第 18至21頁,1994年2月。 —般而言,一個程式裡具有平行程度高的一部份以及 平行程度低的另一部份,各部份的實例可以圖1和圖2加 以說明,在圖中,各列代表一個處理,例如,圖1中的第 1列處理8 0 0 a代表著將1與一變數X0的內容相加, 並且將相加的結果取代一個變數Y0 ,這些處理是一個接 著一個來執行。 圖1顯示高平行程度的部份,在此部份中的處理是彼 此不相關的,因此可平行地執行。例如,在第2列處理 8 0 0 b中所使用的變數X 1值可在第1列處理8 0 0 a 執行前加以確定,因此,第1列處理8 0 0 a和第2列處 理800b可平行來執行· 經濟部中央標準局員工消費合作社印製 --.--„------裝-- (請先閱讀背面之注意事&填寫本頁) 此外,圇2顯示平行程度低的部份,在此部份中,是 由前一個處理來計算出各個處理的數值,因此*直到前一 個處理完成,前的處理才能進行,例如,使用在第2列 處理8 1 Ob中的變數XI值在第1列處理8 1 0 a執行 後才能被定義,在正常情況下,在第1列處理8 1 0 a結 束前,是不允許開始執行第2列處理8 1 0 b的。 圖3顯示針對圖1中的程式•顯示轉換後的一個 本紙張尺度適用中國國家標準(CNS ) Λ4規格(210X 297公釐) A7 j----------B7 五、發明説明(3 ) VL IW系統指令(簡稱爲—個IW指令),圖4則 針對圖2中的程式,顯示—個轉換後的vl I W指令•這 些VL I W指令可以在同一時間執行4個處理,在這個圖 中’一列代表著一個VL I W指令,這些指令由上而下即 時地被執行,圖3所示的V L I W指令是由高平行程度部 份轉換而得(見圖1 ),在這些指令中,一個指令一次可 執行4個處理’因此,相較於傳統僅具單—處理單元的處 理器,這些VLIW指令可獲致4倍的性能。 另一方面,圖4中的VL IW指令是由一個低平行程 度的處理轉換而得(見圖2 ),在這些指令中,一個指令 一次僅能執行一個處理,因此,雖然處理器使用的是可一 次執行4個處理的VL IW系統(簡稱VL IW處理器') ’也僅能達成與僅具單一處理單元之處理器相同的性能。 因爲即使在沒有處理可執行的部份中也必須保持指令長度 爲固定’有必要插入一個不動作指令(non_operati〇nal instruction )(簡稱爲NOP )以表示沒有任何動作發 生’因此,指令的長度會比實際的處理內容爲長。
當VL IW處理器執行的是一般的程式時,NOP會 有極髙的佔有率,換言之,Ν Ο P佔據了一個資訊處理設 備的主儲存容量,而此資訊處理設備具有一個VL I W處 理器(簡稱爲VL IW系統)或者存在於此VL IW處理 器內部大部份的指令快捷記憶體(簡稱一個快捷記憶體) ,因爲Ν 0 P的存在,而浪费主記億體的空間,或者快捷 記憶tl的容置將會過於龐大,其引發的問題是· V L I W 本紙張尺度通川中國國家標孪(CNS ) A4規格(2丨0X297公慶) " * 6 - 請先閲讀背面之注意事填寫本頁 .裝· 訂 線 經濟部中央標準局員工消費合作社印製 299421 A7 經濟部中央標準局員工消費合作社印製 B7五、發明説明(4 ) 處理器的性能無法如預期般的高、V L I W系統的成本過 髙,而VL IW處理器晶片過大且造價昂貴。 因V L I W處理器所引發的問題可見” Basic Arrangement of Reconstructed VLSI Computer based on Execution Delay", Reports of Information Processing Society, Computer Architecture, NOS. 89 to 13,第 87 至 93 頁,1991 年 7 月 19 日’ Information Processing Society。 若能排除主記憶體因N 0 P所造成的負擔,則可有效 率地使用VL I W系統的主記億體,在”A VLIW Architecture for a Trace Scheduling Compiler", IEEE, Transaction on Computers, VOL 37, No.8,第 967至979頁,1988年8月之論文中提及將 N 0 P自主記憶體中去除可節省記憶體容置的技術。 爲減少存在於VL I W處理器中的快捷記億體容置, 在此提出一個方法,此方法採用的步驟包含了在將指令存 入快捷記憶體時壓縮該指令,自快捷記億體中讀取被壓縮 - — 的指令,然後解壓縮此指令,此技術見於"Phillips Holes to Displace DSPs With VLIW", Microprocessor Report,第1 2至第15頁,1994年11月5曰, Micro Design Resources" - I ί -- -I 1--- - - _ - —ί I (請先閱讀背面之注意事ί,1·填寫本頁) 線 升量 提容 本憶 成記 低捷 降快 可的 統中 系器 的理 Ρ 處ο W Ν I 除 L 清V 中爲 區因 儲, 存能 主性。 自的變 匕匕导 TTMl 理 處並 本紙張尺度適用中國國家標準(CNS ) Λ4規格(210X 297公釐) -7 - 經濟部中央標準局員工消費合作社印¾. A7 _____________B7 _五、發明説明(5 ) 此外,在系統中,當指令存入處理器內的快捷記憶體 時壓縮該指令,以及當自快捷記億體讀出指令時解壓縮該 指令的作法會發生一個問題,亦即在分支點上會造成大的 損失,因爲在管線(pipeline)中會插入一級解壓縮的處 理以便執行該指令,且因此位於管線處理中的較深處。 換言之,指令的解壓縮將浪费一個或兩個週期,這也 包括處理器晶片內部出現的拉線延遲,因此,執行指令所 使用的管線將延長了一或二級。若這些指令是以適當的次 序來執行,則經常可將這個延伸的狀況忽略。若指令的執 行次序因分支指令的出現而更改時,則會發生一段未執行 指令的時間,一般而言,此執行管線越深,則這段時間將 會越長。 對於用以平行執行指令例如是V L I W處理器此類旳 處理器而言,將造成一個更大的問題,假設無指令執行的 一段時間超過二個週期時,僅能執行一個處理的傳統處理 器在最差的狀況下將會禁能只執行二個處理,然而,能一 次執行4個處理的VLIW處理器在最差的情況下將禁能 最多8個處理,當平行執行的處理數目愈大,則這種損失 會愈大。 爲取代減少的快捷記憶體,用以解析指令的附加硬體 是必要的。 本發明的總結: 本發明的目的之一是提供一個具有快速處理能力的廉 請先聞讀背面之注意事\/4填寫本頁) -裝. 訂 線 本紙悵尺度適用中國國家標準(CNS ) A4規格(21〇Χ297公釐) A7 B7 五、發明説明(6 ) 價V L I W處理器。 本發明的目的之一是藉由有效使用协様IH僚體,以提 供一種具有較小容量快捷記憶體和較小晶片面積的廉價 一 .. _ V L I W處理器* 本發明的目的之一在提供一種方法,以配置適用於 V L I W處理器的快捷記憶體。 本發明的目的之一在提供一種具有快速處理能力且不 需加深管線的VL IW處理器^ 爲達成上述目的,本發明所提出的處理器具有若干個 能平行執行的處理單元,這些處理單元的執行次序僅由一 〜 — ------ 數器來控制;這個處理器亦包含配合上述處理單 元以存放處理單元所執行之指令的若干快捷記億體,一個 可針對存放在快捷記憶體中之指令,存放其位址資訊的檫 記記憶體;和一個能將指令分割爲若干個配合處理單元之 指令欄位的儲存控制電路,若自外部讀取由一程式計數器 指示之位址所指定的指令,此儲存控制電路亦用以將這些 指令欄位存入配合處理單元的快捷記憶體。 依據本發明,若能㈣快捷記憶體的容量’則可在不
_ —I 需作指令解析的情況下自快捷記憶體讀出的指令’因 此,用以執行指令的管線可減少長度’如此因執行分支指 令所發生的損失將降至最低。 再者,在各個處理單元中的NO P發生率是各別的’ NOP並未存放在快捷記憶體中,因此,可依據除了 n 〇 p之外的指令發生率來設定快捷g拿,這種 本紙張反度適用中國國家標準(CNS ) Λ4規格(210X297公釐) ^-- (請先閲讀背面之注意事.^蜞寫本頁) 訂 線 經濟部中央標準局員工消費合作社印裝 -9 - 經濟部中央標準局員工消費合作社印製 A7 __B7 五、發明説明(7 ) 作法可提升快捷記憶體的使用率,進而在相同的晶片面稹 中獲致較高的處理性能· 如上述,依據本發明,編譯器在工作時將針對任何非 Ν Ο P的指令,賦予其分配至一特定群集的優先次序,這 種作法使得我們能夠變更各個群集內快捷記億體的容量, -- **--- 進而改善快捷記憶體的使用效率,最後可以實現相同性能 ,但卻可減少快捷記憶體的容量,此外,也因此而降低了 處理器的成本。 此外,我們可以降低在處理器中配置在快捷記憶體至 處理單元的電路數目,這些電路的作用是可供讀取自快捷 記憶體的指令通過,因此,可降低指令管線的I塞,且可 m. —' ^少在執行i分支指令時所造成的損失,進而提升處理器的 泰― 薩— 速度。 因爲降低了快捷記億體的容量,所以快捷記憶體的位 置可以很靠近各個工作單元,進而減少拉線的區域,並且 有效提升工作速度。 上述的作法實現了一個成本低而具快速處理能力的 V L I W處理器· 附圖之簡述: 圚1顯示一個高平行程度的處理部份實例: 圖2顯示一個低平行程度的處理部份實例; 圖3針對圖1中的部份,顯示一個VL丨界指令的實 例; 本紙張尺度適用令國國家標準(CNS ) Λ4規格(21〇X 297公釐) ----------^------IT------^ (請先閣讀背面之注意事h填寫本頁) -10 - 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(8 ) ®4針對圖2中的部份,顯示一個VL I W指令的實 例; 闽5中的方塊圖依據本發明的一個實施例,顯示快捷 15憶贈周邊的電路配置: 阖6顯示一個使用在本發明之實施例中的壓縮指令實 例; 阖7顯示一個使用在本發明之實施例中的程式計數器 實施例; 圖8顯示快捷記憶體的配置: 阖9顯示在快捷記憶體中標記部份的配置; 圖1 0中的流程圖顯示了整個快捷記憶體的操作程序 » 圖11中的方塊圖顯示了標記記憶體和位元確定電路 的配置; 圖12的方塊圖顯示一群集A之快捷記憶體的配置; 圖13的方塊圖顯示群集B至D之快捷記億體的配置
I 圖14中的列表顯示出群集A之選擇器的控制信號; 以及 圖15中的列表顯示出群集B至D之選擇器的控制信 號。 最佳實施例之詳述: 以下將配合圖5至9 ,說明本發明之—實施例中的處 本紙張尺度適用中國國家標準(CNS ) Λ4規格(210X 297公漦) -1 1 _ 批衣-- (請先閲讀背面之注意事5k.填寫本頁) -β 線 經濟部中央標準局員工消費合作社印製 A7 ______B7_ 五、發明説明(9 ) 理器配置。 圖5中的方塊圖針對使用一處理器1的資訊處理設備 顯示其中處理器1的配置以及處理器1與主儲存區5相連 的方式,數字5代表一個主儲存區,用以存放處理器1將 執行的指令以及執行所需的資料,主記憶區5的位置是在 處理器1的外側,在處理器1和主儲存區5之間的連接匯 流排具有3 2位元的寬度,數字1 〇 a至1 0 d代表著組 成處理器1之基本部份的群集,各個群集是由一個用以存 放一個指令的指令快捷記憶體1 0 0(簡稱爲快捷記憶體) ,一個用以執行各類處理例如一個運算的處理單元1 1 0 ,以及一個用以選取一個指令供處理單元110執行的選 擇器1 2 0。爲分辨存在於各個群集中的各個元件,可加 入下標,例如a至d,以及快捷記億體100a (代表群 集A的快捷記億體),在本實施例中,假設處理器1是一 個可一次執行4個指令的VL I W處理器,因此存在有4 個群集A至D · 數字2 0代表一個快捷記憶控制電路,這個快捷控制 電路2 0包含一個擊中(hit )確定電路2 2 0,一個填 入控制電路2 1 0以及一個檩記記憶體2 0 0 ;其中,擊 中確定電路2 2 0用以確定待執行的指令是否存在於快捷 記憶體1 00 a至1 00d中。填入控制電路2 1 0用以 自主儲存區5中讀取一個指令,並將此指令存入快捷記憶 體1 0 0 a至1 0 0 d ·而標記記憶體是用以存放與存放 在快捷記憶體1 0 0 a至1 0 0 d中之指令相同的資訊。 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) ----------^-- (請先閱讀背面之注意事填寫本頁) 訂 線 經濟部中央標準局員工消費合作社印敦 A7 ____ _B7_ 五、發明説明(i〇) 數字4 0代表一個控制著處理器1所有工作的總控制 «— — 器,這個總控制器4 0具有一個程式計數器3 0,程式計 數器3 0是一個指標,用以指向進入指令的一個位元組位 址,且當指令被執行一次,就會更新一次,爲了存取快捷 記憶體1 0 0中的指令,將會直接使用程式計數器3 0中 的數值· 總控制器4 0和填入控制電路2 1 0兩者內部均具有 —個順序器,控制器40和電路210均在此順序器控制 下工作。 圖6顯示了一個VLIW指令的組成· 數字7 0 0代表一個當平行處理進行排程時的特定 ¥乙1贾指令,這個乂1^1界指令7 0 0是由4個以一對 一方式與群集1 0 a至1 〇 d對應的4個指令欄位所組成 。各個指令欄位N (N20) — a至d是一個使用在各個 處理單元1 0 a至1 〇 d中的指令檷位,在本實施例中, 一個檷位包含有3 2個位元(4個位元組),數字7 10 代表了一個壓縮指令字串的儲存型式,其中,可在主儲存 區5中去除Ν Ο P所作用的指令欄位。 數字7 0 2代表一個顯示在各個指令中的指令欄位是 否存在有Ν Ο P的旗標組,此旗標組被稱爲遮罩資訊,這 個遮罩資訊7 0 2係存在於各個VL IW指令中且由4個 位元所組成,其中的各個位元對應於4個群集中的各個群 集•在執行指令時,遮罩資訊允許Ν Ο P再被插入指令檷 位,在群集A所屬的指令欄位n — a中,即使是NO P亦 ^紙张尺度適用中國國家標準(CNS > Λ4規格(210X297公釐) :~ -13 - ----------1^------1T------^ (請先聞讀背面之注意事^:填寫本頁) 經濟部中央標準局員工消費合作社印聚 A7 _B7 五、發明説明(11 ) 未予以清除’以下將有所說明。數字720代表一個 VL I W指令的讀取型式,這個VL I W指令是存在於處 理器1的快捷記憶體中’以下有較詳細的說明。 圖7顯示程式計數器3 0的配置,它具有2 4位元的 寬度且可分割爲3個檷位。在圖7中’數字3 00 a代表 一個用以和位址標記資訊2 0 1相比較的位址檩記,比較 的結果用來確定是否擊中(hit )快捷記憶體,而上述的 位址標記資訊2 0 1是存放在標記記億體2 0 0 (以下有 所說明)。數字300b代表一個位址項選擇部份,以選 取標記記憶體2 0 0和快捷記憶體1 0 0中的各個位址項 。數字3 0 0 c代表各個位址項中所放置之指令的偏移值 ,在本實施例中,位址標記3 0 0 a,位址項選擇部份 300b和偏移值300c分別具有13位元、6位元和 3位元的寬度。指令檷位的大小可固定在3 2位元,並分 佈在4個位元組的範園內。程式計數器3 0的最低2個位 瓦固定爲零· 圚8針對位於群集a至d中的快捷記憶體1 〇 〇 a至 1 0 0 d,顯示各個快捷記憶體的配置和容量,群集A中 的快捷記億體1 0 0 a具有4 k位元組的容量,群集B至 D中的各個快捷記憶體1 〇 〇 b至1 〇 〇 d則具有2 k位 元組的容量,快捷記憶體1 0 0 a使用的是一種雙道J相 關系統,而快捷記憶體1 0 0 b至1 0 0 d使用的是單道 組相關系統,各組的容量等於2 k位元組· 由1 0 0 a至1 〇 〇 d之各個快捷記憶體中的線寬是 本紙張尺度適用中國國家梯孳(CNS ) A4規格(210X 297公釐) ---------^-- 請先閱讀背面之注意事^ι-ν,.ρ填寫本頁) 訂 線 -14 - 經濟部中央標準局貝工消費合作社印製 A7 __B7_ 五、發明説明(l2 ) 等於8個指令檷位(4個位元組x8 = 3 2個位元組)· 1 0 0 a至1 0 0 d中的各個快捷記憶體同樣是由6 4個 記錄項(2 k位元組/3 2個位元組)所組成,各個記錄 項是由一個共有的記錄項位址來指定。在本實施例中,快 捷記憶體是由一個位址512和一個讀/寫資訊以及4個 位元組寬度所組成,這樣的作法可避免在讀取指令時需要 一個8選1的選擇器,且可避免若讀/寫資訊寬度被設定 爲適用於線寬度之32位元時所造成電力消耗增加的問題 〇 圖9顯示在群集1 0 a至1 0 d中共用之標記記憶體 2 0 0的配置,標記記憶體2 0 0使用一個對應於群集A 的雙道配置,標記記憶體2 0 0具有6 4個記錄項,各個 記錄項包含二個區域,用以存放1 3位元旳位址標記資訊 2 0 1以及遮罩資訊2 0 2,位址標記資訊2 0 1將用來 與程式計數器3 0的位址標記3 0 0 a相比較,而遮罩資 訊2 0 2則用以遮罩存放在主儲存區5中的資訊7 0 2。 爲更新快捷記憶體中的內容,將使用、( least
Receutly used, LRU) I演算法,對此演算法而言,針對 ---—________ 二 各個必要的記錄項,標記記憶體2 0 0包含有一個一位元 的L R U資訊。 遮罩資訊2 0 2是由對應於8個VL I W指令的遮罩 資訊7 0 2所組成,遮罩資訊7 0 2在圖6中有所說明。 在圚9中,instO至ins17表示任何一個目標記記憶體 200中讀取的8個VLIW指令,各個msk (X)代 本紙浪尺度適用中國國家標準(CNS ) A4規格(2丨〇><297公釐) " ---------¾-- (請先閱讀背面之注意事\「%寫本頁) 訂 -15 - A7 B7 五、發明説明(13) 表一個群集X的遮罩資訊,其中X代表A至D中的任何一 個。群集A所靥的遮罩資訊202a爲msk (A),其 用以顯示出整組是否有效,若m s k (A)爲1則該組爲 有效,若爲0,則該組爲無效。 圖1 1顯示標記記憶體2 0 0以及擊中確定電路 2 2 0的配置。 圖1 2顯示群集A的配置,選擇器1 2 0 a用以自厘 筆資料中選取一個所需的指令,而此兩筆資料是由快捷記 c. ——----------- 憶體1 00 a- 0和1 00b - 1中所輸出,而該快捷記 憶體1 00 a- 0和1 0 Ob - 1是以雙道的方式構成。 圖1 3顯示群集B至D的配置,在圖1 3中,選擇器 1 2 0 b用以選取資料以及P所靥的指令欄位,該資 料及NOP是由快捷記憶體1 〇 〇 b中所讀出,而此快捷 記憶體係依據對應的遮罩資訊以單道的方式構成。 圚1 4顯示選擇器1 2 0 a選取一輸出所依據的法則 ,而此選擇器1 2 0 a係顯示於圖1 2中。 圖1 5顯示選擇器1 2 0 b選取一輸出所依據的法則 ,而此選擇器120b係顯示於圖13中。 在說明處理器1的操作之前,先說明透過編譯器產生 VLIW指令的過程。 一般而言,在產生一個指令串時,編譯器依據編譯器 中支配硬體資源的法則,將一個處理分配給各個處理單元 ,在這個實施例中,當編譯器產生VL I W指令時,對於 程式中具低平行程度的部份而言,所使用支配硬體資源的 本紙張尺度適用中國國家梯準(CNS ) A4規格(210X297公釐) 請先閲讀背面之注意事項一%·,寫本頁) -* 經濟部中央標率局貝工消費合作社印裝 -16 ~ 299421 A7 B7 經濟部中央標準局員工消費合作社印装 五、發明説明(14 ) 法則是將褒先權賦予給贫配一個處理給群集A .的處理單元 1 1 0 a ·而對於髙平行程度的部份而言,則是儘可能平 均地將處理分配給處理單元1 1 0,而且將對分配出去的 次處理進行排程,以獲致髙處理性能。 如圇6中的7 0 0,群集A較之其他的群集更有可能 包含一個有效的處理,相反的,在指令欄位中置入Ν Ο P 的機率對於群集A而言則相對較低,因此,依據平行的程 度,一個指令碼大小和處理的性能可調整到一個最適當的 數值。 接著如圖6中的7 1 0,編譯器用以自指令中清除 NOP,且壓縮指令的數量,在某一時間點上,編譯器亦 可產生解壓縮已壓縮之指令所需的遮罩資訊7 0 2。 若遮罩資訊702爲0,則NOP存在於對應的指令 H.I..I II —* _ * 欄位701,若其爲1,則除了NOP之外的其他任何資 ------* 料是存在於檷位7 0 1中·在群集A中,對應於群集A的 遮罩資訊部份將固定爲1,與指令檷位的型式無關(即使 是NOP)。如上述,VLIW指令是由4個指令檷位所 組成*因此,遮罩資訊7 0 2包含了 4個位元。 根據本發明* NOP將在主儲存區5中被清除,因此 ,在處理器1中由程式計數器3 0所指示之快捷記億髖 1 0 0的位址所具有的一個列表是與存放指令之主儲存區 5的位址不同,這意謂著當存取主儲存區時,必須作位址 的轉換* 我們可以使用具有^列表(page table)之位址轉換 本紙張尺度適用中國國家樣準(CNS > A4規格(210X297公釐) ~ -17 - 請先閱讀背面之注意事^枷寫本頁) 裝· 訂 線 經濟部中央標準局員工消費合作社印製 A7 __B7_ 五、發明説明(15 ) 機制相同的方法來完成位址轉換,頁列表使用的時機是處 理器具備有虛擬儲存區和稱爲T L B的位址轉換緩衝器。 根據本發明,在編譯進行時,編譯器將針對主儲存區5中 的頁列表*產生一個位址轉換表。由指令串7 0 0連同其 中的NOP以及將NOP自指令串710中清除之指令串 7 1 0兩者間的關係,可產生該列表。 位址轉換緩衝器(未顯示)是存在於填入控制電路2 10中,以下將有所說明•此外,當開機時,緩衝器必須 予以初始化(清除爲0)。 如上述,編譯器用以提升在群集A中置入一有效指令 檷位的機率,因此在本實施例中,群集A 1 〇 a的快捷記 憶體1 0 0 a可擁有較之其他群集之快捷記憶體1 〇 〇 b 至1 0 0 d更多的有效指令•具體而言,快捷記憶體 1 0 0 a的相關程度二倍於其他的快捷記憶體1 〇 〇 b至 1 0 0 d。 接著將說明處理器1如何執行指令,圖1 〇總結了快 捷記憶體整個操作的流程。 當處理器1執行程式時,首先,總控制器4 0將依據 程式計數器3 0的數值去存取快捷記憶體1 〇 〇,以取得 執行處理所需的指令,在此狀況下,擊中確定電路2 2 0 將先去存取標記記憶體2 0以確定所需的指令是否已載入 快捷記憶體1 0 0中’換言之,快捷記憶體是否被擊中( 步驟900和910)。 若快捷記憶體被擊中,則擊中確定電路2 0 0將會更 本紙&尺度適用中國國家標準(CNS ) Λ4規格(210X 297公釐) 一 "~~ -18 - 請先閲讀背面之注意事^,%寫本頁) -裝· 訂 線_ A7 B7 經濟部中央標準局員工消費合作社印製 五、發明説明(l6 ) 新在標記記億體2 0 0中對應記錄項的LRU資訊2 0 3 (步驟960),總控制器40將自擊中組中讀取一個指 令,並將此指令饋入各個處理單元中(步驟970),各 個處理單元可依據擊中信號4 0 0而得知已擊中快捷記憶 體100,然而開始執行該指令。 以下將配合圖11至15來說明用以確定快捷記憶體 是否擊中(步驟9 0 0和9 1 0)的步驟。 如上述,當處理器1執行程式時,首先,總控制器 4 0藉著取用存在於程式計數器3 0之記錄項選擇部份 3 0 0 b的數值,以便在已存放於標記記憶體2 0 0的 6 4個記錄項中選擇一個記錄項,然後讀取位址標記資訊 201,遮罩資訊20 2,以及取自於標記記憶體200 的LRU資訊203。標記記億髖200是以雙道的方式 構成,有二組的位址檫記資訊2 0 1和遮罩資訊2 0 2被 讀取*此時*總控制器40執行快捷記億體100中相同 記錄項的存取。 其次,擊中確定電路2 2 0將自標記記憶體2 0 〇所 讀出的位址標記資訊2 0 1與各組中程式計數器3 0的位 址標記部位3 0 0 a作比較以檢査此兩者是否符合,互斥 非或閘2 0 0 0有某一對應數目的输出將與一同等寬度的 數字相比較(在此實施例中爲1 3 ),若其所有的輸出爲 1時,則兩者符合· 此時,選擇器2 2 1 0將自各組所讀取之8個 VLIW指令的遮罩資訊202 (指令0至指令7),選 本紙張尺度適用¥國國家標隼(CNS ) Λ4規格(210X29*7公釐1 ' -19 - (請先閲讀背面之注意事h填寫本頁) .裝· 訂 線 A7 B7 經濟部中央標準局員工消費合作社印裝 五、 發明説明( Π ) 1 I 取 所 關 心 之 V L I W 指 令 的 遮 罩 資 訊 2 0 2 9 若 比 較所 得 1 1 I 的 結 果 和 所 選 取 遮 罩 資 訊 2 0 2 的 遮 罩資 訊 2 0 2 a 一 者 1 1 均 爲 1 則 其 意 謂 著 所 關 心 的 一 組 因 一個 及 閘 2 2 0 1 的 1 I 請 1 I 動 作 而 被 擊 中 9 擊 中 信號 ( 組 0 ) 4 0 0 a 或 4 0 0 b 爲 先 閱 1 I 讀 1 1 0 背 © 1 1 之 1 若 此 二 組 中 有任何 _. 組被 擊 中 y 則致能 — 個 或 閘 注 意 1 1 2 2 0 4 進 而 使 得 快 捷 記 憶 體 被 擊 中, 興 擊 中 組 相 關 的 1 1 資 蜞 I 訊 將 透 過 擊 中 信 號 ( 組 0 ) 4 0 0 a通 知 群 集 A 〇 若 此 寫 本 裝 I 快 捷 記 憶 體 爲 擊 中 則 擊 中 組 的 遮 罩 資訊 2 0 2 b 至 d 將 頁 s^· 1 1 藉 由 擊 中 信 號 ( 組 0 ) 4 0 0 a 成 爲 有效 遮 罩 資 訊 1 1 2 0 2 b 至 d 則 透 過 線 4 1 0 b 至 d 通知 群集 B 至 D 〇 1 1 — 個 9 位 元 的 數 值 將 提 供 給 快 捷記憶 體 1 0 0 a 至 訂 I 1 0 0 d 而 此 9 位 元 數 值 是 由 程 式 計數 器 3 0 的 記 錄 項 1 I 選 擇 部 份 3 0 0 b 結 合 偏 移 值 3 0 0 c所 構 成 0 在 群 集 A 1 1 | 中 將 同 時 白 二 組 記 憶 體 中 讀 取 指 令 欄位 選 擇 器 1 1 線 1 1 2 0 a 則 依 據 顯 示 那 一 組 記 憶 體 被 擊中 的 擊 中 信 號 ( 組 0 ) 來 選 取 其 中 一 個 指 令 撕 位 圖 1 4顯 示 了 這 個 選 取 的 1 1 法 則 〇 1 I 快 捷 記 憶 體 1 0 0 b 至 1 0 0 d 將自 — 組 記 憶 體 中 讀 1 I 出 的 指 令 欄 位 和 Ν 0 Ρ 的 處 理 碼 傅 送 至選 擇 器 1 2 0 b 至 1 1 2 0 d t 選 擇 器 1 2 0 b 至 1 2 0 d係 依 據 有 效 的 遲 罩 1 I 資 訊 4 1 0 b 至 4 1 0 d 來 工 作 圖 15 中 顯 示 了 選 擇 的 1 1 法 則 處 理 碼 是 事 先 設 定 好 的 9 因 此 ,可 藉 由 連 接 的 邏 輯 1 1 予 以 實 現 〇 1 1 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -20 - 經濟部中央標準局員工消費合作社印装 at ___B7 五、發明説明(is) 如上述’自快捷記憶體1 ο o b至1 0 0 d讀出的指 令僅透過選擇器1 2 Ob至1 2 0 d中的一級而提供給處 理單元,因此,可減少所需的處理時脈數目並縮短管線的 .一 ... .— — · ------------------------------- 1 · ————- 長度· 接著將說明快捷記憶體不中(miss)的處理。 若快捷記憶體並未擊中,則由擊中確定電路2 2 0將 不中的訊息經由一個擊中信號4 0 0 c傳送至填入控制電 路 210,之後’填入控制電路210將開始動作,在 此同時,記錄項選擇部份3 0 0 b和程式計數器3 0的偏 移值3 0 0 c將被傳送至快捷記憶體1 〇 〇 a至1 〇 〇 d ,然後,自快捷記憶體1 0 0 a至1 0 0 d中讀出內容· 在此同時,不中的訊息將透過一個擊中信號4 0 0 c傳送 至處理單元1 1 0 a至1 1 〇 d,以便停止這些處理單元 ,因此不會發生任何問題· 接著,填入控制電路2 1 0自主儲存區5中讀取另一 個VL I W指令和對應的遮罩資訊,然後將其存入快捷記 憶體1 00 a至1 00 d和標記記憶體200中所關心的 記錄項,以下將說明這個過程· 首先,檢査是否確實存在有空的記憶區以供新指令存 放在快捷記億體中所關心的記錄項。針對標記記憶體 2 0 0中所關心的記錄項而言,將檢査任一記憶組中 instOmsk至inst7msk的所有遮罩資訊m s k ( A ), 若所有的遮罩資訊m s k ( A )爲0時,則所關心之記億 組中所關心的記錄項爲空的,若未剩餘有空白的區域,則 本紙倀尺度適用中國國家標準(CNS ) A4規格(210X297公釐) ~ ~ -21 - 請先閱讀背面之注意事^寫本頁) .裝· A7 B7 經濟部中央標準局員工消費合作社印製 五、 發明説明( 19 ) 填 入 控 制 電 路 2 1 0 將 使得若 干 組 所 關 心 的 記 錄 項 變 爲 <trrT. m 效 以 取 得 — 個 空 白 的 面 域 » 這 個 動 作 稱 爲 快 捷 記 億 體 的 % 使 Λητ. 撕 效 0 當 快 捷 記 憶 體 進 行 使失 效 時 填 入 控 制 電 路 2 1 0 將 選 取 一 個 即 將 使 其 失 效 ( 步 驟 9 2 0 ) 的 資 料 組 » 然 後 對 此 選 出 的 資 料組 記 錄 項 進行使 失 效 ( 步 驟 9 3 0 ) 9 以 下 將 說 明 使 失 效 的 方 法 〇 若 仍 剩餘有 空 白 區 或者藉 由 快捷記億 體 的 使失 效 處 理 而取 得 空 白 區 則 填 入 控 制 電 路 2 1 0 將 位 址 標 記 資 訊 2 0 1 經 由 線 4 5 4 存 入 標 記 記 億 髖 2 0 0 並 產 生 一 個 新 的 記 錄 項 ( 步 驟 9 4 0 ) 然 後 在 步 驟 9 5 0 中 填 入 控 制 電 路 2 1 0 同 時 讀 取 8 個 指 令所 需 的 遮 罩 資 訊 7 0 2 以 符 合 — 個 3 2 位 元 寬 的 匯 流 排 填 入 控 制 電 路 2 1 0 再 將 讀 出 的 遮 罩 資 訊 7 0 2 存 入 檫 記 記 憶 髖 2 0 0 以 及 填 入 控 制 電 路 2 1 0 本 身 接 著 -1»戈 輸 出 V L I W 指 令 7 0 1 依 據 8 個 指 令 所 需 的 遮 罩 資 訊 而 包 含 有 8 個 連 績 的 指 令 〇 當 填 入 控 制 電 路 2 1 0 讀 取 V L I W 指 令 7 0 1 時 填 入 控制 電 路 2 1 0 將 分 析 遮 罩 資 訊 7 0 2 且 根 據 分 析 所 得 的 結 果 送 出 一 個 寫 入 信 號 給 所 關 心 的 快 捷 記 憶 體 9 由 主 儲 存 區 5 導 引 出 的 指 令 饋 入 路 徑 且 3 2 位 元 的 寬 度 t da 與 指 令 欄 位 的 大 小 是 相 同 的 因 此 1 對 於 可 寫 入 資 料 的 快 捷 記 憶 體 而 言 9 其 規 格 的 執 行 僅 被 允 許 使 用 快 捷 記 億 體 1 0 0 a 至 1 0 0 d 的 各 個 寫 入 信 號 〇 若 兩 組 記 億 區 有 剩 餘 的 空 白 區 或 者 經 由 使 失 效 的 動 作 請 先 閱 讀 背 訂 本紙張尺度逋用中國國家榡準(CNS ) Λ4規格(210X297公釐) 裝 -22 - 經濟部中央標準局貝工消費合作社印製 A7 _B7__ 五、發明説明(2〇 ) 而使其成爲空白區’則事先會決定指令是存放在那一組記 憶區中。 如上述,處理器包含了 Ν Ο P指令的處理碼,因此, 不需要再存入NOP指令。若各個VLIW指令包含有 NO P指令所需的一個指令禰位,則填入控制電路2 1 0 將依據遮罩資訊,禁止將指令寫入快捷記億體。 因此,至多有8個VL I W指令被存放在快捷記億體 中,而這些快捷記億體是位於與指令相對應的群集中,此 外,各個VL I W指令則是置於對應的指令檷位中· 根據本發明,如上述,因爲NOP已由存放在主儲存 區5的指令串7 1 〇中被除去,則存放在快捷記憶體中之 指令的位址是由程式計數器3 0的數值所決定,而其位址 列表是與存放在主儲存區5中的指令位址不同,所以在存 取主儲存區5時,將透過存在於填入控制電路2 1 0中的 位址轉換緩衝器以及存放在主儲存區5中的位址轉換表來 進行位址的轉換。 填入控制電路2 1 0透過相關的機制,進行程式計數 器3 0的位址數值轉換,透過路徑4 5* 0以讀取主儲存區 5之後由轉換位址所顯示的指令,然後將此指令存入快捷 記億體1 0 0中,在路徑4 5 0中,除了轉換位址之外, 亦包含有主儲存的一個控制信號,後績的處理則與擊中當 時所執行的處理相同。 若干上述的處理被允許能夠平行或重新安排次序地予 以執行•例如,可同時更新LRU資訊(步驟9 6 0 )以 本紙張尺度適用中國國家標準(CNS ) A4规格(210X 297公釐) ---------^-- (請先閲讀背面之注意事^.楱寫本頁) 訂 線 -23 - A7 B7 經濟部中央標準局員工消費合作社印裝 五、 發明説明( 21 ) 1 | 及 饋 入 指 令 ( 步 驟 9 7 0 ) 〇 1 1 其 次 * 將 說 明 選 取 — 使 失 效 之 記 億 組 的 方 法 y 透 過 1 1 L R U 資 訊 2 0 3 的 使 用 * 可 執 行 選 取 使 失 效 之 記 億 組 的 1 | 動 作 ( 步 驟 9 2 0 ) 9 它 顯 示 出 巨 前 所 使 用 的 是 那 ―― 組記 請 先 閲 1 I 憶 9 若 巨 前 所 使 用 的 是 第 % 0 組 9 則 擊 中 確 定 電 路 背 面 1 1 I 2 2 0 存 入 0 , 若 @ 刖 使 用 的 是 % 1 組 » 則 存 入 % 之 注 意 1 1 I 1 離 » 換 言 之 9 當 擊 中 快 捷 記 憶 體 時 > 記億組 A 的 擊 中 信 1 1 1 號 4 0 0 a 的 數 值 將 被 寫 入 相 對應 之 記 錄項 的 L R U 資 訊 填 窝 本 1 裝 2 0 3 0 頁 1 1 以 下 將 說 明 使 失 效 的 過 程 > 首 先 填 入 控 制 電 路 1 1 2 1 0 將 檢 査 是 否 有 個 新 指 令 被输 入 至 具 有 舊 存 取 歷 史 1 I 的 — 組 快 捷 記 億 體 而 此 舊 存 取 歷 史 是 由 記 錄 項 中 的 訂 I L R U 資 訊 2 0 3 所 表 示 〇 若 % 新 指 令 的 標 竿 資 訊 中 的 1 1 I 各 個 位 元 與 % 具 有 舊 存 取 歷 史 之 指 令 中 的 標 竿 資 訊 • 之 各 1 1 I 個 位 元 二 者 作 % A N D • 運 算 所 得 的 結 果 爲 零 時 新 指 令 1 1 可 被 存 放 在 該 組 的 快 捷 記 憶 體 中 而 上 述 的 舊 存 取 歷 史 是 線 1 由 L R U 資 訊 2 0 3 所 顯 示 0 然 後 對 該 組 具 有 由 L R U 1 1 資 訊 2 0 3 所 顯 示 之 舊 存 取 資 料 的 記 憶 體 執行 使 失 效處 理 1 I t 爲 使 此 組 記 憶 體 成 爲 撕 效 相 對 應 記 憶組 中 標 記 記 憶 體 1 I 2 0 0 和 標 竿 資 訊 亦 即 i ns t 0至 i ns t7的 m S k ( A ) 1 1 | 2 0 2 a 將 成 爲 零 0 1 1 對 於 檢 査 的 結 果 而言 若 Arr. m 新 指 令 可 •U-Λ. 輸 入 該 組 記 憶 體 1 1 > 則 可 針 對 具 有 由 L R U 資 訊 2 0 3 所 表 示 之 新 存 取 歷 史 1 1 的 — 組 記 憶 體 進 行 相 同 的 檢 査 9 若 新 指 令 可 被 Μ·Λ. 輸 入 至 此 組 1 1 本紙張尺度適用中國國家標华(CNS〉A4規格(21〇X297公釐) -24 - 經濟部中央標準局貝工消費合作杜印製 A7 ______Β7__ 五、發明説明(22) 記憶體,則該組具有由LRU資訊2 0 3所顯示之新存取 歷史的記億體將變爲失效,假使在該兩組記憶體已成失效 的情況下,仍無新指令被輸入至記憶組時,這二組記憶體 將成爲失效。 爲了使該二組記憶體失效,填入控制電路2 1 0將所 有的mask (A) 202a設定爲零,而mask (A )2 0 2 a 係對應於 i n s 10 m a s k 至 i n s 17 m a s k 的群集 A, 而instQmask和inst7mask係存在於選自於槺記記憶體 2 Ο 〇中的記憶組遮罩資訊•若其中有任何一組記億體失 效時,則自該組記憶體中讀取一個新的指令,此時遮罩資 訊是被重置的,因此,不需要將該資訊設定爲零,當開機 時*遮罩資訊2 0 2將進行初始化(被清除爲零)以利後 績的使失效處理。 在上述的說明中,處理單元1 1 0 a在配置及控制上 能使得有效的指令被集中在一起,當然,本發明並不受限 於此種配置及控制。 再者,在本實施例中,快捷記憶體1 〇 〇 a的容置是 二倍於其中快捷記憶體中各記憶體的容量,然而,這不限 於容量。本發明中的快捷記憶體在配置上可符合將多個指 令集中在一特定處理單元中的速率* 本紙張尺度適用中國國家標準(CNS > Λ4規格(210X297公釐) I---------^-- 請先閱讀背面之注意事七;填寫本頁) 訂· 線