TW454161B - A dual-ported pipelined two level cache system - Google Patents

A dual-ported pipelined two level cache system Download PDF

Info

Publication number
TW454161B
TW454161B TW088121954A TW88121954A TW454161B TW 454161 B TW454161 B TW 454161B TW 088121954 A TW088121954 A TW 088121954A TW 88121954 A TW88121954 A TW 88121954A TW 454161 B TW454161 B TW 454161B
Authority
TW
Taiwan
Prior art keywords
cache
level
level cache
virtual address
address
Prior art date
Application number
TW088121954A
Other languages
English (en)
Inventor
John Wai Cheong Fu
Dean A Mulla
Gregory S Mathews
Stuart E Sailer
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Application granted granted Critical
Publication of TW454161B publication Critical patent/TW454161B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0893Caches characterised by their organisation or structure
    • G06F12/0897Caches characterised by their organisation or structure with two or more cache hierarchy levels

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Description

54161 A7 __;____B7______ 五、發明說明(I ) 發明領域 * « (請先閱讀背面之注意事項再填寫本頁) 本發明係一般有關電子資料處理裝置的領域。更特別 是,本發明係有關快取記憶體。 發明背景 當今許多電腦系統使用快取記憶體來改善常用資料與 指令的存取速度。小型快取記憶體可被整合於微處理器晶 片,因此藉由不需離開微處理器晶片而從外部記憶體存取 資料或指令來大幅改進存取速度。 經濟部智慧財產局員工消費合作杜印製 在正常資料載入存取例行程序期間,微處理器首先會 注意晶載快取記憶體,來檢視期望之資料或指令是否存在 於此。若其不存在,則微處理器接著會注意晶外記憶體。 晶載記憶體或快取記憶體係小於主記憶體。多重主記憶體 的位置可以被映射至快取記憶體。代表最常用之資料與指 令之主記憶體的位置或位址係被映射至快取記憶體。快取 記憶體入口必須包含資料及與資料相關位址有關之足夠資 訊(“標籤位址及狀態”位元),以與已被映射至快取記憶體 的外部位址或主記憶體位址有效地通訊。爲了改善找到快 取記憶體中之位址的比例(快取”命中率”),對於快取記憶 體被設定爲結合的係令人期待的,如記憶體中之特定位置 可以多種途徑被儲存於快取記憶體。 因爲大多數先前設計的快取爲低頻,所以其可提供相 ^___ 4 張尺度適用中國國家標準(CNS)A4規格(210 X 297公t~ 4 5416 1 A7 B7 五、發明說明(z) 當大的快取,如一個包含整數資料及較大浮點資料之快取 。然而,當微處理器頻率及指令發出寬度增加時,晶片裝 載快取系統的效能變成越來越重要。在快取設計中,低潛 伏期間及高容量的要求無法相容。例如,低潛伏期間存取 的快取通常意味著該快取擁有小容量。相反的,大型快取 意味著該快取擁有長潛伏期間存取。 針對上述理由,及針對熟知習知技術人士於閱讀及了 解本說明書時會更明瞭之下所述之其他理由,對於晶載快 取記憶體發展改善之效能係想要的。 發明槪要 提供一種增加微處理器效能的新穎快取記憶體及操作 方法。在一個實施例中,快取記憶體有兩級。第一級快取 擁有一個第一位址埠及一個第二位址埠。類似地,第二級 快取擁有一個第一位址埠及一個第二位址埠。一個佇列架 構被耦合於第一級及第二級快取之間。於另一個實施例中 ,其提供一種存取快取記憶體的方法。此方法包含提供一 個第一虛擬位址及一個第二虛擬位址至第一級快取記憶體 中之第一轉換後備緩衝器及第二轉換後備緩衝器。此方法 更進一步包含提供一個第一虛擬位址及一個第二虛擬位址 至第二級快取記憶體中的轉換後備緩衝區。於第一處理器 時脈週期中提供第一虛擬位址及第二虛擬位址至第一級及 第二級快取記憶體。於第二處理器時脈週期後提供對應第 5 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公髮) (請先閱讀背面之注音?事項再填寫本頁) 裝---- 訂—-------蟓: 經濟部智慧財產局員工消費合作社印製 4 5 4161 A7 一 B7 五、發明說明(6) 一虛擬位址之第一快取命中/遺漏訊號經佇列架構至第二級 快取記憶體中之仲裁器。 圖式簡單說明 圖1爲描述根據本發明教示之快取記憶體之一實施例 的方塊圖。 圖2爲描述根據本發明教示之電腦系統之一實施例的 方塊圖。 圖3係以流程圖之形式描述根據本發明教示之一種載 入存取兩級快取記憶體之方法。 圖4係以流程圖之形式描述根據本發明教示之載入存 取兩級快取記憶體之一更詳細實施例。 圖5係以流程圖之形式描述根據本發明教示之載入存 取兩級快取記憶體之另一個方法的流程型式圖。 圖6係以流程圖之形式描述根據本發明教示之載入存 取兩級快取記憶體之另一個方法。 元件符號說明 1〇〇:快取記憶體 110 :第一級快取記憶體 120 :第二級快取記憶體 130、150 :第一位址埠 6 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) (請先閱讀背面之注意事項再填寫本頁) 裝.! !|訂·! ----線 經濟部智慧財產局員工消費合作社印製 454161 A7 B7 經濟部智慧財產局員工消費合作社印製 五、發明說明(4) 140、160 :第二位址埠 170 :排列架構 180 :轉換後備緩衝器 190 :第一轉換緩衝器 200 :第二轉換緩衝器. 210 :仲裁器 220 :第一快取標籤 230 :第一快取隨機存取記憶體 240、310 :實體位址比較器 250、320 :資料調處塊 260 :多工器 270 :暫存器檔 280:算數邏輯單元 290 :第二快取標籤 300 :第二快取隨機存取記憶體 330 :快取查找階 340 :資料調處階 400 :電腦系統 410 :微處理器晶片 420 :執行單元 430 :晶載快取記憶體 440 :第一級快取(L0) 450 :第二級快取(L1) 460、480 ··第一位址埠 (請先閱讀背面之注意事項再填寫本頁) /裝--------訂---------線· 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 4 5416 1 A7 B7 五、發明說明(< ) 470、490 :第二位址埠 500 :佇列架構 (請先閱讀背面之注意事項再填寫本頁) 51〇:晶外記憶體 520:匯流排 530 ' 540 :位址匯流排 700、930、950 :第一級快取記憶體 710、940 :第二級快取記憶體 73〇、920、1010、1020 :第二處理器時脈週期 800、810、820、900、910 :第一處理器時脈週期 1000 :第一虛擬位址及第二虛擬位址 詳細說明 提供一種提供改善快取的新穎快取記憶體。下列詳細 說明中,將詳細說明許多特定之細節以徹底了解本發明。 然而’熟知本項技術的人士應了解的是,本發明可在不需
I 這些特定細節下來實現。但在其他例子中,並未詳細說明 熟知的方法、程序、組件及電路以避免妨礙到本發明。 經濟部智慧財產局員工消費合作社印製 圖1爲描述根據本發明教示之快取記憶體100之一實 施例的方塊圖。圖1所描述之快取記億體100係包含一個 快取記憶體110之第一級(L0)及一個快取記憶體120之第 二級(L1)。快取記憶體110之第一級L0在此說明書中也被 稱爲第一級快取記憶體110。快取記憶體120之第二級L1 在此說明書中也被稱爲第二級快取記憶體12〇。第一級快 8 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 4 54 1 6 A7 B7 五、發明說明(^) (請先閱讀背面之注意事項再填寫本頁) 取記憶體110被設計爲擁有低的資料載入存取潛伏期間。 在一個實施例中,第一級快取記憶體110僅包含整數資料 ,以提供低的載入存取潛伏期間。資料存取至第一級快取 .記憶體110於兩個時脈週期中被完成。第二級快取記憶體 120的容量較第一級快取記憶體110爲大且包含浮點資料 及整數資料。於是,第二級快取記憶體120的載入存取潛 伏期間較第一級快取記憶體110爲長。第一級快取記憶體 110及第二級快取記憶體120被雙重埠接。如圖1所示, 第一級快取記億體110擁有一個第一位址埠130及一個第 二位址埠140。第二級快取記憶體120擁有一個第一位址 埠150及一個第二位址埠160。佇列架構170被耦合於第 一級快取110及第二級快取120之間。本發明之佇列架構 170包含被建構以達成本發明說明目的之邏輯電路。微處 理器快取架構之習知技術中的一般技術人士在閱讀此揭示 時將了解,此邏輯電路可以各種形式被設置。 經濟部智慧財產局員工消費合作社印製 如圖1所示,虛擬位址分別被提供至每一個位址璋 130,140,150及160。在一個實施例中,用於第一級快取 記憶體110之第一位址埠130接收第一虛擬位址,或針對 第一記憶體的虛擬位址VA0,且同時,用於第二級快取記 憶體120之第二址埠130接收第二虛擬位址VA1。在一個 實施例中,用於第二級快取記憶體120之第一位址埠150 接收第一虛擬位址VA0,且同時,用於第一級快取記憶體 110之第二址埠160接收第二虛擬位址VA1。 圖1更進一步描述,第一級快取110擁有一個第一轉 9 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 14161 A7 _;___B7____ 五、發明說明(T ) 換後備緩衝器190及一個第二轉換後備緩衝器200。第一 轉換後備緩衝器190被耦合至第一級快取110之第一位址 埠130以接收第一虛擬位址VA0。第二轉換後備緩衝器 200被耦合至第一級快取110之第二位址埠140以接收第 二虛擬位址VA1。在一個實施例中,第一級快取110之每 個轉換後備緩衝器190及200包含至少32個入口。在一個 實施例中,第一轉換後備緩衝器190及第二轉換後備緩衝 器200 相同之雙埠實體轉換緩衝器。第一轉換後備緩衝 器190及第二轉換後備緩衝器200,分別經實體位址比較 器240及310且經排列架構170,被耦合至第二級快取120 中之仲裁器210。排列架構170被設計成將分別來自實體 位址比較器240及310之第一級快取命中/遺漏訊號及來自 轉換後備緩衝器180之實體位址耦合至仲裁器210。在另 一假實施例中,圖1所示之第二級快取120中的轉換後備 緩衝器180並不存在。在此實施例中,實體位址經由佇列 架構170從第一轉換緩衝器190及第二轉換緩衝器200被 耦合至仲裁器210。分別來自實體位址比較器240及310 之第一級快取命中/遺漏訊號也經由佇列架構170被耦合至 仲裁器210。仲裁器210包含邏輯電路來解譯第一級快取 命中/遺漏訊號。仲裁器210內之邏輯電路被建構以達成本 發明的預期功能。本項技術中的一般技術人士在閱讀此揭 示時將了解,此邏輯電路可以各種形式被設置。 第一級快取Π0更進一步包含一個與第一轉換緩衝器 190相關之第一快取標籤(TAG)22〇。第一快取標籤22〇爲 10 $1^長尺度適用中國國家標準(CNS)A4規格(21(^ 297公^1 " (請先聞讀背面之注意事項再填寫本頁) 裝 ---!1訂 -- ------ 經濟部智慧財產局員工消費合作社印製 454161 經濟部智慧財產局員工消費合作杜印製 A7 B7 五、發明說明(?) 第一虛擬位址VAO供應位址資訊(“標籤位址及狀態”位元) 。同樣針對第一記億體需求而供應資料的第一快取隨機存 取記憶體(RAM)230亦被包含。於第一時脈週期中’第一 級快取Π〇係可完成記憶體需求的快取查找。在第二時脈 週期中,來自第一轉換緩衝器190之實體位址與實體位址 比較器240中之快取標籤220實體位址資料相比較,以指 出快取命中/遺漏及途徑。此資訊係被用於資料調處塊250 ,並且同時被傳送至佇列架構170。該資料調處塊250係 包含可用來挑選途徑、校準及雙序調換該快取隨檄昆取記 億體資料輸出的邏輯電路。本項技術中的一般技術人士可 r---- 從閱讀此揭示來了解,這些功能可以各種形式被賓施及被 組織爲部份資料的調處塊。如圖1所示,多工器260被耦 合至資料調處塊250。該多工器260更進一步被耦合至諸 如暫存器檔270的多功能單元且被耦合至算數邏輯單元 (ALU)280。在一個實施例中,多工器260包含可引導被調 處資料組至諸如暫存器檔270或算數邏輯單元(ALU)280之 預期位置的選路電路。微處理器快取架構之習知技術中的 一般技術1人士在閱讀此揭示時將了解,此選路電路可以各 種形式被設置。 如圖1所示,第—級快取110更進一步包含一個與第 二轉換緩衝器190相關之第二快取標籤(TAG)290。在一個 實施例中,第一快取標籤22〇及第二快取標籤29〇爲雙埠 之相同實體標籤陣列的一部份(亦即使兩個同時載入存取甚 至被實際執行至相同入口 )。第二快取標籤290爲第二虛擬 11 本紙張尺度適用中國國家標準(CNS)A4規格(210 x 297公釐) 1 ^^1 n _1 n I n n n n-*-rOJ I n I n I I (請先閱讀背面之注意事項 y填寫本頁) 4 54161 A7 B7 五、發明說明(q) 位址VA1供應位址資訊(“標籤位址及狀態”位元)。類似地 針對第二記憶體需求而供應資料的第二快取隨機存取記憶 體(RAM)300亦被包含。在一個實施例中,快取隨機存取 記憶體230及300釋雙埠之相同實體資料陣列的一部份^ 於第一時脈週期中,記憶體需求的快取查找係被完成於第 一級快取110中。在第二時脈週期中,來自第二轉換緩衝 器200之實體位址係與實體位址比較器310中之第二快取 標籤290實體位址資料相比較,以指出快取命中/遺漏及途 徑。此快取命中/遺漏及途徑資訊係被用於資料調處塊320 ,且被同時傳送至排列架構170。該資料調處塊320包含 可用來挑選途徑、校準及雙序調換該快取隨機存取記憶體 • . 資料輸出的邏輯電路。習知技術中的一般技術人士可從閱 讀此揭示來了解,這些功能係以各種形式被實施並且被組 織爲部份資料調處塊。如圖1所示,多工器260被耦合至 資料調處塊320。多工器260更進一步被耦合至諸如暫存 器檔27〇的多功能單元,並且被耦合至算數邏輯單元 (ALU)280。在一個實施例中,多工器260包含可引導被調 處資料組至如暫存器檔270或算數邏輯單元(ALU)280之預 期位置的選路電路。 圖1亦顯示第二級快取120中之轉換後備緩衝器180 。在一個實施例中,第二級快取120之轉換後備緩衝器 180具有至少96個入口。在一個實施例中,轉換後備緩衝 器180被改造,以分別從第一位址埠140及第二位址埠 150同時接收第二級快取12〇之第一虛擬位址VA0及第二 12 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) (請先閱讀背面之注意事項再填寫本頁) 訂--------- 經濟部智慧財產局員工消費合作社印製 454161 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(π ) 虛擬位址VA1。在一個實施例中,第二級快取120係爲被 堆積的雙埠。亦即,只要這些快取存取不被接至相同的儲 存體,則第二級快取有助於兩個同步快取載入存取至相同 的快取管線。第二級快取120之轉換後備緩衝器180經由 佇列架構170被耦合至仲裁器21Ό。該仲裁器210被耦合 至第二級快取120之快取查找階330。習知技術中的一般 技術人士在閱讀此揭示時將了解,此快取查找階330可被 裝配爲各種形式以達成快取査找。第二快取査找階330更 進一步被賴命至第二級快取12〇中之資料調處階34〇。資 料調處階340包含可用來挑選途徑、校準及雙序調換快取 隨機存取記憶體資料輸出的邏輯電路。本項技術中的一般 技術人士可從閱讀此揭示來了解,這些功能被實施及被組 織之方式可做爲部份資料調處塊340。第二級快取120之 資料調處塊340被稱合至上述之多工器260。如以上詳述 ,多工器260包含可引導被調處資料組至諸如暫存器檔 250或算數邏輯單元260之預期位置的選路電路。 在一個實施例中,第一級快取110之第一位址埠130 及第二級快取120之第二位址埠150係被改造以同時接收 第一虛擬位址VA0。在此實施例中,於第一時脈週期中, 第一級快取110及第二級快取120係睦,亦即 並行啓動第一虛擬位址VA0的快取查找。在此實施例中, 第一級快取110係被改造,以完成第一時脈週期中之第一 虛擬位址VA0的快取查找。佇列架構170係被改造,以從 第一級快取110中之實體位址比較器240,將第一虛擬位 13 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) (請先閱讀背面之注意事項再填寫本頁) 裝--------—訂---------線 454161 經濟部智慧財產局員工消費合作杜印製 A7 B7 五、發明說明(Λ ) 址VAO之第一快取命中/遺漏訊號耦合至第二級快取12〇 中之仲裁器210,使第一快取命中/遺漏訊號得於第二時脈 週期後被提供至仲裁器21〇。若被提供至仲裁器之第 一虛擬位址VA0訊號之第一快取命中/遺漏訊號係第一虛 擬位址VA0爲第一級快取110中之快取”命中”,則仲裁器 可中斷第二級快取12〇中之第一虛擬位址VA0的快取査找 。,另外,若至仲裁器210之第二虛擬位址VA1訊號之第一 快取命中/遺漏訊號係第二虛擬位址VA1爲第一級快取110 中之快取”遺漏”,則仲裁器使第一虛擬位址VA0的快取查 找或資料存取得以前進至第二級快取120管線。若第一虛 擬位址VA0的快取查找爲第二級快取120中之快取”命中” ,則資料組被提供至第二級快取120中之資料調處階340 。在第二級快取120中之下一階,被調處資料組被傳送至 以上呈現之多工器260。 在另一個實施例中,第一級快取Π0之第二位址埠 140及第二級快取120之第二位址埠160係被改造,以同 時接收第二虛擬位址VA1。在此實施例中,於第一時脈週 期中,第一級快取110及第二級快取120係被改造以同時 啓動第二虛擬位址VA1的快取查找。在此實施例中,第一 級快取11〇係被改造以完成第一時脈週期中之第二虛擬位 址VA1的快取查找。佇列架構170係被改造以從第一級快 取110之實體位址比較器310將用作第二虛擬位址VA1之 第一快取命中/遺漏訊號耦合至第二級快取120中之仲裁器 210,使第一快取命中/遺漏訊號得於第二時脈週期後被提 14 本^&尺度適用中國國票準(CNS)A4規格(210 X 297公釐) ' (請先閱讀背面之注意事項再填寫本頁)
'.· · ! 11 丨 11 ------— II 541 S1 Α7 ___Β7 ,____ 五、發明說明(0〇 供至仲裁器210。若第二虛擬位址VA1之第一快取命中/遺 漏訊號傳送至仲裁器21〇係第二虛擬位址VA1爲第一級快 取110中之快取”命中”,則仲裁器210可中斷第二級快取 120中之第二虛擬位址VA1的快取查找。另外,若至仲裁 器210之第二虛擬位址VA1訊號之第一快取命中/遺漏訊 號係第二虛擬位址VA1爲第一級快取110中之快取”遺漏” ,則仲裁器21〇可使第二虛擬位址VA1的快取查找或資料 存取得以前進至第二級快取120。若第二虛擬位址VA1的 快取查找爲第二級快取12〇中之快取”命中”,則資料組被 提供至第二級快取12〇中之資料調處階340,並且被提供 至上述之多工器260。在一個實施例中,佇列架構被改造 以同時提供第二虛擬位址VA1之第一快取命中/遺漏訊號 及第二虛擬位址VA1之第一快取命中/遺漏訊號至仲裁器 210。 第一級快取110被設計用於整數資料恢復。亦即,在 —個實施例中,本發明之兩級快取系統的分配策略係僅儲 存整數資料於第一級快取110,且資料調處邏輯僅被設計 來處理整數資料大小及校準。如所述,在一個實施例中, 第一轉換後備緩衝器190及第二轉換後備緩衝器200具有 32個入口。同時’第二級快取12〇被提供處理來自快取記 憶體1〇〇之整數及浮點資料恢復的能力。第二級快取12〇 中之資料調處階340大於第一級快取ι10中之資料調處塊 250及320,以便於處理整數及浮點資料。因爲整數資料的 潛伏期間對整個微處理器的效能更爲重要,所以本發明被 15 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 454161 A7 _ B7__ 五、發明說明(ή ) 設g十爲仍可維持浮點量及容量下余降低整數資料恢復的潛 伏期間。本發明之一實施例並不減緩整數資料恢復,以加 快浮點資料但仍可維持浮點產量及容量。 本發明之一實施例中,具有佇列架構1<7〇之最新兩級 結構係維持快取資料之較高管線處理能力而降低電路複雜 性及製造成本。第一級快取110中之整數資料可於兩個時 脈週期內被存取。相對的,其他針對如浮點資料之大型資 料之低潛伏期的快取設計使用了小容量快取,其導致浮點 資料之可推論的高快取”遺漏”率。本發明之一實施例中, 僅有整數資料被包含於第一級快取110中。 於一實施例中’第一級快取110之設計係以小快取容 量來促進高處理能力的真正雙埠快取。於此實施例中,第 一級快取110係不是被堆積之雙埠,並且具有小於較大之 第二級快取120的較小快取線尺寸(32位元組)。第一級快 取110具有較小之快取線尺寸,以使不同的記憶體位置數 量極大化,其被包含於第一級快取110之內而仍可因資料 位置而允許合理的效率。第一級快取110爲不被堆積之快 取,以避免儲存體衝突的產生。在此,儲存體衝突的產生 會因第一級快取110之處理32位元組快取線尺寸而相當高 。然而’此實施例中,第一級快取110處理整數資料。若 第一級快取110接收整數資料,則其執行整數資料位址上 的快取查找’決定其是否於第一時脈週期內擁有快取”命中 ”或”遺漏”’並且傳送此結果至佇列架構170。 第二級快取120擁有較第一級快取110爲大的容量。 16 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公髮) 454161 經濟部智慧財產局員工消費合作杜印製 A7 B7 五、發明說明(彳) 於一個實施例中,第二級快取120是被堆積之雙埠且可能 有儲存體衝突。於此實施例中’儲存體被挑選是因爲位於 第二級快取120之真正雙埠結構可能因爲其快取容量較大 而明顯較貴。使用8位元組儲存體尺寸(較8位元組大之存 取同時使用兩個儲存體)及64位元組快取線尺寸儲存體後 ,第二級快取120不可能引起儲存體衝突。然而,若第二 級快取120真的接收兩個同步載入存取至相同的儲存體, 其將放置資料存取(通常爲第二資料存取)於佇列架構170 且執行其他者(通常爲第一資料存取)。在隨後時脈週期中 ,第二級快取120可恢復及執行被放置固定於佇列架構 Π0中之資料存取,或第二級快取120可執行第一級快取 110中之快取”遺漏”的新資料存取。因此,在本發明之最 新兩級快取系統中,係強調高產量,。< 圖2爲描述根據本發明:停授之電腦系統400之一實施 例的方塊圖。圖2所描述之電腦系統400包含一個根據處 理器時脈來運作的微處理器晶片410。微處理器可解碼及 執行諸如擁有指令組之應用程式或辑作系統的電腦程式。 於一個實施例中,微處理器可解碼及執行諸如擁有從多重 指令組出來之指令之應用程式或操作系統的電腦程式。微 處理器晶片410包含許多被顯示爲420A,420B,..., 42〇N的執行單元。微處理器晶片包含一個晶載快取記憶體 43〇。晶載快取記憶體430包含與圖1 —起被解譯之兩級快 取結構。如與圖1 一起被解釋的,晶載快取記憶體430包 含一個第一級快取(L0)440及一個第二級快取(L1)45〇。第 17 (請先閱讀背面之注意事項再填寫本頁) -Ί^4 · 11----—訂---I! — — · 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 454161 A7 B7 五、發明說明(<) 一級快取(L0)440擁有一個第一位址埠460及一個第二位 址埠470。第二級快取450擁有一個第一位址埠480及一 個第二位址埠490。晶載快取記憶體430包含一個排列架 構500,其被耦合於第一級快取440及第二級快取450之 間。電腦系統400更進一步包含一個晶外記憶體510。晶 外記憶體510可包含動態隨機存取記憶體(DRAM)」靜態隨 機存取記憶體(SRAM),快閃型記憶體,或其他可替代記憶 體類型。電腦系統400包含一個可耦合晶外記憶體510至 微處理器晶片410的匯流排520。匯流排520包含一個單 匯流排或多匯流排的組合。例如,匯流排520可包含一個 工業標準架構(ISA)匯流排,一個延伸工業標準架構(EISA) 匯流排,一個系統匯流排,一個X匯流排,一個ps/2匯流 排,一個週邊組件互連(PCI)匯流排,一個個人電腦記憶卡 國際協會(PCMCIA)匯流排,或其他匯流排。匯流排520也 可包含任何匯流排的組合。 經濟部智慧財產局員工消費合作社印製 於一個實施例中,第一級快取440擁有至少兩個位址 匯流排530及540,其係可於任何被給定時脈週期將第一 位址埠460及第二位址埠470耦合至從許多執行單元42〇A ,420B,. . . ,420N之間而來的兩個獨立執彳了單兀。.於 一個實施例中,第二級快取MO擁有至少兩個位址匯流排 550及560,係可於任何被給定時脈週期將第一位址埠480 及第二位址埠490耦合至從許多執行單元420A,420B,· ..,420N之間而來的兩個獨立執行單元。 圖3爲描述根據本發明教示之一種載入存取兩級快取 .--------- 18 本紙張尺度適用中國國家標準(CNS〉A4規格(210 X 297公釐) 454161 Α7 Β7 五、發明說明(A ) 記憶體_^法的流程圖。如圖3所示,此方法包含提供一 ---- — 個第一虛擬位址及一個第二虛擬位址至快取記憶體700之 第一級(L0)中的一個第一轉換後備緩衝器(TLB0)及一個第 二轉換後備緩衝器(TLB1)。每個轉換後備緩衝器包含至少 32個通道。此方法包含同時提供一個第一虛擬位址及一個 第二虛擬位址至快取記憶體710之第二級(L1)中之包含至 少96個通道的轉換後備緩衝器。提供第一虛擬位址及第二 虛擬位址至第一級(L0)及第二級(L1)是發生於第一處理器 時脈週期內。在第二處理器時脈週期730後,對應第一虛 擬位址之第一級快取命中/遺漏訊號經佇列架構被提供至快 取記憶體之第二級(L1)中的仲裁器。 在圖3之一個實施例中,在第二處理器時脈週期730 後,提供對應第一虛擬位址之第一級快取命中/遺漏訊號至 快取記憶體之第二級(L1)中的仲裁器,其更進一步包含提 供對應第二虛擬位址之第二級快取命中/遺漏訊號經佇列架 構至快取記憶體之第二級(L1)中的仲裁器。 經濟部智慧財產局員工消費合作杜印製 圖4爲描述根據本發明傳授之載入存取雨級快取記憶 體之另一個方法的流程圖。如圖4所示此方法包含於第一 處理器時脈週期800中啓動快取記憶體之第一級(L0)之第 一虛擬位址及第二虛凝位址的快取查找。此方法包含於第 一處理器時脈週期810中同時啓動快取記憶體之第二級 (L1)之第一虛擬位址及第二虛擬位址的快取查找。此方法 更進一步包含於第一處理器時脈週期820中完成之快取記 憶體之第一級(L0)之第一虛擬位址及第二虛擬位址的快取 19 本^尺度適用中國國家標準(CNS)A4規格(210 X 297ϋ 454161 A7 B7 五、發明說明(、α ) 查找。 於一實施例中,圖4之方法更進一步包含調處一個資 料組,其係代表第二處理器時脈週期中之快取記憶體之第 一級(L0)之第一虛擬位址的快取命中及輸出第二處理器時 脈週期中之資料組。於一實施例中,輸出第二處理器時脈 週期中之資料組包含將資料組傳送至算術邏輯單元(ALU) 。可替代實施例中,輸出第二處理器時脈週期中之資料組 包含將資料組傳送至暫存器檔。 於一實施例中,圖4之方法更進一步包含調處一個資 料組,其係代表第二處理器時脈週期中之快取記憶體之第 一級(L0)之第一虛擬位址的快取命中。此實施例中,此方 法包含從快取記憶體之第一級(L0)提供一個或更多資料組 至多工器(MUX)。多工器於第二處理器時脈週期內提供選 路優先至從快取記憶體之第一級(L0)之出來之資料組及從 快取記憶體之第二級(L1)出來之資料組。 圖5爲描述根據本發明教示之載入存取兩級快取記憶 體之另一個方法的流程圖。如圖5所示,此方法包含啓動 第一處理器時脈週期900中之快取記憶體之第一級(L0)中 之第一虛擬位址及第二虛擬位址的快取查找。此方法包含 同時啓動第一處理器時脈週期910中之快取記憶體之第二 級(L1)之第一虛擬位址及第二虛擬位址的快取查找。對應 第一虛擬位址之第一快取命中/遺漏訊號於第二處理器時脈 週期920之後被提供,其經佇列架構至快取記憶體之第二 級(L1)中的仲裁器。當第一快取命中/遺漏訊號表示快取記 20 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) '( (請先閱讀背面之注意事項再填寫本頁) -i 裝 -----訂 -------- 經濟部智慧財產局員工消費合作社印製 454161 A7 B7 五、發明說明(、《) 憶體930之第一級(L0)之第一虛擬位址的快取遺漏時,第 一虛擬位址的快取查找被持續進行於快取記憶體之第二級 (L1)。此方法包含調處一個表示快取記憶體940之第二級 (L1)之第一虛擬位址之快取命中的資料組。周樣地,對應 第二虛擬位址之第二快取命中/遺漏訊號於第二處理器時脈 週期之後被提供,其經佇列架構至快取記憶體之第二級 (L1)之中的仲裁器。當第二快取命中/遺漏訊號表示快取記 憶體之第一級(L0)之第二虛擬位址的快取遺漏時,第二虛 擬位址的快取查找被持續進行於快取記憶體之第二級(L1) 。此方法包含調處一個表示快取記憶體之第二級(L1)之第 二虛擬位址之快取命中的資料組。從快取記憶體之第二級 (L1)出來之資料組被輸出至多工器,其中,多工器控制被 給至從快取記憶體950之第一級(L0)之出來之資料組及從 快取記憶體之第二級(L1)出來之資料組的選路優先。 經濟部智慧財產局員工消費合作社印製 於一實施例中,圖5之方法包含給予選路優先至從快 取記憶體之第二級(L1)之出來之資料組且經由快取記憶體 之第二級(L1)從快取記憶體之第一級(L0)再引導資料組。 另一個實施例中,圖5之方法包含給予選路優先至從快取 記憶體之第二級(L1)之出來之資料組且迫使快取記憶體之 第一級(L0)表現出宛若從快取記憶體之第一被(L0)之資料 組爲快取遺漏(亦即使L1呈現L0已完成之資料存取,而不 論L0是否爲快取命中或遺漏)。另一個可替代實施例中, 從L1及L0出來之資料組被同時返回相同的接收者,L0存 取被阻擋直到L1存取被返回爲止。於一實施例中,調處 21 尺度適用中國ΐ家標準(CNS)A4規格(210 X 297公釐) ' 4 5 4 1 6 1 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(β) 一個表示快取記憶體之第二級(L1)中之第一虛擬位址之快 取命中的資料組包含調處一個表示快取記憶體之第二級 (L1)中之第二虛擬位址之快取命中的第二資料組。 圖6爲描述根據本發明教示之載入存取兩級快取記憶 體之另一個方法的流程圖。如圖6所示,此方法包含當儲 存體衝突升高於第一虛擬位址及第二虛擬位址1000間的第 二級(L1)快取時,將第一虛擬位址排列於佇列結構中。於 一實施例中,當儲存體衝突升高於第一虛擬位址及第二虛 擬位址1000間的第二級(L1)快取時將第一虛擬位址排列於 佇列結構中,包含將代表第二虛擬位址之第一級快取遺漏 的命中/遺漏訊號排列於快取記憶體之第一級(L0)。圖6之 方法更進一步包含從對應第二時脈週期1010中之快取記憶 體之第一級(L0)中之第二虛擬位址之快取命中之快取記憶 體之第一級(L0)調處資料組。從快取記憶體之第一級(L0) 被調處的資料組經由多工器被輸出至第二時脈週期1020中 之多功能單元。遍及此說明書,第一虛擬位址及第二虛擬 位址是被規定的。於一個實施例中,第一虛擬位址及第二 虛擬位址爲虛擬位址。於一個替代實施例中,第一虛擬位 址及第二虛擬位址擁有不同之包含第一虛擬位址及第二虛 擬位址的位元數。 本發明提供一種新穎之兩級快取系統,其中第一級被 最佳化低潛伏期而第二級被最佳化容量。快取的兩級均可 支援同時發生之雙重埠存取及管線存取。被用來從較慢之 第二級快取分離出較快之第一級快取的佇列結構被提偌於 22 (請先閱讀背面之注意事項#(填寫本頁) /1 I I I--I — 訂---------4 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 4 5 416 1 A7 ______B7 ___ 五、發明說明(w) 第一及第二級快取之間。佇列結構也被雙重埠接。快取的 兩級均支援非非阻塞行爲。當快取遺漏於一級快取時,快 取的兩級均可繼續處理其他快取命中及遺漏。第一級快取 對於整數資料作最佳化。第二級快取可儲存任何包含浮點 的資料類型。本發明之最新兩級快取系統提供強調產量的 高效能。 (請先閱讀背面之注意事項再填寫本頁) Ί--------訂—-------線: 經濟部智慧財產局員工消費合作社印製 23 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 公釐)

Claims (1)

  1. 454161 A8 B8 C8 D8 六、申請專利範圍 1_一種快取記憶體,其包含: (請先聞讀背面之注意事項再填寫本頁) 一個第一級快取,其係擁有一個第一位址埠及一個第 二位址埠; 一個第二級快取,其係擁有一個第一位址埠及一個第 二位址埠;及 一個疗列結構,其係親合第一級快取及第二級快取。 2.如申請專利範圍第1項之快取記憶體,其中,第一 級快取及第二級快取係被改造,以分別於第一位址埠及第 二位址埠的每一個,同時接收64位元虛擬位址。 3·如申請專利範圍第2項之快取記憶體,其中,第二 級快取之第一位址埠及第二位址埠係同時接收第一虛擬位 址及第二虛擬位址。 4.如申請專利範圍第1項之快取記憶體,其中,第一 級快取係被改造僅容納整數,且其中第二級快取被改造容 納整數及浮點資料。 經濟部智慧財產局員工消費合作社印製 5·如申請專利範圍第1項之快取記憶體,其中,第一 級快取之第一位址埠及第二級快取之第一位址堪係被改造 ,以同時接收第一虛擬位址,且其中,第一級快取及第二 級快取被改造,以於第一時脈週期中啓動第一虛擬位址的 快取查找。 6_如申請專利範圍第5項之快取記憶體,其中,第一 級快取記憶體係被改造,以於第一處理器時脈週期中完成 第一虛擬位址的快取查找,且其中,佇列結構係被改造, 以於第二時脈週期後發出針對第一虛擬位址之第一級快取 本紙張尺度適用中國國家標準(CNS > A4規格(210X297公釐) A8 B8 C8 D8 六、申請專利範圍 命中/遺漏訊號至第二級快取。 7. —種微處理器晶片,其係具有一個處理器時脈訊號 ,包含: 複數個執行單元; 一個包含一個第一級快取及一個第二級快取的晶載快 取記憶體,其係擁有至少兩個被耦合於晶載快取記憶體及 複數個執行單元之間的兩個位址匯流排,及一個耦合第一 級快取及第二級快取的佇列結構;及 至少雨個被耦合於晶載快取記億體及複數個執行單其 之間的兩個資料匯流排。 8. 如申請專利範圍第7項之微處理器晶片,其中,第 二級快取爲被堆積快取,且其中,該佇列結構被改造以排 隊第二級快取儲存體衝突。 ' 9·如申請專利範圍第7項之微處理器晶片,其中,佇 列結構被改造以排隊第二級快取儲存體衝突及第一級快取 遺漏。 10. 如申請專利範圍第7項之微處理器晶片,其中,第 一級快取及第二級快取被改造,以於第一時脈週期中同時 啓動第一虛擬位址的快取查找。 11. 如申請專利範圍第10項之微處理器晶片,其中, 第一級快取記憶體被改造,以於第一時脈週期中完成第一 虛擬位址的快取查找,且其中,f?列結構被改造以於第二 時脈週期後發出針對第一虛擬位址之第一級快取命中/遺漏 訊號至第二級快取。 2 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) (請先閲讀背面之注意事項再填寫本頁) 、vs Γ 經濟部智慧財產局員工消費合作社印製 454161 A8 B8 C8 D8 六、申請專利範圍 12. —種電腦系統,包含: 一個微處理器晶片,其係擁有一個處理器時脈訊號, 包含: 複數個執行單元; 一個晶載快取記憶體,該晶載快取記憶體包含: 一個第一級快取,其係擁有一個第一位址埠及一個第 二位址埠; 一個第二級快取’其係擁有一個第一位址埠及一個第 二位址埠;及 一個佇列結構,其係耦合第—級快取及第二級快取; —個晶外記憶體;及 一個瞳流排’其中,該匯流排連接該晶外記億體至微 處理器晶片。 13. 如申請專利範圍第12項之電腦系統,其中,第一 級快取係包含一個第一轉換後備緩衝器及一個第二轉換後 備緩衝器,每個均擁有複數個入口,且其中,第—轉換後 備緩衝器及第二轉換後備緩衝器被改造,以分別同時從第 —位址埠接收第一虛擬位址及從第二位址埠接收第二虛擬 位址。 如申請專利範圍第13項之電腦系統,其中,第二 級快取係包含一個擁有較第一轉換後備緩衝器爲多入口的 轉換後備緩衝器,且其中,轉換後備緩衝器係被改造,以 分別同時從第一位址埠接收第一虛擬位址及從第二位址璋 接收第二虛擬位址。 3 ___ 本紙張尺度適用中國國家捸準(CNS ) A4規格(210X297公董) (請先閲讀背面之注意事項再填寫本頁) .I I I i I —rI I I I 訂—— I I 經濟部智慧財產局員工消費合作社印製 454161 經濟部智慧財產局員工消費合作社印製 A8 B8 C8 D8 六、申請專利範圍 15. 如申請專利範圍第12項之電腦系統’其中’第一 級快取及第二級快取係被改造,以於第一時脈週期中啓動 第一虛擬位址的快取查找。 16. 如申請專利範圍第15項之電腦系統’其中’第一 級快取記憶體係於第一時脈週期後提供針對第一虛擬位址 之快取命中/遺漏訊號至佇列結構,且佇列結構係於第二時 脈週期後提供快取命中/遺漏訊號至第二級快取。 Π.—種存取快取記憶體的方法’包含: 於第一處理器時脈週期中提供第一虛擬位址及第二虛 擬位址至第一級快取記憶體中之第一轉換後備緩衝器及第 二轉換後備緩衝器,每個轉換後備緩衝器均擁有複數個入 口; 於第一處理器時脈週期中同時提供第一虛擬位址及第 二虛擬位址至擁有較第一轉換後備緩衝器爲多入口之第二 級快取記憶體中的轉換後備緩衝器;及 於第二處理器時脈週期後提供對應第一虛擬位址之第 —快取命中/遺漏訊號經佇列結構至第二級快取記憶體中之 仲裁器。 18. 如申請專利範圍第17項之方法,其中’於第二處 理器時脈週期後,提供對應第一虛擬位址之第一快取命中/ 遺漏訊號犖佇列結構至第二級快取記憶體中之仲裁器,其 更進一步包含,同時提供對應第二虛擬位址之第二快取命 中/遺漏訊號經佇列結構至第二級快取記憶體中之仲裁器。 19. 如申請專利範圍第17項之方法,其中,此方法更 4 /聋 (請先閣讀背面之注意事項再填寫本頁)
    本紙張尺度逋用中國囷家梯率(CNS ) A4規格(210X297公釐) 454161 Α8 Β8 C8 D8 六、申請專利範圍 進一步包含: 於第一處理器時脈週期中啓動第一級快取記憶體中t 第一虛擬位址及第二虛擬位址的快取查找; 於第一處理器時脈週期中同時啓動第二級快取記憶、 中之第一虛擬位址及第二虛擬位址的快取查找; 於第一處理器時脈週期中完成第一級快取記億體中2 第一虛擬位址及第二虛擬位址的快取查找。 20. 如申請專利範圍第17項之方法,其中,此方法更 進一步包含: 於第二處理器時脈週期中調處係代表針對第一級快耳又 記憶體中之第一虛擬位址之快取命中的資料組;及 於第二處理器時脈週期中輸出資料組。 21. 如申請專利範圍第20項之方法,其中,於第二處 理器時脈週期中輸出資料組係包含將資料組傳送至暫存器 檔。 22·如申請專利範圍第I7項之方法,其中,此方法更 進一步包含: 於第二處理器時脈週期中調處代表針對第一級快取記 憶體中之第二虛擬位址之快取命中的資料組;及 於第二處理器時脈週期內從第一級快取記憶體提供資 料組至多工器(MUX),其係提供選路優先權至從第一級快 取記憶體出來之資料組及從^二級快取記憶體出來之資料 組。 23.—種存取快取記憶體的方法,包含: _ 5_ 本^張尺度適用中國國家梂準(〇奶)八4規格_(210\297公釐) ' (請先閲讀背面之注意事項再填寫本頁·) y裝. 經濟部智慧財產局員工消費合作社印製 454161 A8 B8 C8 D8 經濟部智慧財產局員工消費合作社印製 六、申請專利範圍 於第一處理器時脈週期中,啓動第一級快取記憶體中 之第一虛擬位址及第二虛擬位址的快取查找; 於第一處理器時脈週期中,啓動第二級快取記憶體中 之第一虛擬位址及第二虛擬位址的快取查找; 於第二處理器時脈週期後,提供對應第一虛擬位址之 第一快取命中/遺漏訊號經佇列結構至第二級快取記憶體中 之仲裁器; 當第一快取命中/遺漏訊號表示第一級快取記憶體中之 第一虛擬位址有快取遺漏時,完成第二級快取記憶體中之 第一虛擬位址的快取查找; 調處表示第二級快取記憶體中之第一虛擬位址有快取 命中的資料組;及 從第二級快取記憶體輸出資料組至多工器,控制選路 優先權被給至從第一級快取記憶體出來之資料組及從第二 級快取記憶體出來之資料組。 24. 如申請專利範圍第23項之方法,其中,從第二級 (L1)快取記憶體輸出資料組至多工器的方法更進一步包含 給予優先於從第一級(L0)快取記憶體出來之資料組之 選路至從第二級快取記憶體出來之資料組;及 迫使L0當作宛若L0擁有從L0出來之資料組的快取 遺漏且使L1實施從L0出來之資料組的快取查找。 25. 如申請專利範圍第23項之方法,其中,從第二級 (L1)快取記憶體輸出資料組至多工器的方法更進一步包含 6 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) " : ~ --------裝------—訂 (請先閣讀背面之注意事項再填寫本頁) 454161 A8 B8 C8 D8 經濟部智慧財產局員工消費合作社印製 六、申請專利範圍 給予優先於從第一級(L0)快取記憶體出來之資料組之 選路至從第二級(L1)快取記憶體出來之資料組;及 將從L0出來之資料組區隔,其從L0出來之資料組及 從L1出來之資料組被同時返回相同接收器,直到從L1出 來之資料組被返回接收器。 26. 如申請專利範圍第23項之方法,其中,調處一個 表示第二級快取記憶體中之第一虛擬位址有快取命中的資 料組係包含同時調處表示第二級快取記憶體中之第二虛擬 位址有快取命中的第二資料組。 27. 如申請專利範圍第23項之方法,其中,此方法更 進一步包含當儲存體衝突上升於第一虛擬位址及第二虛擬 位址之間的第二級時,將第一虛擬位址排隊於佇列結構中 〇 28. 如申請專利範圍第27項之方法,其中,當儲存體 衝突上升於第一虛擬位址及第二虛擬位址之間的第二級時 ,將第一虛擬位址排隊於佇列結構中更進一步包含將代表 針對第一級快取記憶體中之第二虛擬位址之快取遺漏的第 一快取命中/遺漏訊號排隊於佇列結構中。 29. 如申請專利範圍第23項之方法,其中,此方法更 進一步包含於第二處理器時脈週期中調處對應針對第一級 快取記憶體中之第二虛擬位址之快取命中之第一級快取記 憶體中的資料組。 30. 如申請專利範圍第23項之方法,其中,此方法更 7 (請先閲讀背面之注意事項再填寫本頁) ^^^1 ^—^1 ^^§^9 I— ml i n·— Id .. 士m mu ^^^1 In —m ' ,^ψ tf^i ^n· - nn 1^1^1 n^i ml I t 本紙張尺度適用中國國家標準(CNS ) A4規格(2!OX297公釐) 454161 A8 B8 C8 D8 六、申請專利範圍 進一步包含於第二處理器時脈週期中從第一級輸出被調處 資料組經多工器至多功能單元。 (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS > A4規格(210 X 297公釐)
TW088121954A 1998-12-31 1999-12-15 A dual-ported pipelined two level cache system TW454161B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/223,847 US6272597B1 (en) 1998-12-31 1998-12-31 Dual-ported, pipelined, two level cache system

Publications (1)

Publication Number Publication Date
TW454161B true TW454161B (en) 2001-09-11

Family

ID=22838194

Family Applications (1)

Application Number Title Priority Date Filing Date
TW088121954A TW454161B (en) 1998-12-31 1999-12-15 A dual-ported pipelined two level cache system

Country Status (7)

Country Link
US (1) US6272597B1 (zh)
CN (1) CN1154049C (zh)
AU (1) AU2220500A (zh)
DE (1) DE19983859T1 (zh)
GB (1) GB2359910B (zh)
TW (1) TW454161B (zh)
WO (1) WO2000039764A1 (zh)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10002120B4 (de) * 1999-02-13 2006-04-20 International Business Machines Corp. Adressumsetzpufferanordnung und Verfahren für den Betrieb einer Adressumsetzpufferanordnung
US6625714B1 (en) * 1999-12-17 2003-09-23 Hewlett-Packard Development Company, L.P. Parallel distributed function translation lookaside buffer
US6470437B1 (en) * 1999-12-17 2002-10-22 Hewlett-Packard Company Updating and invalidating store data and removing stale cache lines in a prevalidated tag cache design
US6427188B1 (en) * 2000-02-09 2002-07-30 Hewlett-Packard Company Method and system for early tag accesses for lower-level caches in parallel with first-level cache
US6647464B2 (en) 2000-02-18 2003-11-11 Hewlett-Packard Development Company, L.P. System and method utilizing speculative cache access for improved performance
US6427189B1 (en) * 2000-02-21 2002-07-30 Hewlett-Packard Company Multiple issue algorithm with over subscription avoidance feature to get high bandwidth through cache pipeline
US6729652B2 (en) 2001-12-26 2004-05-04 Cloud-Rider Designs Vehicle mud flap
US6862028B2 (en) 2002-02-14 2005-03-01 Intel Corporation Bin pointer and state caching apparatus and method
US20030163643A1 (en) * 2002-02-22 2003-08-28 Riedlinger Reid James Bank conflict determination
US7143239B2 (en) * 2003-08-07 2006-11-28 Hewlett-Packard Development Company, L.P. Cache structure and methodology
US7296139B1 (en) 2004-01-30 2007-11-13 Nvidia Corporation In-memory table structure for virtual address translation system with translation units of variable range size
US7334108B1 (en) 2004-01-30 2008-02-19 Nvidia Corporation Multi-client virtual address translation system with translation units of variable-range size
US7278008B1 (en) * 2004-01-30 2007-10-02 Nvidia Corporation Virtual address translation system with caching of variable-range translation clusters
US7769950B2 (en) * 2004-03-24 2010-08-03 Qualcomm Incorporated Cached memory system and cache controller for embedded digital signal processor
US7123496B2 (en) * 2004-05-10 2006-10-17 Intel Corporation L0 cache alignment circuit
US8886895B2 (en) * 2004-09-14 2014-11-11 Freescale Semiconductor, Inc. System and method for fetching information in response to hazard indication information
US7434009B2 (en) * 2004-09-30 2008-10-07 Freescale Semiconductor, Inc. Apparatus and method for providing information to a cache module using fetch bursts
US20080005728A1 (en) * 2006-06-30 2008-01-03 Robert Paul Morris Methods, systems, and computer program products for enabling cross language access to an addressable entity in an execution environment
US20080005727A1 (en) * 2006-06-30 2008-01-03 Robert Paul Morris Methods, systems, and computer program products for enabling cross language access to an addressable entity
US20080005528A1 (en) * 2006-06-30 2008-01-03 Morris Robert P Methods, Systems, and Computer Program Products for Using a Structured Data Storage System to Provide Access to Addressable Entities in Virtual Address Space
US20080005752A1 (en) * 2006-06-30 2008-01-03 Robert Paul Morris Methods, systems, and computer program products for generating application processes by linking applications
US20080127220A1 (en) * 2006-06-30 2008-05-29 Robert Paul Morris Methods, systems, and computer program products for creating an input-value-specific loadable instance of an application
US20080022265A1 (en) * 2006-06-30 2008-01-24 Morris Robert P Methods, systems, and computer program products for generating and using object modules
US20080005529A1 (en) * 2006-06-30 2008-01-03 Morris Robert P Methods, Systems, and Computer Program Products for Providing Access to Addressable Entities Using a Non-Sequential Virtual Address Space
US20080005719A1 (en) * 2006-06-30 2008-01-03 Morris Robert P Methods, systems, and computer program products for providing a program execution environment
US7734890B2 (en) * 2006-10-06 2010-06-08 Okralabs Llc Method and system for using a distributable virtual address space
WO2008047180A1 (en) * 2006-10-20 2008-04-24 Freescale Semiconductor, Inc. System and method for fetching an information unit
US20080120604A1 (en) * 2006-11-20 2008-05-22 Morris Robert P Methods, Systems, And Computer Program Products For Providing Program Runtime Data Validation
CN100428209C (zh) * 2006-12-22 2008-10-22 清华大学 一种自适应的外部存储设备io性能优化方法
US20080320282A1 (en) * 2007-06-22 2008-12-25 Morris Robert P Method And Systems For Providing Transaction Support For Executable Program Components
US20080320459A1 (en) * 2007-06-22 2008-12-25 Morris Robert P Method And Systems For Providing Concurrency Control For Addressable Entities
US20090249021A1 (en) * 2008-03-26 2009-10-01 Morris Robert P Method And Systems For Invoking An Advice Operation Associated With A Joinpoint
US8166229B2 (en) * 2008-06-30 2012-04-24 Intel Corporation Apparatus and method for multi-level cache utilization
CN101770437B (zh) * 2008-12-30 2013-05-29 中国科学院电子学研究所 实现同步双端口存储器ip的并行读写的装置及方法
US8904115B2 (en) * 2010-09-28 2014-12-02 Texas Instruments Incorporated Cache with multiple access pipelines
CN102591817B (zh) * 2011-12-30 2014-12-31 中山大学 一种多总线桥控制器及其实现方法
US10198358B2 (en) * 2014-04-02 2019-02-05 Advanced Micro Devices, Inc. System and method of testing processor units using cache resident testing
CN107038125B (zh) * 2017-04-25 2020-11-24 上海兆芯集成电路有限公司 具有加速预取请求的独立流水线的处理器高速缓存

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5023776A (en) * 1988-02-22 1991-06-11 International Business Machines Corp. Store queue for a tightly coupled multiple processor configuration with two-level cache buffer storage
JP2703418B2 (ja) * 1991-04-24 1998-01-26 株式会社東芝 中央演算処理装置
US5442766A (en) * 1992-10-09 1995-08-15 International Business Machines Corporation Method and system for distributed instruction address translation in a multiscalar data processing system
US5510934A (en) * 1993-12-15 1996-04-23 Silicon Graphics, Inc. Memory system including local and global caches for storing floating point and integer data
EP0840231A1 (en) * 1996-10-31 1998-05-06 Texas Instruments Incorporated Microprocessor comprising multi-level cache memory
US6119222A (en) * 1996-12-23 2000-09-12 Texas Instruments Incorporated Combined branch prediction and cache prefetch in a microprocessor
US6101579A (en) * 1997-03-07 2000-08-08 Mitsubishi Semiconductor America, Inc. Multi-port memory device having masking registers
US6065091A (en) * 1997-05-30 2000-05-16 Via-Cyrix, Inc. Translation look-aside buffer slice circuit and method of operation
US6044478A (en) * 1997-05-30 2000-03-28 National Semiconductor Corporation Cache with finely granular locked-down regions
US5930819A (en) * 1997-06-25 1999-07-27 Sun Microsystems, Inc. Method for performing in-line bank conflict detection and resolution in a multi-ported non-blocking cache

Also Published As

Publication number Publication date
GB2359910A (en) 2001-09-05
AU2220500A (en) 2000-07-31
DE19983859T1 (de) 2002-02-28
CN1154049C (zh) 2004-06-16
GB0112694D0 (en) 2001-07-18
WO2000039764A1 (en) 2000-07-06
US6272597B1 (en) 2001-08-07
CN1333906A (zh) 2002-01-30
WO2000039764A9 (en) 2000-12-07
GB2359910B (en) 2003-12-17

Similar Documents

Publication Publication Date Title
TW454161B (en) A dual-ported pipelined two level cache system
KR100349787B1 (ko) 싱글칩마이크로컴퓨터
US6496902B1 (en) Vector and scalar data cache for a vector multiprocessor
JP5231612B2 (ja) バス上のメモリプリフェッチコマンドを送信するための方法および装置
TW493123B (en) Mfence and lfence micro-architectural implementation method and system
EP4276636A2 (en) Coprocessor operation bundling
US11023410B2 (en) Instructions for performing multi-line memory accesses
US20120173843A1 (en) Translation look-aside buffer including hazard state
US7472227B2 (en) Invalidating multiple address cache entries
TWI243989B (en) System having a configurable cache/SRAM memory
US9274860B2 (en) Multi-processor device and inter-process communication method thereof
US7444435B2 (en) Non-fenced list DMA command mechanism
US20200371812A1 (en) Coprocessor Memory Ordering Table
TW491970B (en) Page collector for improving performance of a memory
US7761661B2 (en) Physically-tagged cache with virtual fill buffers
TW517187B (en) System and method for invalidating an entry in a translation unit
US9652560B1 (en) Non-blocking memory management unit
US6735683B2 (en) Single-chip microcomputer with hierarchical internal bus structure having data and address signal lines coupling CPU with other processing elements
EP1449087A1 (en) Bandwidth enhancement for uncached devices
US20120159083A1 (en) Systems and Methods for Processing Memory Transactions
US6957319B1 (en) Integrated circuit with multiple microcode ROMs
JP2007087416A (ja) シングルチップデータ処理装置
US7035981B1 (en) Asynchronous input/output cache having reduced latency
US20230409482A1 (en) Multi-die package
JP4448917B2 (ja) 半導体集積回路装置、データ処理装置及びマイクロコンピュータ

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees