TWI274998B

TWI274998B - Method for memory coherency, systems for supporting distributed cache coherency conflict resolution, method for resolving a writeback race conflict, and for resolving a race conflict for request for ownership of two substantially simultaneous requests

Info

Publication number: TWI274998B
Application number: TW094111562A
Authority: TW
Inventors: Ling Cen
Original assignee: Intel Corp
Priority date: 2004-04-27
Filing date: 2005-04-12
Publication date: 2007-03-01
Also published as: WO2005109206A2; GB2427730B; GB0620090D0; US20070022252A1; GB2447119B; KR100880059B1; US7822929B2; JP4789926B2; GB2447119A; KR20070007865A; TW200608204A; JP2007535037A; GB2427730A; CN1690986A; GB0802718D0; CN100377114C; WO2005109206A3; DE112005000974T5

Description

1274998 (1) 九、發明說明谵【發明所屬之技術領域] 本發明係有關快取記憶體。更特定地說，本發明係有關多快取多處理器系統中的分散式衝突排解。【先前技術】當電子系統包括多重快取記憶體時，必須維持可供使 > 用之資料的有效性。典型上，此係藉由按照快取記憶體相干性協定來操作資料來予以達成的。隨著快取記憶體及/ 或處理器的數量增加，維持快取記憶體相干性的複雜度也跟著增加。當多個組件（例如，快取記憶體、處理器）請求相同的資料區塊時，必須以保持資料之有效性的方法來解決多個組件之間的衝突。目前的快取記憶體相干性協定典型上具有一負責衝突排解的單一組件。但是，當系統的複雜度增 • 加時，只單靠一單一組件來解決衝突會使整個系統的性能降低。用來提供快取記憶體相干性’即窺察（現在常常被稱爲對稱多重處理（Symmetric Multiprocessing SMP))及目錄 (常常被稱爲分散式共有記憶體（Distributed Shared Memory DSM))有兩種的基本設計。基本差異係與配置及對元資訊的存取有關’亦即，有關於儲存快取線之拷貝之位置的資訊。對窺察式快取而言’以經快取之拷貝本身來分配資 -4 - (2) (2)1274998 訊，亦即，快取線的各個有效拷貝是被一單兀所持有’而每當任何節點以一新的途徑來請求允許對快取線的存取時，該單元必須察覺出其責任。某些位置（通常是在一固定位置處）爲一儲存庫，當資料未被快取時，資料被儲存於其中。此位置可容納有效的拷貝，即使當該線被快取時。但是，請求節點通常不知道此節點的位置，即請求節點只簡單地廣播所請求之快取線的位址以及所需的許可，而且可能具有拷貝的所有節點都必須回應，以確保一致性被維持，如果沒有其它（等位）節點回應，則含有未被快取之拷貝的節點要回應。對以目錄爲基礎之方案而言，除了儲存未被快取之資料的固定位置以外，還有一個固定的位置，即指示被快取之拷貝所在位置的目錄。爲了以一新的途徑來對快取線進行存取，節點必須與含有該目錄的節點通信連絡，其通常是與含有未被快取之儲存庫相同的節點，因此，當主要儲存拷貝係有效時，允許回應的節點提供資料。這種節點被稱爲起始節點（Η 〇 m e η 〇 d e)。分散目錄的方式有二。其一，主要儲存資料（未被快取的儲存庫）常常被分散於各節點中，且目錄也以相同的方式分散。其二’元資訊本身可以被分散，起始節點處保持與快取線不論是否被快取同樣少的資訊，且如果如此，起始節點保持在單一拷貝所在之處。舉例來說，SC I使用此方案’且每一個含有被快取之拷貝的節點與含有被快取之拷貝的其它節點保持鏈結，因此，集體地維持一完整的 - 5- (3) (3)1274998 目錄。窺察式方案靠的是廣播’因其沒有任何一個持有元資訊之場所，所以，每次的詢問都必須通知所有節點，每〜個節點負責做它該做的部分’以確保相干性被維持。這包括了干預訊息，當另一節點正在提供資料時，通知起始節點不要回應。窺察式方案的優點在於回應可以是直接且快速的，但不能做到良好的擴充，因爲所有的節點都需要觀察所有的詢問。目錄式方案天生係可更加擴充的，但需要較複雜的回應，常常涉及3個節點的點對點通信。【發明內容及實施方式】本文描述在多節點系統中，用於分散式快取相千性衝突排解的技術。在以下的描述中，爲了解釋，提出了諸多特定的詳細內容，以提供對本發明徹底的了解。但是，熟悉此方面技術的人士將可明瞭，沒有這些特定的詳細內容，照樣可實施本發明。在其他例中，結構與裝置係以方塊圖的方式來予以顯示，以免對本發明造成混淆。以下的討論係從多節點系統中之節點的觀點來予以提供的。在一實施例中，節點包括具有內部快取記憶體、外部快取記憶體及/或外部記憶體的處理器。在另一實施例中’節點爲與其它電子系統互連的電子系統（例如，電腦系統、可攜式裝置）。也可使用其它類型的節點組態。在以下各圖中所描述的起始節點用作即將被請求之資冬 (4) (4)1274998 料的起始節點，其意謂著起始節點與非快取記憶體（例如，主記憶體）有關，而當未被快取時，即將被請求之資料被儲存於非快速記憶體中。舉例來說，起始節點可以是處理器、快取記憶體與隨機存取記憶體（RAM)，其中， RAM提供資料一非快取儲存的位置。所主張之標的物協助多節點系統中之分散式快取相干性的衝突排解。在一實施例中，衝突排解被解決於起始節點處。在一態樣中，所主張之標的物協助衝突排解協定，其針對通信於節點間之訊息的數量係有效率的。舉例來說，節點可以被分類如下：源節點、起始節點及對等節點。所主張之標的物描述用於源節點與起始節點的協定。在一實施例中，所主張之標的物利用一對等節點協定，如同針對相應用所討論的。在圖5中將討論用於源節點的演算法。同樣地，在圖6中將討論用於起始節點的演算法。請求訊息以下的訊息爲來自請求節點之對資料/動作的請求。埠讀取無效線（PRIL):此爲對資料段之拷貝的請求，其中，使提供者節點的資料拷貝無效。此訊息也可被稱爲 ’’所有權的請求"。在一實施例中，PRIL是向包括起始節點的所有節點廣播。埠寫入線（PWL):此訊息致使資料（例如，經修改的快取線）被寫到記憶體’因此，是一'寫回線。此訊息也可被稱爲”髒追還”。在一實施例中，PWL被送到起始節點。 (5) 1274998 回應訊息以下的訊息爲從對等節點（亦即，非起始節點）到請求節點之訊息，以回應於上述請求。獨有資料（E-DΑΤΑ) —當送出回應的節點具有所請求之資料的獨有拷貝時，此訊息爲（P RIL)的爲對請求回應。在一實施例中，該節點將資料的獨有拷貝向前送到請求節點。傳送到起始節點的訊息這些訊息係藉由對等節點而被傳送給到始節點。無效狀態確認（I_ACK):當送出回應的節點具有所請求之資料的無效拷貝或沒有所請求之資料的拷貝時，以此訊息回應請求（PRIL及PWL)。獨有狀態確認（E_ACK) ··當送出回應的節點具有所請 0 求之資料的獨有拷貝或沒有所請求之資料的拷貝時，以此訊息回應請求（PRIL及PWL)。資料已接收的確認（D A CK):此訊息是被請求節點送到起始節點。 I一ACK —Conflict :此訊息指示所請求之快取線有一共同待解決的請求。來自起始節點的訊息這些訊息係從起始節點被送至對等及/或請求節點。 -8- 1274998 • (6) ^ 獨有完成（E_CMP):因爲請求節點已經接收到獨有資料’所以此訊息指不具有獨有快取狀態之S靑求卽點之請求的完成。在一實施例中，起始節點在發出此訊息之後將快取線去配置（de-al locate)。無效資料完成（I_DATA —CMP):此訊息包含所請求之資料即將被送到請求節點，並指示具有’’無效”快取狀態之請求節點之PRIL請求的完成。 # 完成（CMP):此訊息被送到請求PWL的節點，以指示經修改之資料寫回記憶體的完成。 I_CMP :此訊息被送到發生衝突狀況之兩個節點的其中之一，以指示衝突線被去配置。 XFER —(NodelD):此訊息致使接收節點將資料轉移到訊息中所指示的節點。當起始節點被告知衝突狀況時，起始節點將此訊息送到請求資料之目前擁有者，要求資料的目前擁有者將資料轉移到目標節點。如果起始節點決定未解決的衝突請求是P RIL訊息，則送出X F RI訊息而不是 X F R訊息，意指當啓動資料轉移時，目前的擁有者必須使快取線無效。 E 一 CMP —XFER(NodelD) ： E 一 CMP 一 XFER 爲係由 E一CMP與XFER訊息所構成的複合訊息。因此，此訊息指不此事務是在起始節點處完成，並且也致使接收節點傳送資料到訊息中所指示的節點。當起始節點被告知衝突狀況時’起始節點將此訊息送到所請求之資料的目前擁有者，要求資料的目前擁有者將資料轉移到目標節點。 (7) 1274998 至此，起始節點與請求節點間往來之訊息的討束。以下的討論係從多節點系統內之節點的觀點來予供的。在-實施例中，_包含具有內部快取記憶體部快取記憶體及/或外部記憶體的處理器。在另一實中，節點爲與其它電子系統互連的電子系統（例如，系統、可攜式裝置）。也可使用其它類型的節點組態以下的例子中’在訊息之前的數字指示相對時間（以，，頭的訊息是在以，，1 . 1 ”、”2”或”3 ”等開頭的訊息之前出）。舉例來說，數字表示兩個節點之間大略的時列。但是，此數字不能被用來決定不同節點對之間序。例如，節點A與B之間的” 4 ”可能領先於節點c 之間的” 2 ”。而且，以虛線表示的訊息指示中按順序 order)起始通道。例如，中序起始通道可以是在一相向上之相同的節點對之間，以確保來自請求節點之被於來自相同請求節點之第二訊息之前的第一訊息係按順序被接收（第一訊息能被接收節點接收到，而第二隨後被接收節點接收到）。圖1提供支援讀取事務之協定之槪念性舉例說明施例。在此實施例中，複數個節點A、B及C被連接始節點Η。很明顯地，所主張之標的物並不限於3 點，且可允許不同數量的節點。在一態樣中，圖中描繪一讀取事務。節點的初始如下。節點Α與Β具有資料的無效拷貝。反之，節

論結以提、外施例電腦，在 1，，開被送間序的時與D ;(i η -似方送出照該訊息的實至起個節狀態點C -10- (8) (8)1274998 具·有資料的獨有拷貝（此亦被描繪於圖中，做爲節點的第〜狀態（I爲無效，E爲獨有）。首先’請求節點A發出PRIL請求給節點B、C及起始節點。在一實施例中，PRIL請求是以一按順序起始通道而連通到起始節點。接下來’節點C以E —DATA回應於節點A的PRIL請求’並回以資料的獨有拷貝。同樣地，節點C以E_ACK ®應於起始節點，以指示節點C已向前傳送所請求之資料的獨有拷貝。同時，節點B向前送出I_ACK，以指示其具有所請求之資料的無效拷貝。因此’因爲請求節點A已接收到獨有資料，所以起始節點發出E __ C Μ P給節點a，以指示節點a對獨有資料請求的完成。在一實施例中，起始節點在發出此訊息後將快取線去配置。因此’起始節點根據接收自其他節點的訊息來監督及控制讀取事務。圖2 供支援易回競爭衝突之協定之槪念性舉例說明的貝施例。在此貫5也例中，複數個節點A、B及C被連接至起妃節點Η。很明顯地，所主張之標的物並不限於3個節點，且可允許不同數量的節點。在一態樣中，圖中描繪一寫回競爭衝突。節點的初始狀態如下。節點Α與Β具有資料的無效拷貝。反之，節點C具有資料之經修改的拷貝（此亦被描繪於圖中，做爲節點的第一狀S?、（I爲無效，]y[爲經修改））。首先，請求節點A發出pRIL請求給節點β、^及起 -11 - (9) (9)1274998 始節點。在一實施例中，PRIL請求是以一按順序起始通道而被連通到起始節點。同時，節點C發出一 PWL請求給起始節點，以便將經修改的資料寫回記憶體。在一實施例中，P RI L請求是以一按順序起始通道而被連通到起始節點。因此，由於A的修改資料請求與C的PWL(寫回）請求相衝突，存在有寫回競爭衝突。在一實施例中，寫回是在起始通道上送出，且在節點C處不會阻擋A的PRIL 請求。接下來，節點C與B發出I_ACK訊息以回應A的 PRIL請求。I_ACK訊息被送到起始節點做爲A之PRIL 請求的回應，以指示它們具有所請求之資料的無效拷貝，或是沒有所請求之資料的拷貝。起始節點將解決此衝突。首先，起始節點在接收到來自節點B及C的I_ACK訊息時，回應C的PWL請求及A 的PRIL請求。起始節點以CMP訊息回應給節點C，以指示經修改之資料寫回記憶體的完成。此外，起始節點以 I_DATA_CMP訊息回應節點A，其包含所請求之資料並指示A之PRIL請求的完成。圖3提供支援兩個請求間，請求所有權之競爭衝突之協定的槪念性舉例說明的實施例。例如，舉例說明中描繪支援因在幾乎相同時間發出請求所導致之共用線衝突的協定。首先，節點A傳送一 PRIL訊息給節點B、C及起始節點240，以請求一資料區塊。在一實施例中，PRIL訊息是經由按順序起始通道而被送到起始節點。在一短時間周 -12- 1274998 . do) - 期之後，或者甚至在同一時間，節點B將P RIL訊息送到節點A、C及起始節點，請求相同的資料區塊。在一實施例中，P RI L訊息是經由按順序起始通道而被送到起始節點。現在，有兩個競爭的P RIL訊息，一個來自節點A，一個來自節點B。吾人先在此段中解釋對A之PRIL請求的處理，在下段中再解釋對B之PRIL請求的處理。節點 ^ A和節點C兩者都將I_ACK_Conflict訊息送到起始節點’以指示對所請求之快取線有一共同待解決的請求。對於A的PRIL請求，節點C將E_Data訊息送到節點A做爲對a之PRIL請求的回應，以指示節點C具有所請求之資料的獨有拷貝。此外，在一實施例中，節點C將資料的獨有拷貝向前傳送到A節點。同時，節點C將 E一ACK訊息送到起始節點，以指示它已將所請求之資料的獨有拷貝向前傳送。在一實施例中，E_ACK訊息是經由按順序起始通道而被送到起始節點。對於B的PRIL請求，節點C將I —ACK訊息送到起始節點，因爲節點C在將資料的獨有拷貝送到a節點之後，使所請求的資料無效。因此’起始節點由發出I —CMP訊息給節點B，以及藉由發出E —CMP_XFER(B)訊息給節點a，以解決共同待解決的PRIL請求。E_CMP —XFER(B)訊息致使接收節點 (節點A)將資料的獨有拷貝轉移到訊息中所指示的節點 (節點B )。當起始節點被告知衝突情況需要所請求之資 ~ 13 - (11) (11)1274998 料的目前擁有者將資料轉移到目標節點（在本例中爲節點 B)時’起始節點將E_CMP —XFER(B)訊息送到所請求之資料的目前擁有者，在本例中爲節點A。因此，節點A在接收到E —CMP —XFER(B)訊息後，藉由將E —DATA訊息送到節點B而將資料的獨有拷貝轉移到節點B。圖4提供支援兩個請求間，請求所有權之延遲衝突之協定的槪念性舉例說明的實施例。例如，節點A傳送一 P RIL訊息到節點B、C及起始節點，請求一資料區塊。如果節點B在確認A之PRIL請求後發出一 PRIL請求，即產生一延遲衝突。首先，請求節點A發出一 PRIL請求給節點B、C及起始節點。在一實施例中，PRIL訊息是經由按順序起始通道而被連通起始節點。接下來，節點C以E_ACK回應於A的PRIL及起始節點，以指示節點C已向前傳送所請求之資料的獨有拷貝。同時，節點B以I__ACK回應於A的PRIL，以指示其具有所請求之資料的無效拷貝。第三，節點B發出PRIL請求給節點B、C及起始節點。在一實施例中，PRIL訊息是經由按順序起始通道而被連通到起始節點。第四，節點C以E_D ΑΤΑ回應於A的PRIL請求，此外，節點C以I^Ack訊息回應於B的PRIL請求。同時，節點A以I__Ack__Conflict訊息回應於B的PRIL到起始節 -14 - (12) (12)1274998 點。第五，起始節點不管有衝突的事實仍將E _ C Μ P送到節點Α。理想上，當偵測到衝突時，將XFER訊息與CMP 連結，就像圖3 —樣。但是這不會發生，因爲當起始節點收集所有對A之PRIL請求的回應時，沒有出現衝突的指示。衝突指示器I_Ack —Conflict ( A對B之PRIL的回應）仍在途中，而且並未被起始節點所接收到。在此情況中，節點A在接收到來自起始節點的E_CMP時，將一 DACK訊息送到起始節點，以指示節點A是快取線的所有者，且因爲DACK是在按順序起始通道上被傳送，所以起始節點錯過了衝突，且需要送出X f e r命令，其將推擠在其前方的I_Ack_Conflict，而I一 Ack_Cnflict也是在相同的起始通道上被傳送的。在一實施例中，D A C K訊息是以按順序起始通道而被連通到起始節點。因此，起始節點藉由先接收DACK，而後發出I_CMP 訊息給節點B，以及發出Xfer(B)訊息給節點A，以解決兩請求者之間的延遲衝突。Xfer(B)訊息致使接收節點（節點A )將資料的獨有拷貝轉移到訊息中所指示的節點（節點 B)。當起始節點被告知衝突情況需要所請求之資料的目前擁有者將資料轉移到目標節點（在本例中爲節點B)時，起始節點將X f e I· (B )訊息送到所請求之資料的目前擁有者，在本例中爲節點A。因此，在接收到起始節點的Xfer(B) 訊息時’節點A以E _ D a t a訊息而將資料的獨有拷貝送到節點B。 -15- (13) 1274998 圖5爲源節點演算法之方法的流程圖實施例。如先前所討論的，節點可被分類如下··源節點、起始節點、及對等節點。所主張之標的物描述在源節點處所使用的演算法。在一實施例中，所主張之標的物使用對等節點協定，女口同針對相關應用所討論的。圖5描繪用於源節點演算法的方法。舉例來說，以下的情況可致使斷定一 Dack訊息。 ® 在一實施例中，斷定D a c k的情況之一爲所請求的快取線是在預定的狀態中，諸如向前傳送、獨有、或修改等狀態，並偵測到至少一個衝突，且接收到完成而沒有轉移 (Xfr)訊息。在另一實施例中，協定可被修改，俾使在衝突期間衝突鏈中的每次事務，將被要求經過DACK階段。換言之，圖3中的E_CMP —XFER將被己夂變成E 一 CMP 一 Conflict。在接收到E_CMP__Conflict(衝突完成）時，節點 A將發出 0 DACK給起始節點。起始節點在接收到DACK之後，將會發出XFER。這可以簡化硬體的實施，因爲其讓衝突處理流程能夠相當類似於圖3及4。但是，所有衝突都使用 DACK，其將會稍微減緩衝突排解的速度。這通常不是問題，因爲衝突不常發生。在一實施例中，所有進來的請求都被阻擋在DACK的斷定與DACK之CMP的接收之間。這協助起始節點決定是否到達衝突鏈的終點。在一實施例中，當接收到DACK的CMP或XFER，阻 -16- 1274998 - (14) * 擋情況被去除。該節點的行爲將會像對等節點一樣。圖6爲起始節點演算法之方法的流程圖實施例。如先前所討論的，節點可被分類如下：源節點、起始節點及對等節點。所主張之標的物描述用於源節點及起始節點的協定。在一實施例中，所主張之標的物是使用對等節點協定’如同針對相關應用所討論的。圖6描繪用於起始節點演算法的方法。舉例來說，起 ^ 始節點演算法可以被用來解決其它節點之間的衝突。例如，在一實施例中，以下的條件/事件被用來收回衝突。起始節點將收回（結束）衝突請求，並將衝突因子從衝突鏈中移除，如果：接收到所有的確認訊息，以及接收到Xfer或向前傳送訊息，以及

Xfer被送出’或者該訊息爲衝突鏈中的最後一個訊息。 — 替換地，在另一實施例中，以下的條件/事件被用來收回衝突：接收到所有的確認訊息，以及所有的衝突都被找到，以及衝突鏈中之待解決衝突不是轉移或向前傳送的目標，以及

Xfer被送出，或者該訊息爲衝突鏈中的最後一個訊息。而且，起始節點演算法也監督及決定衝突訊息的格式 -17- (15) 1274998 • 與記錄。例如，來自一節點的衝突訊息可能只含有原始事務的事務ID。替換地，在另一實施例中，來自一節點的衝突訊息可能含有原始事務的事務ID與衝突事務的事務 ID。此兩個事務ID可以被用來建構一衝突鏈接表。由於原始及衝突事務的ID兩者都出現，所以衝突鏈可被記錄於兩事務之各自的記錄入口處。就像YAP(專利號碼？？？) 一樣，此協定需要一實質的記錄表，以儲存進行中的每一 B 個事務。當一請求抵達起始節點處時，起始節點可簡單地查閱衝突鏈以找到所有的衝突，而不需要緩慢且浪費的位址CAM。例如，圖2中從C到起始節點的ack被最佳化成 I —Ack_Conflict。此 I_ A c k —C o nfl i c t 具有 A 的 PRIL 事務ID (原始的）及PWL事務ID (衝突因子）。當a的PRIL 抵達起始節點處，起始節點可以簡單地使用PWL的事務 ID，以取代緩慢且浪費的定址C A Μ搜尋，而P W L的事務 ID係記錄自I — Ack —Conflict，以尋找PWL記錄入口。支援分散式快取記憶體相干性衝突排解的例示性系統圖7爲節點之實施例的方塊圖。節點7 0 0係例舉有單處理器、快取記憶體、記憶體控制器與記憶體；但是，在一節點中可包括任何數目之任何這些組件。此外，節點內還可包括附加及/或不同的組件（例如，匯流排橋接器）。處理器7 1 0可以是習知技術中已知之任何類型的處理器。在一實施例中，處理器7 1 0包括快取記憶體7 2 0。在替換實施例中，快取記憶體7 20是在處理器7 1 0的外部， -18 - (16) 1274998 或者，處理器7 1 0的外部或內部還可包括附加的體。記憶體控制器7 3 0與快取記憶體720及記憶連接。記憶體控制器7 3 0操作爲快取記憶體7 2 0 7 4 0之間的介面。在一實施例中，記憶體控制器本文所描述的快取記憶體相干性協定來維持快取干性。記憶體控制器7 3 0經由節點鏈結7 5 0而與互動。在替換實施例中，如本文的描述，處理器憶體控制器73 0互動，以保持快取記憶體相干性器7 1 0經由替換的節點鏈結75 5而與其它節點互在一實施例中，節點鏈結7 5 0包括用於每一用介面，節點7 0 0與其互動。在替換實施例中， 7 5 0包括許多介面，其係與許多和節點7 0 0互動同。在一實施例中，節點7 0 0與代表多個節點的代理互動。圖8爲多處理器系統的實施例。多處理器系欲代表具有多個處理器的一列系統，例如電腦系監視系統等等。替換的多處理器系統可包括更多及/或不同的組件。在某些情況中，本文所描述憶體管理技術可以被應用於單處理器及多處理器處理器系統8 0 0可被組構而操作爲多節點系統。多處理器系統8 0 0包括匯流排系統8 1 0或其置以互通資訊。匯流排系統8 1 0可包括任何數目及相關的互連電路，例如，匯流排橋接器。處理快取記憶體740相與記憶體 7 3 0按照記憶體相其它節點 7 1 〇與記，且處理動。節點的專節點鏈結之節點不一或多個統8 00意統、即時或更少，的快取記系統。多它通信裝的匯流排器82 0係 -19: (17) (17)

1274998 與匯流排系統8 1 0相連接以處理資訊。處理器8 2 Ο · 快取記憶體822，例如，〇階（LO)的快取記憶體，J 取記憶體控制器824。在一實施例中，處理器820」取記憶體82 5相連接，其可以爲任何類型的快取記j 在替換實施例中，快取記憶體8 2 5可與匯流排系統連接。其它類型的處理器-快取記憶體組態也都可使在一實施例中，快取記憶體控制器824係經由1 億體介面828而與快取記憶體822相連接，其可以j 例來說，處理器820內部的匯流排。快取記憶體控f 經由快取記憶體介面826而與快取記憶體825相連3 提供處理器820與外部快取記憶體之間的介面。多處理器系統800另包括具有快取記憶體8 3 2 J 記憶體控制器8 3 4的處理器8 3 0。快取記憶體控制彳係經由快取記憶體介面8 3 8而與快取記憶體8 3 2相$ 同樣地，快取記憶體控制器8 3 4係經由快取記憶體 8 3 6而與快取記憶體8 3 5相連接。在一實施例中，快億體8 3 5與處理器83 0相連接。雖然多處理器系統8 0 0係例舉有兩個處理器，但理器系統8 0 0可包括任何數目的處理器及/或協同器。多處理器系統8 0 0另包括與匯流排系統8 1 0相連 g己憶體系統8 4 0。記憶體系統8 4 0在適當的場合可包態（例如，隨機存取記億體）及靜態（例如，唯讀記憶 C D - R 〇 Μ、碟片儲存、快閃記憶體）記憶體裝置的任意及相關的裝置。記憶體系統8 4 0的記憶體裝置被用來 1*包括 (及快 i與快體。 :10相目。 !:取記卜舉 1器係 h苴 :快取 "34 丨接。 :介面 :取記 .多處 .處理接的括動體、組合儲存 -20- (18) 1274998 .由多處理器系統8 00之處理器所執行之資訊及指令。在處理器執行指令期間，記憶體系統840也可被用來儲存暫時性的變數或其它中間資訊。指令可從靜態或遠端儲存裝置（諸如磁碟片、唯讀記億體（ROM)積體電路、CD-ROM、DVD)經由遠端連接（可以是有線或無線連接等）而被提供給記億體系統840。在替換實施例中，可用固定線路電路來取代軟體指令’或者瞻固定線路電路可以與軟體指令相結合。因此，序列指令的執行並不限於固定線路電路與軟體指令之任何特定的組合。多處理器系統8 0 0另包括網路介面8 5 0，以提供對網路的存取，諸如區域網路及/或網際網路。網路介面8 5 0 能夠提供無線及/或有線的網路介面，其可包括與遠端電子可存取媒體間之指令的往來通信。電子可存取媒體包括提供（亦即，儲存及/或傳送）可被電子裝置（例如，電 ^ 腦、個人數位助理、蜂巢式電話）讀取之形式的內容（例如，電腦可執行指令）的任何機構。舉例來說，機器可存取媒體包括唯讀記億體（ROM)、隨機存取記憶體（RAM)、磁碟片儲存媒體、光學儲存媒體、快閃記憶體裝置；電氣、光學、聲學或其它型式之傳播信號（例如載波、紅外線信號、數位信號）。多處理器系統8 0 0可包括顯示裝置8 6 0，諸如陰極射線管（CRT)或液晶顯示器（LCD)，以顯示資訊。輸入裝置 8 7 0包括，例如具有文數字及其它鍵的鍵盤，典型上係連 - 21 - (19) (19)1274998 接至匯流排810，以選擇性地與處理器82 〇及/或8 3 〇通信資訊及命令選擇。其它類型的使用者輸入裝置爲游標控制裝置’諸如滑鼠、軌跡球、或游標方向鍵，以選擇性地與處理器8 2 0及8 3 0通信方向資訊及命令選擇，及控制游標在顯示裝置8 6 0上的移動。本說明書中參考的’’ 一個實施例”或”一實施例”意指在本發明之至少一個實施例中所包含之關於該實施例所描述的特定特徵、結構或特性。本說明書中各處出現的”在一實施例中” 一語，不需將其全部視爲相同的實施例。在上述的說明書中，本發明已參照其特定的實施例來加以描述。但是，很明顯地，另外可做各種的修改與變化’而不會偏離本發明之較廣義的精神與範圍。因此，說明書及圖式可視爲說明而無限制意味。【圖式簡單說明】本發明係經由C實例來予以舉例說明，但這些實例並非限制的，在所附圖式的各圖中，相同的參考編號代表相同的元件。圖1提供支援讀取事務之協定之槪念性舉例說明的實施例。圖2提供支援寫回競爭衝突之協定的槪念性舉例說明的實施例。圖3提供支援兩個請求間，請求所有權之競爭衝突之協定的槪念性說明的實施例。 -22- 1274998 • (20) • 圖4提供支援兩個請求間，請求所有權之延遲衝突之協定的槪念性舉例說明的實施例。圖5係用於源節點演算法之方法的流程圖的實施例。圖6係用於起始節點演算法之方法的流程圖的實施例。圖7係節點之實施例的方塊圖。圖8係多處理器系統的實施例。【主要元件符號說明】 700 節點 7 10 處理器 720 快取記憶體 730 記憶體控制器 740 記憶體 750 節點鏈結 755 節點鏈結 800 多處理器系統 8 10 匯流排系統 820 處理器 822 快取記憶體 824 快取記憶體控制器 825 快取記憶體 826 快取記憶體介面 828 快取記憶體介面 -23- 1274998 (21) 832 快取記憶體 834 快取記憶體控制器 830 處理器 83 6 快取記憶體介面 83 8 快取記憶體介面 835 快取記憶體 840 記憶體系統 850 網路介面 860 顯示裝置 870 輸入裝置 -24

Claims

1274998 - (1) . 十、申請專利範圍 1. 一種用於記憶體相干性之方法，包含：在多節點系統中，將對資料區塊之拷貝的請求彳足胃_ 對等節點傳送給多個節點；將資料區塊的拷貝從第二對等節點傳送給第—對等_ 點，並傳送一確認給起始節點；以及從起始節點傳送完成訊息給第一節點，以指+ ·+* a· μ 了日Τρ;來自第一對等節點的請求之完成。 2 ·如申請專利範圍第1項的方法，其中，阶％次r N ^ 將封資料區塊之拷貝的請求從第一對等節點傳送給多個節點包含^ 第一對等節點經由按順序起始通道傳送給起始節s占。 3 ·如申請專利範圍第1項的方法，其中，從第二對等節點傳送給第一對等節點之資料區塊的拷貝爲裔料區塊^ 的獨有拷貝。 4· 一種用於記憶體相干性之方法，包含以下步驟： ® 在多節點系統中，將對資料區塊之拷貝的請求從第_ 對等節點傳送給多個節點；將資料區塊的拷貝從第二對等節點傳送給第一對等節點，並傳送一確認給起始節點；以及從起始節點傳送完成訊息給第一節點，以指示來自第一對等節點的請求之完成，並將與資料區塊之拷貝相關的快取線去配置。 5·如申請專利範圍第4項的方法，其中，將對資料區塊之拷貝的請求從第一對等節點傳送給多個節點包含從 >25- 1274998 • (2) ’ 第〜對等節點經由按順序起始通道傳送給起始節點。 6 ·如申請專利範圍第4項的方法，其中，從第二對等節點傳送給第一對等節點之資料區塊的拷貝爲資料區塊的獨有拷貝。 7 · —種用以支援分散式快取記憶體相干性衝突排解之系統，包含·· 複數個封等卽點’係連接至起始節點，由快取記憶體相干性協定所監督，而快取記憶體相干性協定係至少部分根據藉由起始節點來解決複數個對等節點間的衝突，如果發生以下情況：接收到所有複數個確認訊息，以及接收到一轉移（Xfer)訊息或向前傳送訊息，及轉移（Xfer)訊息被送出，或該訊息爲衝突鏈中的最後一個訊息；貝(1，起始節點收回衝突的請求，並從衝突鏈中移除衝 _突因子。 8 .如申請專利範圍第7項的系統，另包含如果發生以下情況：接收到所有複數個確認訊息，及所有複數個衝突都被找到，以及衝突鏈中複數個待解決的衝突不是轉移或向前傳送的目標，以及轉移（Xfer)訊息被送出，或該訊息爲衝突鏈中的最後一個訊息； -26- (3) (3)1274998 則，起始節點收回衝突的請求，並從衝突鏈中移除衝突算子。 9.如申請專利範圍第7項的系統，其中，該衝突訊息僅含有原始事務的事務ID。 10·如申請專利範圍第7項的系統，其中，該衝突訊息含有原始事務的事務ID以及衝突事務的事務id。 11· 一種用以支援分散式快取記憶體相干性衝突排解之系統，包含：至少一連接至複數個對等節點的源節點，複數個對等節點連接至起始節點，由快取記憶體相干性協定所監督，快取記憶體相干性協定至少部分根據藉由起始節點來解決複數個封寺自卩點間的衝突’源節點請求至少一快取線的拷貝，如果發生以下情況：如果快取線爲在向前傳送、獨有或修改狀態其中之一的快取線，並偵測到至少一個衝突，且接收到完成而沒有接收到轉移（Xfr)訊息；則，源節點斷定資料確認訊息。 1 2 ·如申請專利範圍第1 1項的系統，其中，該快取記憶體相干性協定協助在衝突期間，衝突鏈中的每一個事務啓動一資料確認循環。 1 3 ·如申請專利範圍第〗2項的系統，其中，該資料確認循環包含將 E_CMP —XFER 訊息變換成 E —CMP_Conflict 訊息。 1 4 ·如申請專利範圍第1 2項的系統，另包含如果發 -27- (4) (4)1274998 生以下情況：所有進來的請求都被阻擋在資料確認訊息之斷定與資料訊息之完成的接收之間；則，源節點斷定一資料確認訊息。 ]5 . —種用以解決寫回競爭衝突的方法，包含：在多節點系統中’將封資料區塊之拷貝的請求從第一對等節點傳送給多個節點；將經修改之資料區塊之拷貝的快取線（寫回線）被寫入 g己憶體中的請求，從第二對等節點傳送給起始節點；以及在起始節點處解決第一對等節點與第二對等節點間的寫回競爭衝突。 1 6.如申請專利範圍第1 5項的方法，其中，從第二 k寸等自卩點到起始卽點的易回目靑求係經由中序起始通道來予以傳送的。 1 7 ·如申請專利範圍第1 5項的方法，其中，第二對等節點及第三對等節點產生I — ACK訊息，以回應第一節點的請求。 18·如申請專利範圍第1 5項的方法，其中，解決寫回競爭衝突包含起始節點將藉由以下步驟來解決彳厨^ ·· 以完成CMP訊息回應給第一對等節點，而完成CMP 訊息指示經修改之資料寫回記憶體之完成；以及以I —DATA-CMP訊息回應第一對等節點，而 I〜DATA_CMP訊息包括資料區塊之拷貝及指示來自第一對等節點之請求的完成。 -28- (5) 1274998 ί9· V種爲兩實質上同時發生之請求之所有權的請求解決競^孝衝突的方法，包含：在多節點系統中，將對資料區塊之拷貝的請求從第一對等節點傳送給多個節點；在多節點系統中’將對相同資料區塊之拷貝的請求從第二對等節點傳送給多個節點；在起始節點處解決第一對等節點與第二對等節點之間的競爭衝突。 2 〇 ·如申請專利範圍第1 9項的方法，其中，從第一

對等節點到起始節點的請求係經由按順序起始通道來予以傳送的。 2 1·如申請專利範圍第丨5項的方法，其中，該解決競爭衝突包含起始節點將藉由以下步驟來解決衝突：

在起始節點處接收來自第一及第二對等節點的一ACK —Conflict訊息，以指示所請求之快取線有一共同待解決的請求；以及 ^ - …心，丨、口來一對寺節點，曰π弟二對等節點具有所請求資料的獨有拷目，且第三對=點將資料的獨有拷貝向前傳送給第—對等節點；第二Γ嶋E—ACK訊息給起始節點，以指示其已將 Bra、之貝料的獨有拷貝向前傳送給第一對等節點；一從第三對等節點送出LACK訊息給起始節里’ 應桌二對等節g纟的^ 以回〜因其在送出資料的獨有拷貝給第 ¥、寺lp點之後’已使所請求的資料無效；以及 ” -29- (6) 1274998 經由起始節點發出I_CMP訊息出 E — CMP —XFER(第二節點1D)訊息; 決競爭衝突；E_CMP_XFER(第二節點等節點將資料的獨有拷貝轉移到第二: '第二對等節點及發第一對等節點來解 ID)訊息致使第一對等節點。

- 30-