WO2007110914A1

WO2007110914A1 - マルチプロセッサシステムおよびマルチプロセッサシステムの動作方法

Info

Publication number: WO2007110914A1
Application number: PCT/JP2006/306185
Authority: WO
Inventors: Shinichiro Tago
Original assignee: Fujitsu Limited
Priority date: 2006-03-27
Filing date: 2006-03-27
Publication date: 2007-10-04

Abstract

　本発明では、マルチプロセッサシステムは、複数のプロセッサとプロセッサにそれぞれ対応するキャッシュメモリとキャッシュコントローラを有している。あるプロセッサは、そのプロセッサのキャッシュメモリにデータを転送する命令を発行する。この命令に応答して、キャッシュコントローラは、転送するデータが含まれるキャッシュラインを他のプロセッサのキャッシュメモリに転送する。この転送により、転送元のデータが転送先のキャッシュメモリに格納される。キャッシュメモリ間の通信は、命令の実行時のみ行われるので、キャッシュメモリ間のバスのトラフィックを軽減できる。また、データの転送先のキャッシュメモリに対応しているプロセッサが、転送されたデータにアクセス要求を出した場合、キャッシュメモリにアクセス対象のデータが既に格納されているので、レイテンシを小さくできる。

Description

マノレチプロセッサシステムおよびマノレチプロセッサシステムの動作方法技術分野

[0001] 本発明は、マルチプロセッサシステムおよびマルチプロセッサシステムの動作方法に関する。

背景技術

[0002] 一般に、プロセッサシステムでは、プロセッサとメインメモリの間に高速なキャッシュメモリを搭載する方式がとられている。これにより、プロセッサと主記憶装置であるメインメモリの動作速度のバランスがとられる。また、高い処理性能が要求されるシステムでは、複数のプロセッサを使用するマルチプロセッサシステムが構築される。複数のプ口セッサ力 Sメインメモリをアクセスするマルチプロセッサシステムでは、例えば、キヤッシュメモリは、プロセッサごとに搭載され、各キャッシュメモリは、他のキャッシュメモリと同じデータを共有しているかどうかを互いに監視する（例えば、特許文献 1参照)。特許文献 1：特開平 4 92937号公報

発明の開示

発明が解決しょうとする課題

[0003] この種のマルチプロセッサシステムでは、各キャッシュメモリは、他のプロセッサからのデータのアクセス要求に対して、アクセス対象のデータを共有して!/、るかどうかを常に監視する。このため、監視のための通信が増加し、キャッシュメモリ間のノスの利用量 (トラフィック）が増加する。さらには、プロセッサ数が増えると、監視するキヤッシュメモリと監視されるキャッシュメモリがそれぞれ増えるので、ハードウェアが複雑になる。このため、マルチプロセッサシステムを構築するための設計が難しい。また、一方のプロセッサが他方のプロセッサのキャッシュメモリに格納されているデータを読み出すとき、例えば、データが格納されているキャッシュメモリは、データを読み出すプロセッサのキャッシュメモリにデータを複製する。その後に、読み出しを要求したプロセッサは、そのデータが複製されたキャッシュメモリからデータを受け取る。このため、プ口セッサがキャッシュメモリにアクセスを要求してからデータを受け取るまでの遅延時間（レイテンシ）は、大きくなる。

[0004] 本発明の目的は、キャッシュメモリ間のバスのトラフィックを軽減し、複数のプロセッサで共有しているデータに対するアクセスのレイテンシを小さくすることである。

課題を解決するための手段

[0005] 本発明では、マルチプロセッサシステムは、複数のプロセッサとプロセッサにそれぞれ対応するキャッシュメモリとキャッシュコントローラを有している。データの転送元のキャッシュメモリに対応するプロセッサは、データの転送元のキャッシュメモリにデータを転送する命令を発行する。この命令に応答して、キャッシュコントローラは、転送するデータが含まれるキャッシュラインを他のプロセッサのキャッシュメモリに転送する。この転送により、転送元のデータが含まれたキャッシュラインが転送先のキャッシュメモリに格納される。ここで、データの転送は、データの移動もしくはデータの複製を意味する。データの転送先のキャッシュメモリに対応しているプロセッサ力転送されたデータにアクセス要求を出した場合、そのプロセッサのキャッシュメモリにアクセス対象のデータが既に格納されているので、レイテンシを小さくできる。また、キャッシュメモリ間の通信は、命令の実行時のみ行われるので、キャッシュメモリ間のバスのトラフイツクを軽減できる。

発明の効果

[0006] キャッシュメモリ間のバスのトラフィックを軽減し、複数のプロセッサで共有しているデータに対するアクセスのレイテンシを小さくできる。

図面の簡単な説明

[0007] [図 1]本発明の実施形態を示すブロック図である。

[図 2]図 1に示したマルチプロセッサシステムの動作の一例を示すフローチャートである。

[図 3]図 1に示したマルチプロセッサシステムにおけるデータを転送するときの動作の一例を示す説明図である。

[図 4]図 1に示したマルチプロセッサシステムにおけるデータを転送するときの動作の別の例を示す説明図である。

[図 5]本発明におけるデータを転送するときの動作の比較例を示す説明図である。 [図 6]本発明におけるデータを転送するときの動作の別の比較例を示す説明図である。

[図 7]本発明の別の例を示すブロック図である。

発明を実施するための最良の形態

[0008] 以下、本発明の実施形態を図面を用いて説明する。

図 1は、本発明の実施形態を示している。マルチプロセッサシステムは、プロセッサ PO、 Pl、 P2、キャッシュメモリ CO、 Cl、 C2、キャッシュ動作コントローラ CCNTO、 C CNT1、 CCNT2、キャッシュ間接続コントローラ ICCNTおよびメインメモリ MMを有している。さらに、キャッシュ動作コントローラ CCNTO、 CCNT1、 CCNT2は、キヤッシュヒット判定回路 CJO、 CJ1、 CJ2、送信制御回路 SCNTO、 SCNT1、 SCNT2および受信制御回路 RCNTO、 RCNT1、 RCNT2をそれぞれ有している。プロセッサ PO 、 Pl、 P2は、それぞれキャッシュメモリ CO、 Cl、 C2に直接接続されている。キヤッシュメモリ CO、 Cl、 C2は、それぞれキャッシュ動作コントローラ CCNTO、 CCNT1、 C CNT2に接続されている。キャッシュ間接続コントローラ ICCNTは、キャッシュ動作コントローラ CCNTO、 CCNT1、 CCNT2およびメインメモリ MMに接続されている。

[0009] キャッシュ動作コントローラ CCNTO、 CCNT1、 CCNT2は、従来と同様に、キヤッシュヒット判定などのキャッシュメモリの動作を制御する。さらに、キャッシュ動作コントローラ CCNTO、 CCNT1、 CCNT2は、対応するプロセッサ PO、 Pl、 P2からの転送命令に応答して、他のプロセッサのキャッシュメモリに、キャッシュ間接続コントローラ I CCNTを経由してキャッシュラインを転送する。ここで、対応するプロセッサ PO、 Pl、 P2からの転送命令は、転送命令を発行したプロセッサのキャッシュメモリから他のプ口セッサのキャッシュメモリにデータを転送する命令である。また、転送命令で転送されるデータは、上述のキャッシュラインに含まれている。キャッシュ間接続コントローラ ICCNTは、キャッシュメモリ CO、 Cl、 C2間のキャッシュラインの転送を制御する。すなわち、キャッシュ動作コントローラ CCNTO、 CCNT1、 CCNT2とキャッシュ間接続コントローラ ICCNTは、転送命令に応答して、転送するデータが含まれるキャッシュラインを他のプロセッサのキャッシュメモリに転送するキャッシュコントローラとして機能する。 [0010] メインメモリ MMは、プロセッサ P0、 Pl、 P2が共有して使用する主記憶装置である。本実施形態では、メインメモリ MMは、階層が一番低い共有メモリである。

図 2は、図 1に示したマルチプロセッサシステムの動作の一例を示している。この例では、プロセッサ P0、 PIは、アドレス Xのデータを共有している。ここで、アドレス Xは、メインメモリ MM内のアドレスを示している。

[0011] まず、プロセッサ P0は、キャッシュメモリ COに対して、アドレス Xを含むキャッシュラインをキャッシュメモリ COからキャッシュメモリ C1に転送する命令を発行する（ステップ S 100)。キャッシュ動作コントローラ CCNT0は、アドレス Xがキャッシュヒットかキヤッシユミスかを判定する (ステップ S 110)。

ステップ S 110でキャッシュヒットの場合、キャッシュ動作コントローラ CCNT0は、キャッシュメモリ COからアドレス Xを含むキャッシュラインを読み出す (ステップ S 120)。キャッシュ動作コントローラ CCNT0は、読み出したキャッシュラインをキャッシュ間接続コントローラ ICCNTに送信する (ステップ S130)。キャッシュ間接続コントローラ IC CNTは、受信したキャッシュラインをキャッシュ動作コントローラ CCNT1に送信する（ステップ S 140)。

[0012] キャッシュ動作コントローラ CCNT1は、アドレス Xがキャッシュヒットかキャッシュミスかを判定する（ステップ S 150)。ステップ S 150でキャッシュミスの場合、キャッシュ動作コントローラ CCNT1は、受信したキャッシュラインをキャッシュメモリ C1に格納する (ステップ S160)。これにより、アドレス Xのデータは、キャッシュメモリ C1に格納される。したがって、この後にプロセッサ P1がアドレス Xのアクセスを要求した場合、メインメモリ MMある!/、は他のプロセッサのキャッシュメモリ力データを転送する必要がな!ヽので、レイテンシを小さくできる。

[0013] ステップ S 150でキャッシュヒットの場合、キャッシュ動作コントローラ CCNT1は、受信したキャッシュラインをキャッシュメモリ C1のキャッシュヒットしたキャッシュラインに上書きする (ステップ S 170)。

受信したキャッシュライン力ダーティ"の場合、上書きしたキャッシュラインの"ダーティビッド，も更新する。ここで、 "ダーティ"は、階層が上位のキャッシュメモリに格納されているデータのみ更新して、階層が下位のメインメモリ MMにあるデータを更新していない状態である。また、 "ダーティビッド 'は、そのキャッシュラインが"ダーティ"である力否かを示す指示フラグである。ステップ S 170で、キャッシュラインを上書きすることにより、プロセッサ P1が古いデータを演算対象にしてしまう不都合を解消できる。この結果、マルチプロセッサシステムの誤動作を防止できる。

[0014] 一方、ステップ S 110でキャッシュミスの場合、キャッシュ動作コントローラ CCNT0は、キャッシュ間接続コントローラ ICCNTにキャッシュミスを通知する（ステップ S 200)。キャッシュ間接続コントローラ ICCNTは、キャッシュメモリ C1にアドレス Xを含むキヤッシュラインの格納を要求する（ステップ S210)。キャッシュ動作コントローラ CCNT1は、アドレス Xがキャッシュヒットかキャッシュミスかを判定する（ステップ S220)。

[0015] ステップ S220でキャッシュミスの場合、キャッシュ動作コントローラ CCNT1は、キヤッシュ間接続コントローラ ICCNTにアドレス Xのリードを要求する。引き続き、キヤッシュ間接続コントローラ ICCNTは、メインメモリ MMにアドレス Xのリードを要求する（ステツプ S230)。キャッシュ間接続コントローラ ICCNTは、アドレス Xのデータが含まれるデータをキャッシュラインのサイズ分だけ読み出す。キャッシュ間接続コントローラ I CCNTは、読み出したデータをキャッシュ動作コントローラ CCNT1に送信する。キヤッシュ動作コントローラ CCNT1は、受信したデータをキャッシュメモリ C1に格納する（ステップ S160)。これにより、アドレス Xのデータがキャッシュメモリ COに格納されていない場合でも、アドレス Xのデータは、キャッシュメモリ C1に格納される。したがって、この後にプロセッサ P1がアドレス Xのアクセスを要求した場合、メインメモリ MMあるいは他のプロセッサのキャッシュメモリからデータを転送する必要がな、ので、レイテンシを小さくできる。

[0016] ステップ S220でキャッシュヒットの場合、アドレス Xのデータは、キャッシュメモリ C1 に既に格納されている。キャッシュ動作コントローラ CCNT1は、何もせずにそのまま動作を終了し、キャッシュメモリの状態を保持する (ステップ S240)。この場合、キヤッシュメモリ間でのデータの転送が発生しないので、キャッシュメモリ間のバスのトラフィックを軽減できる。

[0017] また、ステップ S 100のキャッシュラインを転送する命令力キャッシュラインを移動する命令の場合、キャッシュ動作コントローラ CCNT0は、ステップ S120の後に、キヤッシュメモリ COの読み出されたキャッシュラインに対応するエントリを無効にする。すなわち、転送元のキャッシュメモリ COのデータをキャッシュメモリ COに残すことなぐ転送先のキャッシュメモリ C1に転送する。この場合も、キャッシュメモリ C1に対する動作は、上述のステップ S130— S160、ある!/、は S130— S150、 S170と同じなので、アドレス Xのデータは、キャッシュメモリ C1に格納される。したがって、この後にプロセッサ P1がアドレス Xのアクセスを要求した場合、メインメモリ MMあるいは他のプロセッサのキャッシュメモリからデータを転送する必要がな、ので、レイテンシを小さくできる。また、キャッシュラインを移動する命令の場合、プロセッサ P0とプロセッサ P1で共有しているアドレス Xのデータは、キャッシュメモリ COに残らない。したがって、共有しているデータの一致性に関する管理を簡単にできる。

[0018] ステップ S 100のキャッシュラインを転送する命令がキャッシュラインを複製する命令の場合、キャッシュ動作コントローラ CCNT0は、ステップ S120の後も、キャッシュメモリ COの読み出されたキャッシュラインに対応するエントリを有効のままにしておく。すなわち、転送元のキャッシュメモリ COのデータをキャッシュメモリ COに残した状態で、転送先のキャッシュメモリ C1に転送する。この場合も、キャッシュメモリ C1に対する動作は、上述のステップ S130— S160、ある!/、は S130— S150、 S170と同じなので、アドレス Xのデータは、キャッシュメモリ C1に格納される。したがって、この後にプロセッサ P1がアドレス Xのアクセスを要求した場合、メインメモリ MMあるいは他のプロセッサのキャッシュメモリからデータを転送する必要がな、ので、レイテンシを小さくできる。また、キャッシュラインを複製する命令の場合、アドレス Xのデータは、キャッシュメモリ COに格納されたままである。したがって、プロセッサ P0がアドレス Xのデータを再度アクセスしたときのレイテンシを小さくできる。

[0019] 上述の動作フローでは説明していないが、キャッシュラインをリプレースする動作は、従来の方式と同様である。例えば、ステップ S 160で、キャッシュラインを格納したときに、リプレースされるキャッシュラインがある場合、リプレースされるキャッシュラインを破棄する。但し、リプレースされるキャッシュライン力ダーティ"の場合、階層が下位のメインメモリ MMにリプレースされるキャッシュラインを書き戻す。

[0020] 図 3は、図 1に示したマルチプロセッサシステムにおけるデータを転送するときの動作の一例を示している。図中の動作（_a) - (g)は、図 2のステップ S100、 S110、 S12 0、 S130、 S140、 S150、 S160の動作にそれぞれ対応する。図中の（Χ) ίま、ァドレス Xのデータを示している。図中の破線は、データの転送を制御する通信の流れを示している。実線は、データの流れを示している。

[0021] プロセッサ Ρ0は、キャッシュメモリ COに対して、アドレス Xを含むキャッシュラインをキャッシュメモリ COからキャッシュメモリ C1に転送する命令を発行する（図 3 (a) )。キャッシュ動作コントローラ CCNT0のキャッシュヒット判定回路 CJ0は、アドレス Xがキヤッシュヒットかキャッシュミスかを判定する（図 3 (b) )。キャッシュメモリ COは、アドレス X のデータを格納しているので、キャッシュヒットする。キャッシュ動作コントローラ CCN TOの送信制御部 SCNT0は、キャッシュメモリ COからアドレス Xを含むキャッシュラインを読み出す（図 3 (c) )。送信制御部 SCNT0は、読み出したキャッシュラインをキヤッシュ間接続コントローラ ICCNTに送信する（図 3 (d) )。キャッシュ間接続コントローラ ICCNTは、受信したキャッシュラインをキャッシュ動作コントローラ CCNT1の受信制御部 RCNT1に送信する（図 3 (e) )。キャッシュ動作コントローラ CCNT1のキヤッシュヒット判定回路 CJ1は、アドレス Xがキャッシュヒットかキャッシュミスかを判定する（図 3 (f) )。キャッシュメモリ C1は、アドレス Xのデータを格納していないので、キヤッシュミスする。受信制御部 RCNT1は、受信したキャッシュラインをキャッシュメモリ C1に格納する（図 3 (g) )。

[0022] この後に、プロセッサ P1は、アドレス Xのリードを要求する（図 3 (h) )。この場合、上述の動作（a)—（g)により、アドレス Xのデータは、キャッシュメモリ C1に既に格納されているので、キャッシュメモリ C1は、キャッシュヒットする（図 3 (i) )。キャッシュメモリ C1 は、アドレス Xのデータをプロセッサ P1に直ちに返送する（図 3 (j) )。したがって、プロセッサ P1がアドレス Xのリードを要求した後に、メインメモリ MMあるいは他のプロセッサのキャッシュメモリからデータを転送する必要がな、ので、レイテンシを小さくできる

[0023] 一方、図 3には示していないが、動作 (f)の時点で、キャッシュメモリ C1にアドレス X のデータが格納されている場合、キャッシュメモリ C1は、キヤシュヒットする。受信制御咅RCNT1は、受信したキャッシュラインをキャッシュメモリ C1のキャッシュヒットしたキャッシユラインに上書きする。これ ίま、図 2のステップ S100、 S110、 S120、 S130、 S 140、 S150、 S170の動作に対応する。この場合も、プロセッサ P1がアドレス Xのリードを要求した後に、メインメモリ MMあるいは他のプロセッサのキャッシュメモリ力らデータを転送する必要がないので、レイテンシを小さくできる。また、キャッシュラインを上書きすることにより、プロセッサ P 1が古ヽデータを演算対象にしてしまう不都合を解消できる。この結果、マルチプロセッサシステムの誤動作を防止できる。

図 4は、図 1に示したマルチプロセッサシステムにおけるデータを転送するときの動作の別の例を示している。図中の動作（a) - (g)は、図 2のステップ S100、 S110、 S 200、 S210、 S220、 S230、 S160の動作にそれぞれ対応する。図中の矢印の意味は、図 3と同じである。

プロセッサ POは、キャッシュメモリ COに対して、アドレス Xを含むキャッシュラインをキャッシュメモリ COからキャッシュメモリ C1に転送する命令を発行する（図 4 (a) )。キャッシュ動作コントローラ CCNT0のキャッシュヒット判定回路 CJ0は、アドレス Xがキヤッシュヒットかキャッシュミスかを判定する（図 4 (b) )。キャッシュメモリ COは、アドレス X のデータを格納していないので、キャッシュミスする。キャッシュ動作コントローラ CCN TOは、キャッシュ間接続コントローラ ICCNTにキャッシュミスを通知する（図 4 (c) )。キャッシュ間接続コントローラ ICCNTは、キャッシュメモリ C1にアドレス Xを含むキヤッシュラインの格納を要求する（図 4 (d) )。キャッシュ動作コントローラ CCNT1のキヤッシュヒット判定回路 CJ1は、アドレス Xがキャッシュヒットかキャッシュミスかを判定する（図 4 (e) )。キャッシュメモリ C1は、アドレス Xのデータを格納していないので、キヤッシュミスする。キャッシュ動作コントローラ CCNT1は、キャッシュ間接続コントローラ ICC NTにアドレス Xのリードを要求する。引き続き、キャッシュ間接続コントローラ ICCNT は、メインメモリ MMにアドレス Xのリードを要求する（図 4 (f) )。キャッシュ間接続コントローラ ICCNTは、メインメモリ MMから読み出したアドレス Xを含むキャッシュラインをキャッシュ動作コントローラ CCNT1の受信制御部 RCNT1に送信する。受信制御部 RCNT1は、受信したキャッシュラインをキャッシュメモリ C1に格納する（図 4 (g) )。これにより、アドレス Xのデータがキャッシュメモリ COに格納されていない場合でも、ァドレス Xのデータは、キャッシュメモリ C1に格納される。 [0025] この後に、プロセッサ PIは、アドレス Xのリードを要求する（図 4 (h) )。この場合、上述の動作（a)—（g)により、アドレス Xのデータは、キャッシュメモリ C1に既に格納されているので、キャッシュメモリ C1は、キャッシュヒットする（図 3 (i) )。キャッシュメモリ C1 は、アドレス Xのデータをプロセッサ P1に直ちに返送する（図 3 (j) )。この場合も、プロセッサ P1がアドレス Xのリードを要求した後に、メインメモリ MMあるいは他のプロセッサのキャッシュメモリからデータを転送する必要がな、ので、レイテンシを小さくできる

[0026] 一方、図 4には示していないが、動作（e)の時点で、キャッシュメモリ C1にアドレス X のデータが格納されている場合、キャッシュメモリ C1は、キヤシュヒットする。キヤッシュ動作コントローラ CCNT1は、何もせずにそのまま動作を終了し、キャッシュメモリ C 1の状態を変えることなく保持する。これは、図 2のステップ S100、 S110、 S200、 S2 10、 S220、 S240の動作に対応する。キャッシュメモリ間でのデータの転送が発生しないので、キャッシュメモリ間のバスのトラフィックを軽減できる。

[0027] 図 5は、本発明の比較例を示している。比較例のマルチプロセッサシステムのキヤッシュ動作コントローラ CCNTO、 CCNTl, CCNT2は、キャッシュメモリ間のアクセスを監視する外部アクセス監視部 SO、 Sl、 S 2をそれぞれ有している。この例では、キャッシュメモリ COは、アドレス Xのデータを格納していて、キャッシュメモリ C1は、アドレス Xのデータを格納していない（図 3の初期状態と同じ)。この状態で、プロセッサ P 1がアドレス Xのアクセスを要求した場合を示している。図中の矢印の意味は、図 3と同じである。

[0028] プロセッサ P1は、アドレス Xのリードを要求する（図 5 (a) )。キャッシュ動作コントローラ CCNT1のキャッシュヒット判定回路 CJ1は、アドレス Xがキャッシュヒットかキャッシュミスかを判定する。キャッシュメモリ C1は、アドレス Xのデータを格納していないので、キャッシュミスする。キャッシュ動作コントローラ CCNT1は、キャッシュ間接続コント口ーラ ICCNTを経由して、メインメモリ MMにアドレス Xのリードを要求する（図 5 (b) )。キャッシュ動作コントローラ CCNTO、 CCNT2の外部アクセス監視部 SO、 S2は、メインメモリ MMへのアドレス Xのリード要求を検出する（図 5 (c) )。キャッシュメモリ COは、アドレス Xのデータを格納しているので、外部アクセス監視部 SOは、キャッシュ動作コントローラ CCNTlからメインメモリ MMへのアドレス Xのリード要求を無効にする。メインメモリ MMへのアドレス Xのリード要求を無効にしたので、外部アクセス監視部 SO は、キャッシュ動作コントローラ CCNT0の送信制御部 SCNT0に、アドレス Xを含むキャッシュラインをキャッシュメモリ CO力キャッシュメモリ C1に転送する命令を発行する（図 5 (d) )。送信制御部 SCNT0は、キャッシュメモリ COからアドレス Xを含むキヤッシユラインを読み出す（図 5 (e) )。送信制御部 SCNT0は、読み出したキャッシュラインをキャッシュ間接続コントローラ ICCNTに送信する（図 5 (f) )。キャッシュ間接続コントローラ ICCNTは、受信したキャッシュラインをキャッシュ動作コントローラ CCNT 1の受信制御部 RCNT1に送信する（図 5 (g) )。受信制御部 RCNT1は、受信したキャッシユラインをキャッシュメモリ C1に格納する（図 5 (h) )。この後に、キャッシュメモリ C1は、アドレス Xのデータをプロセッサ P1に返送する（図 5 (i) )。このように、プロセッサ P1がアドレス Xのリードを要求してから、キャッシュメモリ C1にアドレス Xのデータを格納する。したがって、プロセッサ P1がアドレス Xのリードを要求したときのレイテンシは、大きくなる。また、外部アクセス監視部 S0、 S2は、メインメモリ MMに対するァクセスを常に監視しているので、バスのトラフィックは、増加する。

[0029] 図 6は、本発明の別の比較例を示している。比較例のマルチプロセッサシステムのキャッシュ動作コントローラ CCNT0、 CCNTl、 CCNT2は、キャッシュメモリ間のァクセスを監視する外部アクセス監視部 S0、 Sl、 S2を有している。この例では、キヤッシュメモリ C0、 Cl、 C2は、アドレス Xのデータを格納していない（図 4の初期状態と同じ )。この状態で、プロセッサ P1がアドレス Xのアクセスを要求した場合を示している。図中の矢印の意味は、図 3と同じである。

[0030] プロセッサ P1は、アドレス Xのリードを要求する（図 6 (a) )。キャッシュ動作コントローラ CCNT1のキャッシュヒット判定回路 CJ1は、アドレス Xがキャッシュヒットかキャッシュミスかを判定する。キャッシュメモリ C1は、アドレス Xのデータを格納していないので、キャッシュミスする。キャッシュ動作コントローラ CCNT1は、キャッシュ間接続コント口ーラ ICCNTを経由して、メインメモリ MMにアドレス Xのリードを要求する（図 6 (b) )。キャッシュ動作コントローラ CCNT0、 CCNT2の外部アクセス監視部 S0、 S2は、メインメモリ MMへのアドレス Xのリード要求を検出する（図 6 (c) )。し力し、キャッシュメモリ C0、 C2は、アドレス Xのデータを格納していないので、外部アクセス監視部 SO、 S2 は、キャッシュ動作コントローラ CCNT1、キャッシュ間接続コントローラ ICCNTおよびメインメモリ MMの動作に、割り込まない。キャッシュ間接続コントローラ ICCNTは、メインメモリ MM力読み出したアドレス Xを含むキャッシュラインをキャッシュ動作コントローラ CCNT1の受信制御部 RCNT1に送信する（図 6 (d) )。受信制御部 RCNT 1は、受信したキャッシュラインをキャッシュメモリ C1に格納する（図 6 (e) )。この後に、キャッシュメモリ C1は、アドレス Xのデータをプロセッサ P1に返送する（図 6 (f) )。図 5 の場合と同様に、プロセッサ P1がアドレス Xのリードを要求してから、キャッシュメモリ C1にアドレス Xのデータを格納する。したがって、プロセッサ P1がアドレス Xのリードを要求したときのレイテンシは、大きくなる。この場合も、外部アクセス監視部 SO、 S2 は、メインメモリ MMに対するアクセスを常に監視しているので、バスのトラフィックは、増加する。

[0031] 以上、本発明の実施形態では、プロセッサ P1がアドレス Xのアクセスを要求する前に、プロセッサ POは、キャッシュメモリ COに対して、アドレス Xを含むキャッシュラインをキャッシュメモリ COからキャッシュメモリ C1に転送する命令を発行できる。これによつて、プロセッサ P1がアドレス Xのアクセスを要求する前に、アドレス Xのデータは、キャッシュメモリ C1に格納される。したがって、プロセッサ P1がアドレス Xのアクセスを要求した後に、メインメモリ MMあるいは他のプロセッサのキャッシュメモリからデータを転送する従来方式に比べて、レイテンシを小さくできる。また、キャッシュメモリ間の通信は、命令の実行時のみ行われるので、キャッシュメモリ間のバスのトラフィックを軽減できる。

[0032] 上述した実施形態では、図 2のステップ S230でメインメモリ MMにアドレス Xのリードを要求する例について述べた。本発明は、かかる実施形態に限定されるものではない。例えば、図 7に示されるように、階層が下位のメモリとして、各プロセッサ PO、 P 1、 P2に共有されるキャッシュメモリ C3を設けてもよい。この場合、キャッシュ間接続コントローラ ICCNTは、メインメモリ MMより階層が上位のキャッシュメモリ C3にアドレス Xのリードをまず要求する。したがって、アドレス Xのデータがキャッシュメモリ C3に格納されている場合、メインメモリ MMにアクセスするより高速な動作が可能になる。この場合にも、プロセッサ P0のキャッシュラインを転送する命令によって、アドレス Xのデータは、キャッシュメモリ C1に格納される。したがって、プロセッサ P1がアドレスのアクセスを要求したとき、インメモリ MMあるいは他のプロセッサのキャッシュメモリからデータを転送する必要がないので、レイテンシを小さくできる。また、この転送の命令実行時のみキャッシュメモリ間で通信するので、キャッシュメモリ間のバスのトラフィックを軽減できる。

[0033] 以上、本発明について詳細に説明してきが、上記の実施形態およびその変形例は発明の一例に過ぎず、本発明はこれに限定されるものではない。本発明を逸脱しない範囲で変形可能であることは明らかである。

産業上の利用可能性

[0034] 本発明は、キャッシュメモリを持つマルチプロセッサシステムに適用できる。

Claims

請求の範囲

[1] 複数のプロセッサと、

前記プロセッサにそれぞれ対応するキャッシュメモリと、

前記プロセッサのいずれかが、そのプロセッサのキャッシュメモリに対して、転送命令を発行したことに応答して、転送するデータが含まれるキャッシュラインを他のプロセッサのキャッシュメモリに転送するキャッシュコントローラとを備え、

前記転送命令は、あるプロセッサのキャッシュメモリから他のプロセッサのキャッシュメモリにデータを転送する命令であることを特徴とするマルチプロセッサシステム。

[2] 請求項 1記載のマルチプロセッサシステムにお、て、

前記キャッシュコントローラは、前記転送命令の実行時に、データの転送元および転送先のキャッシュメモリの両方がキャッシュヒットする場合、転送先のキャッシュヒットしたキャッシュラインに転送元のキャッシュヒットしたキャッシュラインを上書きすることを特徴とするマルチプロセッサシステム。

[3] 請求項 1記載のマルチプロセッサシステムにお、て、

前記キャッシュコントローラを介して前記プロセッサに接続され、前記キャッシュメモリより階層が低い共有メモリを備え、

前記キャッシュコントローラは、前記転送命令の実行時に、データの転送元および転送先のキャッシュメモリの両方がキャッシュミスする場合、転送するデータが含まれるキャッシュラインのデータを前記共有メモリから読み出し、読み出したデータを転送先のキャッシュメモリに格納することを特徴とするマルチプロセッサシステム。

[4] 請求項 1記載のマルチプロセッサシステムにお、て、

前記キャッシュコントローラは、前記転送命令の実行時に、データの転送元のキヤッシュメモリがキャッシュヒットし、転送先のキャッシュメモリがキャッシュミスする場合、転送元のキヤシュヒットしたキャッシュラインを転送先のキャッシュメモリに格納することを特徴とするマルチプロセッサシステム。

[5] 請求項 1記載のマルチプロセッサシステムにお、て、

前記キャッシュコントローラは、前記転送命令の実行時に、データの転送元のキヤッシュメモリがキャッシュミスし、転送先のキャッシュメモリがキャッシュヒットする場合、転送元および転送先のキャッシュメモリの状態を変えることなく保持することを特徴とするマノレチプロセッサシステム。

[6] 請求項 1記載のマルチプロセッサシステムにお、て、

前記キャッシュコントローラは、前記転送命令に応答して、転送元のキャッシュメモリのデータをこのキャッシュメモリに残すことなく、転送先のキャッシュメモリに転送することを特徴とするマルチプロセッサシステム。

[7] 請求項 1記載のマルチプロセッサシステムにお、て、

前記キャッシュコントローラは、前記転送命令に応答して、転送元のキャッシュメモリのデータをこのキャッシュメモリに残した状態で、転送先のキャッシュメモリに転送することを特徴とするマルチプロセッサシステム。

[8] 複数のプロセッサと前記プロセッサにそれぞれ対応するキャッシュメモリとを備えたマルチプロセッサシステムの動作方法であって、

前記プロセッサのいずれかが、そのプロセッサのキャッシュメモリに対して、転送命令を発行したことに応答して、転送するデータが含まれるキャッシュラインを他のプロセッサのキャッシュメモリに転送し、

前記転送命令は、あるプロセッサのキャッシュメモリから他のプロセッサのキャッシュメモリにデータを転送する命令であることを特徴とするマルチプロセッサシステムの動作方法。

[9] 請求項 8記載のマルチプロセッサシステムの動作方法にぉヽて、

前記転送命令の実行時に、データの転送元および転送先のキャッシュメモリの両方がキャッシュヒットする場合、転送先のキャッシュヒットしたキャッシュラインに転送元のキャッシュヒットしたキャッシュラインを上書きすることを特徴とするマルチプロセッサシステムの動作方法。

[10] 請求項 8記載のマルチプロセッサシステムの動作方法にぉヽて、

前記プロセッサは、前記キャッシュメモリより階層が低い共有メモリを共有し、前記転送命令の実行時に、データの転送元および転送先のキャッシュメモリの両方がキャッシュミスする場合、転送するデータが含まれるキャッシュラインのデータを前記共有メモリから読み出し、読み出したデータを転送先のキャッシュメモリに格納することを特徴とするマルチプロセッサシステムの動作方法。

[11] 請求項 8記載のマルチプロセッサシステムの動作方法において、

前記転送命令の実行時に、データの転送元のキャッシュメモリがキャッシュヒットし、転送先のキャッシュメモリがキャッシュミスする場合、転送元のキヤシュヒットしたキヤッシュラインを転送先のキャッシュメモリに格納することを特徴とするマルチプロセッサシステムの動作方法。

[12] 請求項 8記載のマルチプロセッサシステムの動作方法にぉヽて、

前記転送命令の実行時に、データの転送元のキャッシュメモリがキャッシュミスし、転送先のキャッシュメモリがキャッシュヒットする場合、転送元および転送先のキヤッシュメモリの状態を変えることなく保持することを特徴とするマルチプロセッサシステムの動作方法。

[13] 請求項 8記載のマルチプロセッサシステムの動作方法にぉヽて、

前記転送命令に応答して、転送元のキャッシュメモリのデータをこのキャッシュメモリに残すことなく、転送先のキャッシュメモリに転送することを特徴とするマルチプロセッサシステムの動作方法。

[14] 請求項 8記載のマルチプロセッサシステムの動作方法にぉヽて、

前記転送命令に応答して、転送元のキャッシュメモリのデータをこのキャッシュメモリに残した状態で、転送先のキャッシュメモリに転送することを特徴とするマルチプロセッサシステムの動作方法。