WO2007105256A1

WO2007105256A1 - マルチプロセッサシステム、プロセッサ、およびキャッシュ制御方法

Info

Publication number: WO2007105256A1
Application number: PCT/JP2006/303439
Authority: WO
Inventors: Naohiro Kiyota
Original assignee: Fujitsu Limited
Priority date: 2006-02-24
Filing date: 2006-02-24
Publication date: 2007-09-20
Also published as: EP1988465B1; US20080320224A1; US7945754B2; EP1988465A4; JPWO2007105256A1; JP4335300B2; EP1988465A1

Abstract

　複数のキャッシュによるデータの取り合いを防止するとともに、キャッシュ間のデータ転送の遅延を抑制すること。ＭＩ要求アドレス保持部（１０５）は、Ｌ１キャッシュ（２００）へＭＩされるデータのＭＩ要求アドレスを保持する。カウンタ（１０６）は、ＭＩ要求アドレスが保持されると、カウンタ値が所定のしきい値に到達するまでカウントアップする。比較部（１０９）は、Ｌ２キャッシュ制御部（５００）からＭＯ要求アドレスが取得されると、このＭＯ要求アドレスをＭＩ要求アドレスと比較する。ＭＯ要求アドレスとＭＩ要求アドレスとが一致する場合、比較部（１０９）は、カウンタ（１０６）が稼働中であれば、ＭＯ要求生成部（１０７）へＭＯの中止を指示する。

Description

明細書

マルチプロセッサシステム、プロセッサ、およびキャッシュ制御方法技術分野

[0001] 本発明は、各々 1次キャッシュを備える複数のプロセッサと、複数のプロセッサによつて共有される 2次キャッシュとを有するマルチプロセッサシステムおよびキャッシュ制御方法に関し、特に、複数のキャッシュによるデータの取り合いを防止するとともに、キャッシュ間のデータ転送の遅延を抑制することができるマルチプロセッサシステム、プロセッサ、およびキャッシュ制御方法に関する。

背景技術

[0002] 一般に、情報処理装置においては、処理速度を向上させるため、使用頻度が高いデータをメインメモリとは別のキャッシュメモリに記憶することが行われる。キャッシュメモリは、メインメモリよりも容量は小さいが高速アクセスが可能であるため、使用頻度が高いデータを随時置き換えながらキャッシュメモリに記憶させておくことで、処理の高速ィ匕を図ることができる。

[0003] また、より処理の高速ィ匕を図るためには、階層的にキャッシュメモリを設け、処理が行われる際には、まず最も高速な 1次キャッシュ（以下「L1キャッシュ」という）にァクセスし、 L1キャッシュに所望のデータがなければ次に高速な 2次キャッシュ（以下「L2キャッシュ」 t 、う）にアクセスすると!/、うようにすれば良！、。

[0004] 一方、情報処理装置の処理性能を向上させるため、 1つの情報処理装置に複数のプロセッサが搭載されることがある。近年では、このようなマルチプロセッサシステムの一種として、 1チップ上に複数のプロセッサを実装するオンチップマルチプロセッサシステムが実現可能となって、る。

[0005] マルチプロセッサシステムが採用される場合、各プロセッサ内の L1キャッシュとは別に、各プロセッサが共有する L2キャッシュが設けられることがある（例えば特許文献 1 参照)。

[0006] 特許文献 1 :特開 2002— 373115号公報

発明の開示発明が解決しょうとする課題

[0007] 上述のようなマルチプロセッサシステムにおいて、各プロセッサ内の L1キャッシュにおいて同一データに関するキャッシュミスが同時に生じると、複数のプロセッサが共有する L2キャッシュに同時にアクセスし、データの取り合いが発生することがある。

[0008] 以下、図 4 1〜4 6を参照して、 L1キャッシュ # 1および L2キャッシュ # 2がデータ Aを取り合う状態について説明する。ここでは、各プロセッサ内の図示しない命令制御部など力 L1キャッシュ # 1および L1キャッシュ # 2のそれぞれへ、データ Aの書き換えを行う旨のストア要求が発行されたものとする。

[0009] 図 4 1に示すように、 L1キャッシュ # 1および L1キャッシュ # 2には、いずれもデータ Aが記憶されてヽな、ためキャッシュミスとなり、 L2キャッシュを制御する L2キヤッシュ制御部に対してデータ Aのムーブイン (Move In：以下「MI」と略記する）を要求する Ml要求が同時に行われる。

[0010] このとき、例えば L1キャッシュ # 1の優先度が高ければ、図 4 2に示すように、データ Aは L2キャッシュ制御部力も L1キャッシュ # 1へ転送される。また、 L1キャッシュ # 2から L2キャッシュ制御部へもデータ Aの Ml要求が行われていることから、データ Aが L1キャッシュ # 1へ転送されると同時に、このデータ Aを L1キャッシュ # 1からムーブアウト (Move Out：以下「MO」と略記する）させるための MO命令が発行される。

[0011] L1キャッシュ # 1では、データ Aのストア処理が完了していないが、 L2キャッシュ制御部からの MO命令に従って、図 4 3に示すように、データ Aの MOを要求する MO 要求を行い、 L2キャッシュ制御部へデータ Aを転送する。同時に、 L2キャッシュ制御部は、 L1キャッシュ # 2へデータ Aを転送する。

[0012] そして、データ Aが転送されていたはずの L1キャッシュ # 1では、データ Aのストア要求が再び発行される力データ Aは既に L1キャッシュ # 2へ転送されているため、 L1キャッシュ # 1では再度キャッシュミスが発生する。このため、図 4—4に示すように、 L1キャッシュ # 1から L2キャッシュ制御部へ Ml要求が行われ、 L2キャッシュ制御部から L1キャッシュ # 2へ MO命令が発行される。

[0013] L1キャッシュ # 2では、データ Aのストア処理が完了していないが、 L2キャッシュ制御部からの MO命令に従って、図 4 5に示すように、データ Aの MOを要求する MO 要求を行い、 L2キャッシュ制御部へデータ Aを転送する。同時に、 L2キャッシュ制御部は、 L1キャッシュ # 1へデータ Aを転送する。

[0014] そして、データ Aが転送されていたはずの L1キャッシュ # 2では、データ Aのストア要求が再び発行される力データ Aは既に L1キャッシュ # 1へ転送されているため、

L1キャッシュ # 2では再度キャッシュミスが発生する。このため、図 4— 6に示すように

、 L1キャッシュ # 2から L2キャッシュ制御部へ Ml要求が行われ、 L2キャッシュ制御部から L1キャッシュ # 1へ MO命令が発行される。

[0015] 以後、再び図 4 3の状態に戻り、 L1キャッシュ # 1を有するプロセッサおよび L1キャッシュ # 2を有するプロセッサの!/、ずれもデータ Aのストア処理を完了させることができない。

[0016] このような状態を防ぐため、一度 Ml要求されて L1キャッシュにデータが転送された後は、しばらく L1キャッシュにおける MOを禁止するという方法が考えられる。すなわち、例えば図 5に示すように、 Ml要求がパイプライン処理の優先権を獲得し、所定の Pサイクルの処理が完了すると、カウンタが所定サイクル（図 5では 31サイクル）のカウントアップを開始する。その後、 Ml要求に関しては、所定の Tサイクルの処理、 Mサイクルの処理、 Bサイクルの処理、および Rサイクルの処理が行われ、 L1キャッシュにデータが記憶される。

[0017] このとき、 Ml要求の直後に MO要求がパイプライン処理の優先権を獲得した場合、 MO要求に関しては、カウンタがカウントアップを実行している最中であるため、 Bサイクルで処理が中止される。したがって、カウンタがカウントアップを実行している間は、 L1キャッシュ力データが転送されることはなぐこの間にデータのストア処理を行うことが可能となる。

[0018] しかしながら、この方法においては、カウンタがカウントアップを実行している間の L 1キャッシュからのデータの転送が禁止されているため、ストア処理とは無関係のデータについても MOが実行されず、キャッシュ間のデータ転送の遅延が発生するという問題がある。

[0019] 本発明は力かる点に鑑みてなされたものであり、複数のキャッシュによるデータの取り合いを防止するとともに、キャッシュ間のデータ転送の遅延を抑制することができるマルチプロセッサシステム、プロセッサ、およびキャッシュ制御方法を提供することを目的とする。

課題を解決するための手段

[0020] 上記課題を解決するために、本発明は、各々 1次キャッシュを備える複数のプロセッサと、前記複数のプロセッサによって共有される 2次キャッシュとを有するマルチプ口セッサシステムであって、前記プロセッサは、自プロセッサ内の 1次キャッシュからデータを読み出す読出手段と、前記 1次キャッシュに読み出し対象のデータが記憶されて、な、場合に前記 1次キャッシュへの当該データの書き込みを外部に要求する要求手段と、前記要求手段による書き込み要求後の経過時間を計測する計測手段と、前記 1次キャッシュのデータを読み出す旨の読出命令を外部から受け付ける受付手段と、前記受付手段によって読出命令が受け付けられたデータを特定する特定情報と前記要求手段によって書き込みが要求されたデータを特定する特定情報とを比較する比較手段と、前記比較手段による比較の結果、特定情報が同一であり、かつ、前記計測手段によって計測される経過時間が所定時間未満の場合に、前記読出手段による前記読出命令に応じたデータの読み出しを中止させる制御手段とを有することを特徴とする。

[0021] また、本発明は、上記発明において、前記制御手段は、前記比較手段による比較の結果、特定情報が同一でない場合に、前記読出命令に応じたデータの読み出しを前記読出手段に対して要求する読出要求を生成する生成手段を含むことを特徴とする。

[0022] また、本発明は、上記発明において、前記生成手段は、前記比較手段による比較の結果、特定情報が同一であっても、前記計測手段によって計測される経過時間が所定時間以上の場合に、前記読出命令に応じたデータの読出要求を生成することを特徴とする。

[0023] また、本発明は、上記発明において、前記制御手段は、前記計測手段によって計測される経過時間が所定時間に達した場合に、読み出しを中止させたデータの読み出しを前記読出手段に行わせることを特徴とする。

[0024] また、本発明は、上記発明において、前記比較手段は、データのメインメモリにおけるアドレスを特定情報として比較することを特徴とする。

[0025] また、本発明は、上記発明において、データに対応するアドレスの一部および前記 1次キャッシュにおけるウェイを特定情報として比較することを特徴とする。

[0026] また、本発明は、上記発明において、前記計測手段は、前記書込手段による書き込み要求に応じてデータが書き込まれて力の経過時間を計測することを特徴とする。

[0027] また、本発明は、データを記憶するキャッシュを備えたプロセッサであって、前記キャッシュにデータを書き込む書込手段と、前記書込手段によって前記キャッシュにデータが書き込まれてからの経過時間を計測する計測手段と、前記キャッシュのデータを読み出す旨の読出命令を外部力受け付ける受付手段と、前記受付手段によって読出命令が受け付けられたデータを特定する特定情報と前記書込手段によって書き込まれたデータを特定する特定情報とを比較する比較手段と、前記比較手段による比較の結果、特定情報が同一であり、かつ、前記計測手段によって計測される経過時間が所定時間未満の場合に、前記読出命令に応じたデータの読み出しを中止する読出制御手段とを有することを特徴とする。

[0028] また、本発明は、各々 1次キャッシュを備える複数のプロセッサと、前記複数のプロセッサによって共有される 2次キャッシュとを有するマルチプロセッサシステムにおけるキャッシュ制御方法であって、前記 1次キャッシュに読み出し対象のデータが記憶されていない場合に前記 1次キャッシュへの当該データの書き込みを外部に要求する要求工程と、前記要求工程における書き込み要求後、経過時間の計測を開始する計測工程と、前記 1次キャッシュのデータを読み出す旨の読出命令を外部力受け付ける受付工程と、前記受付工程にて読出命令が受け付けられたデータを特定する特定情報と前記要求工程にて書き込みが要求されたデータを特定する特定情報とを比較する比較工程と、前記比較工程における比較の結果、特定情報が同一であり、かつ、前記計測工程力の経過時間が所定時間未満の場合に、前記読出命令に応じたデータの読み出しを中止させる制御工程とを有することを特徴とする。発明の効果

[0029] 本発明によれば、 1次キャッシュに読み出し対象のデータが記憶されていない場合に 1次キャッシュへの当該データの書き込みを外部に要求し、書き込み要求後の経過時間を計測し、 1次キャッシュのデータを読み出す旨の読出命令を外部から受け付け、読出命令が受け付けられたデータを特定する特定情報と書き込みを要求したデータを特定する特定情報とを比較し、比較の結果、特定情報が同一であり、かつ、計測される経過時間が所定時間未満の場合に、読出命令に応じたデータの読み出しを中止させる。このため、 1次キャッシュに書き込まれたば力りのデータが読み出されることがなぐこのデータに対する処理のための時間を確保することができ、複数のキャッシュによるデータの取り合いを防止するとともに、書き込まれたば力りのデータ以外のデータは通常通り読み出して、キャッシュ間のデータ転送の遅延を抑制することがでさる。

[0030] また、本発明によれば、比較の結果、特定情報が同一でない場合に、読出命令に応じたデータの読み出しを要求する読出要求を生成するため、書き込まれたばかりのデータと一致しないデータは、読出命令が受け付けられた後すぐに 1次キャッシュ力読み出すことができる。

[0031] また、本発明によれば、比較の結果、特定情報が同一であっても、計測される経過時間が所定時間以上の場合に、読出命令に応じたデータの読出要求を生成するため、直近に書き込まれたデータであっても、書き込まれて力も処理に要する時間が経過していれば、読出命令が受け付けられた後すぐに 1次キャッシュ力も読み出すことになり、データ転送の遅延をさらに抑制することができる。

[0032] また、本発明によれば、計測される経過時間が所定時間に達した場合に、読み出しを中止させたデータの読み出しを行わせるため、 1次キャッシュからの読み出しがー度中止されたデータについても、データ転送の遅延を最低限に抑制することができる

[0033] また、本発明によれば、データのメインメモリにおけるアドレスを特定情報として比較するため、データの一致 ·不一致を確実に判定することができる。

[0034] また、本発明によれば、データに対応するアドレスの一部および前記 1次キャッシュにおけるウェイを特定情報として比較するため、キャッシュがセットァソシァティブ方式で構成される場合にも、データの一致 ·不一致を確実に判定することができる。 [0035] また、本発明によれば、書き込み要求に応じてデータが書き込まれて力の経過時間を計測するため、 1次キャッシュに確実にデータが書き込まれて力処理に要する時間を確保することができる。

[0036] また、本発明によれば、キャッシュにデータを書き込み、キャッシュにデータが書き込まれてからの経過時間を計測し、キャッシュのデータを読み出す旨の読出命令を外部力も受け付け、読出命令が受け付けられたデータを特定する特定情報と書き込まれたデータを特定する特定情報とを比較し、比較の結果、特定情報が同一であり、かつ、計測される経過時間が所定時間未満の場合に、読出命令に応じたデータの読み出しを中止する。このため、キャッシュに書き込まれたば力りのデータが読み出されることがなぐこのデータに対する処理のための時間を確保することができ、複数のキャッシュによるデータの取り合いを防止するとともに、書き込まれたば力りのデータ以外のデータは通常通り読み出して、キャッシュ間のデータ転送の遅延を抑制することがでさる。

図面の簡単な説明

[0037] [図 1]図 1は、本発明の一実施の形態に係るマルチプロセッサシステムの要部構成を示すブロック図である。

[図 2]図 2は、一実施の形態に係る L1キャッシュ制御部の内部構成を示すブロック図である。

[図 3]図 3は、一実施の形態に係る L1キャッシュ制御部の動作を示すフロー図である

[図 4-1]図 4 1は、ストア処理時のキャッシュの状態を示す図である。

[図 4-2]図 4 2は、図 4 1に続く図である。

[図 4-3]図 4— 3は、図 4— 2に続く図である。

[図 ₄-₄]図 4 4は、図 4 3に続く図である。

[図 4-5]図 4— 5は、図 4— 4に続く図である。

[図 4-6]図 4 6は、図 4 5に続く図である。

[図 5]図 5は、パイプライン処理の処理サイクルの一例を示す図である。

符号の説明 [0038] 100 LIキャッシュ制御部

101 書込 Z読出部

102 Ml要求生成部

103 接続部

104 Mlデータ送出部

105 Ml要求アドレス保持部

106 カウンタ

107 MO要求生成部

108 MO要求アドレス取得部

109 比較部

110 MOデータ送出部

200 L1キャッシュ

300 命令制御部

400 演算処理部

500 L2キャッシュ制御部

600 L2キャッシュ

700 メインメモリ

発明を実施するための最良の形態

[0039] 以下、本発明の一実施の形態について、図面を参照して詳細に説明する。なお、以下においては、情報処理装置がプロセッサとして CPUを 2つ備えている場合を例に挙げて説明する力本発明は、プロセッサを 3つ以上備えている場合にも適用することができる。

[0040] 図 1は、本発明の一実施の形態に係るマルチプロセッサシステムの要部構成を示すブロック図である。同図に示すマルチプロセッサシステムは CPUを 2つ備え、各 CP Uは、 L1キャッシュ制御部 100、 L1キャッシュ 200、命令制御部 300、および演算処理部 400を有している。また、各 CPUの L1キャッシュ制御部 100には、 L2キャッシュ制御部 500が接続されており、 L2キャッシュ制御部 500は L2キャッシュ 600に、 L2 キャッシュ 600はメインメモリ 700にそれぞれ接続されて、る。 [0041] LIキャッシュ制御部 100は、命令制御部 300および L2キャッシュ制御部 500からの要求'命令に応じて、 L1キャッシュにおけるデータのムーブイン（Ml)およびムーブアウト（MO)を制御する。また、本実施の形態においては、 L1キャッシュ制御部 100 は、 Ml要求するデータのアドレスを保持しておき、 L2キャッシュ制御部 500から MO 命令が発行された場合、 MOするデータのアドレスと保持されたアドレスとを比較し、 Ml要求から一定期間内はアドレスが一致する場合の MOを中止する。 L1キャッシュ制御部 100の具体的な構成 ·動作については、後に詳述する。

[0042] L1キャッシュ 200は、高速なキャッシュメモリであって、 L1キャッシュ制御部 100の制御に従って、 Mlされるデータを記憶し、 MOされるデータを出力する。命令制御部 300は、演算処理部 400における演算処理に応じてデータの書き込みおよび読み出しに関する命令を出し、必要なデータを L1キャッシュ 200、 L2キャッシュ 600、またはメインメモリ 700から取得する。演算処理部 400は、命令制御部 300によって取得されたデータに対する演算処理を行う。

[0043] L2キャッシュ制御部 500は、 L1キャッシュ制御部 100からデータの Ml要求が発行された場合、このデータが記憶されて、る L2キャッシュ 600または他の CPUの L1キャッシュ 200を制御する L1キャッシュ制御部 100へデータの MO命令を発行する。 L 2キャッシュ 600は、 L1キャッシュ 200よりも大容量かつ低速なキャッシュメモリであり、 2つの CPUによって共有されている。メインメモリ 700は、主記憶装置であって、 L2 キャッシュ 600よりも大容量かつ低速な記憶装置である。

[0044] 図 2は、本実施の形態に係る L1キャッシュ制御部 100の内部構成を示すブロック図である。同図に示すように、 L1キャッシュ制御部 100は、書込 Z読出部 101、 Ml要求生成部 102、接続部 103、 Mlデータ送出部 104、 Ml要求アドレス保持部 105、力ゥンタ 106、 MO要求生成部 107、 MO要求アドレス取得部 108、比較部 109、および MOデータ送出部 110を有して!/、る。

[0045] 書込 Z読出部 101は、命令制御部 300から例えばデータのストア要求などの命令が出されると L1キャッシュ 200を検索し、対象のデータが L1キャッシュ 200内に記憶されていれば (キャッシュヒット）、このデータを読み出して命令制御部 300へ出力し、対象のデータが L1キャッシュ 200内に記憶されていなければ（キャッシュミス）、その旨を MI要求生成部 102へ通知する。そして、書込 Z読出部 101は、 Mlデータ送出部 104から送出される Mlすべき Mlデータを L1キャッシュ 200へ書き込む。また、書込 Z読出部 101は、 MO要求生成部 107からデータの MO要求が出力されると、 L1 キャッシュ 200から対象のデータを読み出し、 MOデータ送出部 110へ出力する。

[0046] Ml要求生成部 102は、書込 Z読出部 101からキャッシュミスが生じた旨が通知されると、このデータ L1キャッシュ 200に Mlするために、データのアドレスを含む Ml要求を生成し、接続部 103および Ml要求アドレス保持部 105へ出力する。

[0047] 接続部 103は、 L1キャッシュ制御部 100と L2キャッシュ制御部 500とを接続しており、 Ml要求生成部 102から出力される Ml要求を L2キャッシュ制御部 500へ転送し、この Ml要求に応じて Mlすべき Mlデータ力キャッシュ制御部 500から転送されると、この Mlデータを Mlデータ送出部 104へ出力する。また、接続部 103は、 L2キヤッシュ制御部 500によって L1キャッシュ 200からのデータの MO命令が発行されると、その旨を MO要求生成部 107へ通知し、 MOデータ送出部 110から送出される M Oされた MOデータを L2キャッシュ制御部 500へ転送する。

[0048] Mlデータ送出部 104は、 Ml要求に応じて L2キャッシュ 600また他の CPUの L1キャッシュ 200などから転送された Mlデータを L1キャッシュ 200へ Mlするために、 Ml データを MI要求とともに書込 Z読出部 101へ送出する。

[0049] Ml要求アドレス保持部 105は、キャッシュミスが生じた場合に、 Ml要求生成部 102 によって Ml要求が生成されると、生成された Ml要求に含まれるデータのアドレス（M I要求アドレス）を保持し、 Ml要求アドレスが保持されるとカウンタ 106へ始動を指示する。すなわち、 Ml要求アドレス保持部 105は、 L1キャッシュ 200へ Mlされるデータのアドレスを保持するとともに、カウンタ 106のカウントアップを開始させる。

[0050] カウンタ 106は、 Ml要求アドレス保持部 105から始動を指示されると、カウントアツプを開始し、カウンタ値が所定のしきい値に到達するとカウンタ値を 0にリセットする。また、カウンタ 106は、始動のタイミングとリセットのタイミングとを比較部 109へ通知する。

[0051] MO要求生成部 107は、接続部 103に MO命令が到達すると、 MOを要求されているデータのアドレス（MO要求アドレス）を MO要求アドレス取得部 108へ出力する。そして、 MO要求生成部 107は、比較部 109から MOの実行が指示された場合は、 MO要求アドレスを含む MO要求を生成し、書込 Z読出部 101へ出力する。一方、比較部 109から MOの中止が指示された場合は、 MO要求アドレスを一時的に保持し、一定時間が経過して比較部 109から MOの実行が許可されると、保持された MO 要求アドレスを含む MO要求を生成し、書込 Z読出部 101へ出力する。

[0052] MO要求アドレス取得部 108は、 L2キャッシュ制御部 500によって MO命令が発行された場合に、 MO要求生成部 107から MO命令に含まれている MO要求アドレスを取得して保持する。

[0053] 比較部 109は、 MO要求アドレス取得部 108によって MO要求アドレスが取得されると、この MO要求アドレスを Ml要求アドレス保持部 105によって保持されている Ml 要求アドレスと比較する。そして、比較部 109は、 MO要求アドレスと Ml要求アドレスとが一致しな、場合は、 MOが要求されて、るデータに対するストア処理などが予定されて!/ヽなヽと判断し、 MO要求生成部 107へ MOの実行を指示する。

[0054] 一方、 MO要求アドレスと Ml要求アドレスとが一致する場合、比較部 109は、さらにカウンタ 106がリセットされておらず稼働中である力否力判定する。そして、比較部 10 9は、カウンタ 106が稼働中であれば、 Ml要求が発行されてからの経過時間が短いため、このアドレスのデータに対するストア処理などが予定されていると判断し、 MO 要求生成部 107へ MOの中止を指示する。また、カウンタ 106がリセットされており力ゥンタ値力^であれば、比較部 109は、 Ml要求が発行されてから十分時間が経過しており、このアドレスのデータに対するストア処理などが完了していると判断し、 MO 要求生成部 107へ MOの実行を指示する。

[0055] また、比較部 109は、 MO要求生成部 107へ MOの中止を指示した場合、カウンタ 106からカウンタ値のリセットのタイミングが通知されると、中止していた MOの実行を許可する。

[0056] MOデータ送出部 110は、 MO要求に応じて L1キャッシュ 200から読み出された M Oデータを L2キャッシュ制御部 500へ出力するために、接続部 103へ送出する。

[0057] 次、で、ストア要求が発行された場合の、上記のように構成された L1キャッシュ制御部 100の動作について、図 3に示すフロー図を参照しながら説明する。 [0058] まず、命令制御部 300によってデータの書き換えを要求するストア要求が発行される (ステップ S101)。発行されたストア要求は、 L1キャッシュ制御部 100の書込 Z読出部 101によって受け取られ、書込 Z読出部 101によって、ストア対象のデータが L 1キャッシュ 200から検索される（ステップ S102)。検索の結果、 L1キャッシュ 200にデータが記憶されておりキャッシュヒットすれば (ステップ S102No)、このデータが L1 キャッシュ 200から読み出され、命令制御部 300へ出力されて、演算処理部 400によるストア処理が実行される (ステップ S 107)。

[0059] 一方、検索の結果、 L1キャッシュ 200にデータが記憶されておらずキャッシュミスすれば (ステップ S102Yes)、書込 Z読出部 101から Ml要求生成部 102へその旨が通知され、 Ml要求生成部 102によってストア対象のデータのアドレスを含む Ml要求が生成される（ステップ S103)。生成された MI要求は、 Ml要求アドレス保持部 105 へ出力され、 Ml要求アドレス保持部 105によって、 Ml要求アドレス（すなわち、ストア対象のデータのアドレス）が保持されるとともに、カウンタ 106の始動が指示される (ステツプ S 104)。

[0060] また、 Ml要求生成部 102によって生成された Ml要求は、接続部 103経由で L2キャッシュ制御部 500へ伝達され、 L2キャッシュ制御部 500力キャッシュ 600または他の CPUの L1キャッシュ 200から Ml要求アドレスのデータを取得し、 L1キャッシュ制御部 100へ転送する。このデータは、 L1キャッシュ 200に Mlすべき Mlデータとして、 Mlデータ送出部 104から Ml要求とともに書込 Z読出部 101へ出力され、書込 Z読出部 101によって L1キャッシュ 200に書き込まれる（ステップ S105)。

[0061] その後、 L1キャッシュ制御部 100では、 L2キャッシュ制御部 500からの MO命令が随時受け付けられており（ステップ S 106)、接続部 103に MO命令が到達しない場合は（ステップ S106No)、 L1キャッシュ 200におけるキャッシュミスに応じて Mlされたデータのストア処理が行われる（ステップ S 107)。また、接続部 103に MO命令が到達した場合は (ステップ S106Yes)、 MO要求生成部 107によって、 MO命令に含まれる MO要求アドレスが MO要求アドレス取得部 108へ出力される。

[0062] そして、 MO要求アドレス取得部 108によって MO要求アドレスが取得されると、比較部 109によって、 MO要求アドレスと Ml要求アドレス保持部 105によって保持されている MI要求アドレスとが一致するか否か比較される（ステップ S 108)。ここで、比較されたアドレスが一致するということは、今回ストア処理のために L1キャッシュ 200に Mlされたデータに対する MOが要求されていることを意味している。また、比較されたアドレスが一致しないということは、今回ストア処理のために L1キャッシュ 200に Ml されたデータ以外のデータに対する MOが要求されていることを意味している。

[0063] そこで、 MO要求アドレスと Ml要求アドレスとがー致していなければ、比較部 109によって MOの実行が MO要求生成部 107へ指示され、 MO要求生成部 107によって MO要求アドレスを含む MO要求が生成され、書込 Z読出部 101へ出力される。そして、書込 Z読出部 101によって MO要求アドレスのデータが L1キャッシュ 200から読み出され、 MOデータ送出部 110および接続部 103を介して L2キャッシュ制御部 50 0へ出力され、データの MOが実行される（ステップ S112)。

[0064] また、 MO要求アドレスと Ml要求アドレスとがー致していれば、比較部 109によって、カウンタ 106が稼働中であるか否力、換言すれば、カウンタ値が 0であるか否かが判定される（ステップ S109)。ここで、カウンタ 106が稼働中ではなくカウンタ値が 0であれば (ステップ S109Yes)、今回ストア処理のために L1キャッシュ 200に MIされたデータについて、 Mlされてから十分な時間が経過しているためストア処理が完了していると判断され、比較部 109によって MOの実行が MO要求生成部 107へ指示される。

[0065] 反対に、カウンタ 106が稼働中でカウンタ値が 0でなければ (ステップ S109No)、今回ストア処理のために L1キャッシュ 200に Mlされたデータについて、 Mlされてからまだ十分な時間が経過していないと判断され、比較部 109によって MOの中止が MO要求生成部 107へ指示される。そして、 MO要求生成部 107によって、 MO要求アドレス力 MO要求が生成されることなぐ MOは中止される（ステップ S 110)。また、このとき、 MO要求アドレスは、 MO要求生成部 107によって一時的に保持される。

[0066] そして、 MOが中止されるため、 L1キャッシュ 200に Mlされたばかりのデータが M Oされることはなぐこの間に命令制御部 300からのストア要求に従ったストア処理が実行される (ステップ S111)。その後、カウンタ 106がカウンタ値を所定のしきい値までカウントアップして 0にリセットすると、その旨が比較部 109へ通知される。そして、比較部 109は、カウンタ値が 0になったことから（ステップ S109Yes)、 MO要求生成部 107へ中止した MOの実行を指示する。

[0067] MOの実行を指示された MO要求生成部 107は、保持していた MO要求アドレスから MO要求を生成して書込 Z読出部 101へ出力し、 L1キャッシュ 200からデータが読み出されて MOが実行される (ステップ S 112)。

[0068] 以上のように、本実施の形態によれば、 L1キャッシュへの Mlが要求された後にデータの MOが要求された場合、 MOが要求されて!、るデータのアドレスと直近に Mlが要求されたデータのアドレスとを比較し、アドレスが一致しており、かつ、 Mlが要求されてから一定期間が経過していなければ、データの MOを中止する。このため、キヤッシュに Mlされたば力りのデータは MOすることなぐその他のデータは MOすることになり、複数のキャッシュによるデータの取り合いを防止するとともに、キャッシュ間のデータ転送の遅延を抑制することができる。

[0069] なお、上記一実施の形態において、キャッシュが例えばセットァソシァティブ方式で構成される場合には、 Ml要求アドレスと MO要求アドレスの比較と同時に、 Mlするデータのウェイと MOが要求されるデータのウェイとを比較するようにしても良い。ウェイについての比較を行う場合、アドレスおよびウェイが一致し、かつ、 Mlが要求されて力も一定期間が経過していなければ、データの MOを中止する。このとき、セットァソシァティブ方式であれば、アドレスの比較は、アドレスの一部であるインデックス部分のみについて行えば十分であるため、アドレス全体を比較する場合に比べて回路規模を縮小することができる。

[0070] また、上記一実施の形態においては、 Ml要求アドレスが保持されるとカウンタが始動するものとした力カウンタ始動のタイミングは、 Ml要求に応じてデータが Mlされたタイミングとしても良い。こうすることにより、 Ml要求後、すぐにデータの Mlが行われなヽ場合でも、確実にストア処理に要する時間を確保することができる。

産業上の利用可能性

[0071] 本発明は、複数のキャッシュによるデータの取り合いを防止するとともに、キャッシュ間のデータ転送の遅延を抑制する場合に適用することができる。

Claims

請求の範囲

[1] 各々 1次キャッシュを備える複数のプロセッサと、前記複数のプロセッサによって共有される 2次キャッシュとを有するマルチプロセッサシステムであって、

前記プロセッサは、

自プロセッサ内の 1次キャッシュ力データを読み出す読出手段と、

前記 1次キャッシュに読み出し対象のデータが記憶されていない場合に前記 1次キャッシュへの当該データの書き込みを外部に要求する要求手段と、

前記要求手段による書き込み要求後の経過時間を計測する計測手段と、前記 1次キャッシュのデータを読み出す旨の読出命令を外部力受け付ける受付手段と、

前記受付手段によって読出命令が受け付けられたデータを特定する特定情報と前記要求手段によって書き込みが要求されたデータを特定する特定情報とを比較する比較手段と、

前記比較手段による比較の結果、特定情報が同一であり、かつ、前記計測手段によって計測される経過時間が所定時間未満の場合に、前記読出手段による前記読出命令に応じたデータの読み出しを中止させる制御手段と

を有することを特徴とするマルチプロセッサシステム。

[2] 前記制御手段は、

前記比較手段による比較の結果、特定情報が同一でない場合に、前記読出命令に応じたデータの読み出しを前記読出手段に対して要求する読出要求を生成する生成手段を含むことを特徴とする請求項 1記載のマルチプロセッサシステム。

[3] 前記生成手段は、

前記比較手段による比較の結果、特定情報が同一であっても、前記計測手段によつて計測される経過時間が所定時間以上の場合に、前記読出命令に応じたデータの読出要求を生成することを特徴とする請求項 2記載のマルチプロセッサシステム。

[4] 前記制御手段は、

前記計測手段によって計測される経過時間が所定時間に達した場合に、読み出しを中止させたデータの読み出しを前記読出手段に行わせることを特徴とする請求項 1記載のマルチプロセッサシステム。

[5] 前記比較手段は、

データのメインメモリにおけるアドレスを特定情報として比較することを特徴とする請求項 1記載のマルチプロセッサシステム。

[6] 前記比較手段は、

データに対応するアドレスの一部および前記 1次キャッシュにおけるウェイを特定情報として比較することを特徴とする請求項 1記載のマルチプロセッサシステム。

[7] 前記計測手段は、

前記書込手段による書き込み要求に応じてデータが書き込まれてからの経過時間を計測することを特徴とする請求項 1記載のマルチプロセッサシステム。

[8] データを記憶するキャッシュを備えたプロセッサであって、

前記キャッシュにデータを書き込む書込手段と、

前記書込手段によって前記キャッシュにデータが書き込まれてからの経過時間を計測する計測手段と、

前記キャッシュのデータを読み出す旨の読出命令を外部力受け付ける受付手段と、

前記受付手段によって読出命令が受け付けられたデータを特定する特定情報と前記書込手段によって書き込まれたデータを特定する特定情報とを比較する比較手段と、

前記比較手段による比較の結果、特定情報が同一であり、かつ、前記計測手段によって計測される経過時間が所定時間未満の場合に、前記読出命令に応じたデータの読み出しを中止する読出制御手段と

を有することを特徴とするプロセッサ。

[9] 各々 1次キャッシュを備える複数のプロセッサと、前記複数のプロセッサによって共有される 2次キャッシュとを有するマルチプロセッサシステムにおけるキャッシュ制御方法であって、

前記 1次キャッシュに読み出し対象のデータが記憶されていない場合に前記 1次キャッシュへの当該データの書き込みを外部に要求する要求工程と、前記要求工程における書き込み要求後、経過時間の計測を開始する計測工程と、前記 1次キャッシュのデータを読み出す旨の読出命令を外部力受け付ける受付工程と、

前記受付工程にて読出命令が受け付けられたデータを特定する特定情報と前記要求工程にて書き込みが要求されたデータを特定する特定情報とを比較する比較工程と、

前記比較工程における比較の結果、特定情報が同一であり、かつ、前記計測工程からの経過時間が所定時間未満の場合に、前記読出命令に応じたデータの読み出しを中止させる制御工程と

を有することを特徴とするキャッシュ制御方法。