WO2004107180A1

WO2004107180A1 - マルチプロセッサシステム

Info

Publication number: WO2004107180A1
Application number: PCT/JP2003/006868
Authority: WO
Inventors: Takeshi Shimada; Tatsuru Nakagaki; Akihiro Kobayashi
Original assignee: Fujitsu Limited
Priority date: 2003-05-30
Filing date: 2003-05-30
Publication date: 2004-12-09
Also published as: US20060075197A1; JPWO2004107180A1; JP3764893B2; US7320056B2

Abstract

共有メモリにデータを書き込む際のデータの送信を、各プロセッサと共有メモリとの間に設けられる高速の専用回線を使って行う。各プロセッサは、共有メモリの共有メモリ空間に書き込みを行う場合には、従来のグローバルバスに対応する更新通知バスに、いずれのアドレスへの更新をするかを通知する。この通知を検出した他のプロセッサは、共有メモリキャッシュ内のそのアドレスへのアクセスを禁止し、当該アドレスへの書き込みデータが専用回線を使って送られてくるのを待つ。データが送られてくると、共有メモリキャッシュの対応アドレスにデータを書き込む。このとき、共有メモリの対応するアドレスにも当該データが書き込まれ、キャッシュコヒーレンシが保たれる。また、書き込みアドレスを送信するには、バスの使用権取得が必要であるが、データの送信は専用回線を使うので、バスの使用権獲得のための時間が大きく削減される。

Description

明細書マ/レチプロセッサシステム技術分野

本発明は、複数のプロセッサを結合し、それらプロセッサに共有される共有メモリ空間を配置する共有メモリ型マルチプロセッサシステムで、特に共有メモリ空間のデータをキヤッシュする共有メモリキヤッシュが具備されたプロセッサにより構成されるシステムに関する。ソフトウエアの処理は各プロセッサにより分担されて行われ、共有メモリはプロセッサ間で処理を引き継ぐ際のデータの受け渡しゃプロセッサ単体ではなくシステム単位で管理すベき情報を格納する場所などとして使われる。共有メモリキャッシュは、共有メモリへのァクセスを高速化してシステム性能を向上するために導入される。背景技術

図 1は、最も簡単な共有メモリ型マルチプロセッサシステムの従来例を示す図である。

複数のプロセッサと共有メモリが同一のグローバ ^レバスで接続され、各プロセッサは、このグローバルパスを経由して、共有メモリにアクセスする。各プ口セッサ（1 a— 1 ) 〜（1 a— n ) は、アービタ（l b ) に対してバス要求信号（1 c— 1 ) 〜（1 c一 n ) を送出し、アービタにより使用権が調停され、同時間に 1つのプロセッサのみにグローバルバス（ 1 e )の使用権が与えられ、そのプロセッサに対してバス許可信号（I d— 1 ) 〜（I d— n ) が送出される。バス許可信号を受けたプロセッサは、グローバルバス経由で共有メモリ（1 f ) にアクセスし、所望のデータ収受を行う。図 1の実現方式においては、共有メモリ空間へのアクセスはリード、ライトの種別を問わず、そのすべてがグローバルバスを経由することとなる。

ここに以下の 2つの制約がある。

制約 1 ：信号伝送に時間を要する（物理的制約）

制約 2 _: バス使用権の順番待ち時間を要する（原理的制約）

前者は、グローバルバスにおいて信号伝送距離が長くなることや、複数のプ口セッサが同一の信号線を共有することなどの電気的条件により、高速な信号伝送が困難となることに起因する。後者は、 2つ以上のプロセッサが共有メモリに対して同時間にアクセスを行つた場合、 2つ目以降のプロセッサがグロ一バルバス使用権の調停により共有メモリに対するアクセスを待たされる時間が発生することに起因する。結果とじて、これらの制約は共有メモリ空間へのァクセスに以下の問題を発生させる。

問題 1 ：帯域（システムに許容される時間あたりのアクセス回数）の不足

問題 2 ：レイテンシ（アクセス開始から完了までにかかる時間）の過大図 2は、各プロセッサ上に共有メモリキャッシュ（2 h ) を配置した従来例を示す図である。

プロセッサコア（2 g ) が共有メモリ空間をリードした場合、共有メモリキャッシュ上に共有メモリ空間のデータのコピーがあれば、リ一ド処理を内部バス（2 i ) を通じてプロセッサの上で完結でき、前記の制約 1を軽減できる。また、グローバルバス経由のアクセスとならないため、グローバルバスの使用権調停が不要となり、前記の制約 2から解放される。この点で、共有メモリキャッシュの導入は前記問題に対する改善策となる。

共有メモリキャッシュの導入により各プロセッサが共有メモリ空間のデータのコピーを個別に保持し得ることになるが、共有メモリ空間上のデータは、全てのプロセッサにとって同じように見えなければならない。したがって、データ更新の契機となるライト処理に関しては、このことを保証するコヒーレンシ制御の考慮が必須となる。理由は後述するが、このコヒーレンシ制御も前記問題を解決する上での障壁となる。

ここで、コヒーレンシ制御上の要件を、以下の 3点に細分する。

要件 1 ：時間的な同期

要件 2 ：空間的な同期

要件 3 ：更新時間の短縮

図 3は、コヒーレンシ制御について説明する図である。

図 3は、上記の要件の意味を説明するもので、共有メモリ空間上のあるアドレスのデータが値 0であったとき、該ァドレスにプロセッサ 1が値 1をライトし、その後プロセッサ 2が値 2をライトし、他のプロセッサ 3〜nが該ァドレスをリードした場合を想定したものである。ここで、要件 1は、個々のプロセッサ上で、たとえば、値 2→値 1の順にリードしてしまう可能性を排除することに相当し（1^ 0の保証）、また要件 2は、たとえばすでに値 1をリードしたプロセッサがいるのに、その後に値 0をリードするプロセッサが発生してしまう可能性を排除することに相当する（t ₂ 0の保証)。また、要件 3はデータ更新があった時点から、他のプロセッサが依然として更新前のデータをリードしてしまう時間と、更新後のデータを読み出せるようになるまでの時間を、共に可能な限り短くすることに相当する（t ₂および t ₃の最小化）。要件 3はコヒ一レンシ制御上の必須要件とはならないが、システム性能を向上するために必要となる。

図 2におけるコヒーレンシ制御の例としては、共有メモリ空間に対するプロセッサのライト処理毎に、それを自身の共有メモリキャッシュに反映すると同時にグローバルバス経由で共有メモリにライトし、一方他のプロセッサはグロ一バルバスに現れるライトアクセスを監視して、該アドレスのデータが各々の共有メモリキヤッシュ上にある場合、そのデータをグ口ーバルバス上のデータで置換する方法が挙げられる。

図 4は、キャッシュコヒーレンシの確立の仕方の例を説明する図である。図 4は、上記方法に基づいた処理シーケンスの例である。図中、（4 a)〜（4 f ) のタイミングはそれぞれ以下の事象に対応する。

(4 a) :プロセッサコアがライトアクセスを起動

(4 b) ：ライトアクセス起動によりグローバルバス要求を送出

(4 c) ：バス使用許可を受け、グローバルバスにァドレスをデータ出力 ( 4 d )：他プロセッサ /共有メモリがグ口一バルバスの情報を受信し、自身の共有メモリあるいは共有メモリキャッシュにライト

(4 e) ：メモリライト完了

(4 f ) ：ライトアクセスを起動したプロセッサがバス開放

' この例では、コヒーレンシ保証に必要な条件は以下の式で表される。 d s d (ma X) ヽ t d s d (m i n) + dmw (m i n) 、 ' t _rc ：グローバルバスへのライト発行からバス開放までの時間

t _{d s d} ：グローバルバスへのライト発行を他プロセッサが認識するのに必要な時間

t _dmw ：プロセッサ Z共有メモリがグローバルバス上のライトアクセスを認識して力ら、そのデータを自身に反映させるのにかかる時間

である。

ここで、（1)式は前記の要件 1を満たすための条件であり、ライト値が共有メモリ及び全てのプロセッサ上の共有メモリキヤッシュに反映されてからグロ一バルバスを開放することを保証するものである（一般にはライト処理の完了応答を被ライト側から送出し、その变信をもってバス開放を行うシーケンスが採られる場合が多い）。その条件を満たすことで、グローバルバスの使用権調停により次のプロセッサがライト処理を開始するときには前のライト処理が完了していることが保証される。いわば、グローバルバスの持つ欠点によりコヒーレンシ制御の要件が満たされている格好であるが、実は前記の要件 1は、データ更新の調停を要することと本質的に差異がない。データ更新の順序付けを保証することは、複数のデータ更新が同時に発生しないことを保証すること、つまり調停を行うことと等価だからである。したがって、前記のコヒーレンシ制御の要件 1を満たすことは、グローバルバスを使用する上で生ずる前記の制約 2を同じように受け、前記問題を解決する上での障壁となる。

一方、（2 ) 式は、図 4中（4 d ) のタイミングが各プロセッサでばらつくのを吸収して、前記の要件 2を満たすための条件である。（4 d )のタイミングは、グローバルバスに現れたライトアクセスと競合するリードアクセスが各プロセッサ上で起動されたときに、更新前のデータがプロセッサコアに返されるか、更新後のデータが返されるかの境界となるタイミングである。更新後のデータが返送されるのは（4 e ) のタイミングであるので、（2 ) 式を満たさないと、このタイミングがプロセッサによっては逆転し、前記の要件に反することになる。

ここで、たとえば（1 ) 式は、バス占有時間を一定以上にしなければならないこと、つまり共有メモリ空間の帯域に対する制約を与えることを示しているし、（ 2 )式は共有メモリキヤッシュゃ共有メモリに対する書き込み時間を短くして帯域を増やそうとしても、プロセッサ間で（4 d ) のタイミングがばらつくことを考慮し、一定以上の時間に保たなければならないことを示している。これらの例のとおり、各種の動作タイミングに条件が付されるために、処理時間の短縮を図って性能向上を図ろうとする場合に、コヒーレンシ制御自体が一種の制約を生むことになる。

従来のキャッシュ間のコヒーレンシをとる技術として、特許文献 1がある。特許文献 1では、プロセッサモジュールは、キャッシュメモリを有し、他のプ口セッサモジュールに、バスを介して、コヒーレンシトランザクションを発行する。コヒーレンシ'トランザクションを受け取ったプロセッサモジュールは、コヒーレンシ検查を実行する。コヒーレンシを維持するために更新を行う場合、更新に使われるべきデータは、バスを介して送られるプロセッサモジュールとメインメモリとをつなぐ信号線は、コヒ一レンシ検査の結果の通知に使われる。

特許文献 1 .

特開平 7— 2 8 1 9 5 6号公報発明の開示

本発明の課題は、以上に述べたようなコヒーレンシ制御を含む前記の各種制約による性能低下要因の最小化を図りながら、前記の課題を解決して共有メモリ空間の帯域とレイテンシの向上を図つたマルチプロセッサシステムを提供することである。

本発明のマルチプロセッサシステムは、それぞれが共有メモリキャッシュを備える複数のプロセッサと少なくとも 1つの共有メモリが相互に結合されたマルチプロセッサシステムにおいて、共有メモリ領域のデータの更新において、更新に用いるべきデータをプロセッサと共有メモリとの間で専用に送受する専用回線手段と、データの更新通知を、各プロセッサに該更新通知を送信する権利を調停しながら、伝送するグローバルバス手段とを備え、プロセッサからの該データの更新通知の送信と更新に用いるべきデータの送信を独立に行い、各プロセッサ及び共有メモリでは、更新通知の受信によって、該更新通知によつて示されるァドレスへのアクセスを制限し、各プロセッサ及び共有メモリに到着した更新に用いるべきデータによって、共有メモリ領域の該ァドレスのデータが更新された後、該ァドレスへのアクセスを許可することを特徴とする。本発明によれば、更新データを送受する専用回線手段を設けたことにより、更新データの送受信が高速化される。また、グロ一バルバス手段では、データ量の少ない更新通知のみを調停して転送すればよいので、バスの使用権の獲得のために長時間待たされることが少なくなる。また、更新通知にしたがって、更新データによる共有メモリ領域の更新を各プロセッサぉよび共有メモリがするので、共有メモリキャッシュと共有メモリとのコヒーレンシが確保される。図面の簡単な説明

図 2は、各プロセッサ上に共有メモリキャッシュ（2 h ) を配置した従来例を示す図である。

図 3は、コヒーレンシ制御について説明する図である。

図 4は、キヤッシュコヒーレンシの確立の仕方の例を説明する図である。図 5は、本発明の実施形態に基づくシステムの構成図である。

図 6は、本発明の実施形態における第 1の態様の一連の処理に基づくタイムチャートの例である。

図 7は、本発明の実施形態の第 2の態様に基づく処理のタイムチャートの例である。

図 8は、異なるデータサイズでデータ更新を行った場合のタイムチャートの例である。図 9は、本発明の実施形態の第 3の態様に基づく処理のタイムチヤートの例である。

図 1 0は、本発明の実施形態の第 4の態様の原理に基づいたタイムチヤトの例である。

図 1 1及び図 1 2は、本発明の実施形態の第 5の態様におけるシステムの構成図と、その制御原理を示すタイムチャートである。

図 1 3は、本発明の実施形態の第 6の態様を説明する図である。

図 1 4は、本発明の実施形態に基づくより具体的なシステム構成図である。図 1 5は、図 1 4中の各プロセッサ（1 4 a— 1 ) 〜（1 4 a— 1 0 ) の内部構成図である。

図 1 6は、本発明の実施形態における第 1の態様のライトアクセス時の信号の流れを示す図である。

図 1 7は、本発明の実施形態の第 1の態様に基づく更新データ受信時の信号の流れを示す図である。

図 1 8は、本発明の実施形態の第 1の態様において、共有メモリキヤッシュのデータを利用できる典型的なリードアクセス時の信号の流れを示す図である。図 1 9は、本発明の実施形態の第 1の態様におけるリードアクセスにて、共有メモリキヤッシュ上のデータを利用できず、更新データ要求処理を伴う場合の信号の流れを示す図である。

図 2 0は、本発明の実施形態の第 1の態様において、他のプロセッサから送信された更新データ要求に対する、マスタプロセッサによる応答時の信号の流れを示す図である。

図 2 1は、本発明の実施形態の第 2の態様におけるライトアクセス時の信号の流れを示す図である。

図 2 2は、本発明の実施形態の第 2の態様において、他プロセッサから送出された更新データ受信時の信号の流れを示す図である。

図 2 3は、本発明の実施形態の第 3の態様における更新通知を省略したライトアクセス時の信号の流れを示す図である。

図 2 4は、本発明の実施形態の第 3の態様において、他プロセッサから送出された更新通知を省略した更新データ受信時の信号の流れを示す図ある。図 2 5は、本発明の実施形態の第 2の態様におけるキヤッシュフィル動作において、システムに増設されたプロセッサが全データ送信要求を行うときの信号の流れを示す図である。

図 2 6は、本発明の実施形態の第 4の態様におけるキヤッシュフィル動作において、マスタプロセッサが全データ送信要求に応答して全データ送信を行うときの信号の流れを示す図である。

図 2 7は、本発明の実施形態の第 4の態様におけるキャッシュフィル動作において、システムに増設されたプロセッサが全データ受信を行うときの信号の流れを示す図である。

図 2 8は、本発明の実施形態の第 5の態様に基づくライトアクセス時の信号の流れを示す図である。発明を実施するための最良の形態

図 5は、本発明の実施形態に基づくシステムの構成図である。

本発明の実施形態の第 1の態様における本発明の原理を以下に示す。図 5において、従来例のグローバルバスに相当する部分は、更新通知バス（5 e ) として、データ更新の通知と、更新データの送出要求を専従的に行うパスとして用いられる。更新データの内容はデータチャネル（5 g ) を使用してリピータ ( 5 h ) との間で送受される。データチャネルは高速広帯域の既知の伝送手段 (例えば、ギガビットイーサネット等）を用いることを想定する。リビータ（5 h ) はデータチャネルが接続された各ポートに現れたデータを、全てのポートに同報する機能を有する。なお、プロセッサの数が少なく現実的なデータチヤネル数で収まる場合は、リビータを設けずに全てのプロセッサと共有メモリの間に 1対 1でデータチャネルを設け、各プロセッサ上で同報する処理を行ってもよレ、。また、共有メモリは特定のプロセッサ上に配置してしまってもよいし、特願 2 0 0 2 - 1 2 6 2 1 2号公報にある例のように、各プロセッサが共有メモリ空間のサイズに等しい共有メモリキャッシュを具備する場合には、共有メモリ自体を設けなくてもよい。いずれの場合でも本発明の実施形態としての効果を得ることが可能である。

各プロセッサは、プロセッサコアにより共有メモリ空間へのライト処理が発行されると、更新通知バスを獲得して更新対象のァドレスを更新通知バスに送出する。それと同時に、データチャネルの送信バッファに更新データを投入する。更新データは、主に各プロセッサとリピータのポート部における信号処理遅延を受け、更新通知に対して遅れて他のプロセッサに到達する。

—方、更新通知バスは全てのプロセッサが常に監視しており、更新通知を検知すると、該アドレスをプロセッサ上の更新キューに書き込む。その後更新データが到着すると、それを共有メモリキャッシュにライトし、更新キューから該アドレスを消去する。また、更新キュー上に存在するアドレスに対してプロセッサコアからのリード処理が起動された場合、共有メモリキャッシュからのリードを保留し、更新データ到着時に共有メモリキャッシュへのライト処理とあわせてそのデータをプロセッサコアに返送する処理を行う。ここで、更新キユーに格納されているァドレスは、全て全てのァドレスが監視対象となっており、更新データには、ライト先のアドレスが付加されている。したがって、各プロセッサでは、更新キュー内のァドレスと更新データに付加されているァドレスを比較して、共有メモリキャッシュの適切なアドレスに更新データを書き込むことができる。また、共有メモリの構成は、プロセッサの構成と基本的に同一であるが、共有メモリには、プロセッサコアが存在せず、共有メモリキヤッシュがより容量の大きい共有メモリチップとなっている。

共有メモリキャッシュ上に有効データが存在しない場合、つまりキャッシュミス時のリードアクセスは、更新通知バスに更新データ送出要求を発行し、共有メモリまたは他の有効なデータを共有メモリキャッシュ上に保持するプロセッサが更新データを送出することにより行う。

図 6は、本発明の実施形態における第 1の態様の一連の処理に基づくタイムチャートの例である。 '

本例はプロセッサ 1がアドレス 1にデータ 1を、それに続いてプロセッサ 2 がァドレス 2にデータ 2をライトしており、それと平行してプロセッサ 3がァドレス 1、アドレス 0、アドレス 1の順に共有メモリ空間をリードした場合である。なお、共有メモリ空間上のデータ初期値は全て 0とする。なお、図 6中、 Aはアドレス、 Dはデータを意味し、また、（1 ) —0等の表記はアドレス 1 へのデータ 0のライト、 1— ( 0 ) 等の表記はアドレス 0からのデータ 1のリードをそれぞれ意味する。

プロセッサ 3の 1回目のリード時には更新キュ一は空であるため、共有メモリキャッシュからリードが行われ、データ 0がプロセッサコアに返送される。ついで、プロセッサ 1からの更新通知を検知し、それがプロセッサ 3の更新キユーに投入される。プロセッサ 3の 2回目のリード時には、更新キューは空ではないが、更新キュー上にあるのはアドレス 1のみであり、リードアドレスと —致するものが存在しないで、 1回目のリードと同様の処理にてデータ 0がプ口セッサコアに返送される。 3回目のリードでは、更新キュー上にリードアドレスと一致するものがあるため、共有メモリキヤッシュのリードは起動されずリードアクセスは保持される。その後、プロセッサ 1からアドレス 1の更新デ —タが到着すると、プロセッサ 3の共有メモリキャッシュにデータ 1がライトされて更新キューがクリアされ、同時にそのデータがァドレス 1のリードデータとしてプロセッサコアに返送される。

本方式の主な利点は次の 2点である。一つは、データ更新を行う側のプロセッサにおいて、他のプロセッサの共有メモリキャッシュへの反映を待たなくてもすむためにバス占有時間を削減でき、共有メモリ空間の帯域の向上が図れることである。もう一つは、データ更新処理と競合しないリードアクセスの不要な待ち合わせ時間を排除することで、リードアクセスの平均レイテンシを低減し得ることである。このうち、後者の従来例に対する改善度合いは、共有メモリキャッシュのヒット率とアクセス競合の発生確率により変化するが、特にヒット率が高く競合発生確率が低いほど、本方式の優位性は顕著となる。

本発明の実施形態の第 1の態様における原理は、第 1の態様におけるデータ更新の単位をブロック化することで、共有メモリ空間の帯域を更に拡大しようとするものである。通常考え得る実装では、データチャネルや共有メモリキヤッシュの帯域は、更新通知バスのそれに比較してはるかに大きくすることが可能である。したがって、共有メモリ空間の帯域としては、更新通知バスの帯域により制限され、データチヤネルや共有メモリキャッシュの帯域を活用しきれない可能性が生ずる。まず、これを解決しょうとするものである。

図 7は、本発明の実施形態の第 2の態様に基づく処理のタイムチヤ一トの例である。

同図においては、データ更新を 4アドレス単位としたものである。プロセッサ 1及び 2の送出する更新通知は更新対象ァドレスの先頭を示すことにより行われ、対応するァドレスの更新データはデータチャネル上にひとまとめにして送出される。

データ長が固定のままでは、ソフトウェアの処理上不要なデータまで組にしてデータ更新を行わなければならなくなるケースが発生するため、データチヤネルや共有メモリキヤッシュの帯域を浪費し、実効帯域を低下させる可能性が発生する。そのため、更新データサイズを可変として必要十分なデータのみがデータチャネルに送出されるように構成する。

図 8は、異なるデータサイズでデータ更新を行った場合のタイムチャートの例である。

同図においては、図 7の例においてプロセッサ 1の初回のライトが更新サイズ 2となってる点のみが異なる。この差により、全体として 2アドレス分のデータ収受に要する時間分、データチヤネル及び共有メモリキャッシュの占有時間が減少する。また、その時間分プロセッサ 2のライト処理に対応する更新データの到着が早くなり、更新キューの内容がクリアされるまでの時間が短くなるので、この原理によりアクセス競合時のレイテンシも低減することができる。また、第 2の態様における方式は帯域の向上のみでなく、共有メモリ空間上にブロック単位での排他的更新を提供する手段ともなる。この点によりソフトウェア処理を効率化し、システムの処理能力を向上することも期待できる。同等のことをソフトウエアで実現するには、更新開始と完了を管理するために余分な処理が必要となるからである。

本発明の実施形態の第 3の態様における原理は、プロセッサがコヒーレンシ制御要否の属性をライトアクセス毎に選択することを可能として、コヒーレンシ制御不要の属性が指定されたライトアクセスについて更新通知を発行せず、更新データのみを他のプロセッサに送出する制御を行うものである。ソフトゥエアの処理内容によっては、コヒーレンシ保証が不要な共有メモリ空間の用途もあるので、そのような処理に対して、この制御をソフトウェアが利用し、更新通知バスの使用頻度を削減して共有メモリ空間の帯域を向上すると共に、更新データが他プロセッサに反映される時間を短縮し、また不要なアクセス競合の発生によるレイテンシ増加を必要最小限に抑制してリ一ドアクセスの平均レィテンシの削減を図ろうとするものである。

図 9は、本発明の実施形態の第 3の態様に基づく処理のタイムチヤ一トの例である。

この例におけるプロセッサのアクセスパターンは図 6の例に準じており、プ口セッサ 1の初回のライトがコヒーレンシ制御不要の属性が付されてる点のみが異なる。プロセッサ 1の初回のライトに伴う更新通知バス上の処理が起動されないため、それに要する分更新通知バスの占有時間が減少している。また、その分プロセッサ 2による 2回目のライトアクセスに伴う更新通知が更新通知バスに早く送出されるため、更新時間の短縮を図ることもできる。プロセッサ 3の 3回目のリードはプロセッサ 1のライトより後に発行されているが、本制御により更新キューには投入されていないため、競合による待ち合わせが発生せず、通常と同じレイテンシにてリードアクセスが完了している。

本発明の実施形態の第 4の態様における原理は、プロセッサのオンライン増設時に、共有メモリ空間の全てのデータを保持するプロセッサもしくは共有メモリが、自身が持つ共有メモリ空間のデータをデータチャネルの空き時間を使用して、増設プロセッサに転送し、増設プロセッサはそのデータを受けて共有メモリキヤッシュを初期化するものである。

増設直後のプロセッサは共有メモリキヤッシュの内容が全て無効データであり、そのまま運用系に参加させると共有メモリ空間へのアクセスが全て共有メモリキャッシュでミスヒットする。これにより、運用開始直後は増設プロセッサの処理能力が著しく低下するだけでなく、更新通知バスやデータチャネルが不用意に占有されるために他のプロセッサにも影響を与え、システム性能をかえって低下させる危険もある。本方式により、プロセッサ増設による運用系の処理能力低下を防ぎ、また増設プロセッサの処理能力も運用開始直後から最大限に引き上げることができる。

図 1 0は、本発明の実施形態の第 4の態様の原理に基づいたタイムチャートの例である。

図中、 a〜hは通常のデータ更新処理に基づく転送で、 1〜8までが、本方式により行われる増設プロセッサへのデータ転送である。增設プロセッサは、' 自身が新たにシステムに実装されたことを、更新通知バスに特定の信号を送出する力、そしくは実装未実装を示す専用の信号線を用いるなどの方法で他のプ口セッサに通知する。増設プロセッサ向けにデータを送出するプロセッサまたは共有メモリはその通知を受け、図 1 0に示す通り、自身の更新キューが空のときに、更新データをデータチャネルに送出する。更新キューが空でなくなつたら、直ちにデータ送出を中断して通常の処理を優先し、更新キューが空になつたらデータ送出を再開する。このような処理により、システム上で行われる通常のデータ更新処理のタイミングに影響を与えることなく、増設プロセッサに対して共有メモリキャッシュを満たすためのデータを送出する処理を追加することができる。増設プロセッサは、データチャネルより受け取った全てのデータで満たされた後、本来の処理を開始し運用系へ参加する。このときには共有メモリキャッシュの内容は全て更新されており、運用開始直後から共有メモリキャッシュのヒット率が高く保たれ、システムとしての処理能力を向上することができる。

第 5の態様による制御の原理は、競合頻度の高い特定のアドレスへのライト処理に従来と同じ手法を選択的に使用できるようにすることで、競合時のリ一

うとするものである。図 1 1に示す通り、更新データを転送するデータバス（1 1 i ) を設けて更新通知バスと同じ調停論理経路としてデータチャネル（1 1 g ) を使用する力 \ データバスを使用するかは、ライトアクセス毎にプロセッサが選択する。

図 1 2は、同時間に発行されたライトアクセスにおいて、更新データの転送経路にデータチャネルを使用した場合（P = 0 ) と、データバスを使用した場合（P = l ) のタイミングの相違を示したものである。ライトアクセス起動から、他のプロセッサが更新前のデータをリードしなくなるまでの時間は、 t _{d s} _dであり、両者に相違はない。し力し、更新後のデータをリードできるようになるまでの時間は、（P = l ) の場合の t _{d u c l}に対し、（P = 0 ) の場合、デー

0に増大する。同一アドレスに対するリードアクセスの競合が発生しない限り、この差はなんら影響しないが、競合が発生した場合に、この時間差がリシ増大となつて現れるので、競合が多発するアクセスについて（P = 0 ) を選択的に使用する。それにより、リードアクセスの平均レイテンシを低減することができる。図 1 3は、本発明の実施形態の第 6の態様を説明する図である。 ' 図 1 3 ( a ) は、第 6の態様における制御のタイムチャートである。

第 6の態様は、第 5の態様における制御原理を、第 1〜第 4の態様におけるシステム構成にそのまま適用するもので、特定のライトアクセスについて、更新データの物理的な転送は行わずにデータ更新を行うものである。具体的には、共有メモリ空間上のァドレスとライトされるべきデータを、プロセッサコアが生成する特定のアドレスにあらかじめ対応付けておき、その特定アドレスに対するライトアクセスが発行された場合、更新通知が発行された時点で、その予約されたデータが更新データとして転送されたものとして取り扱う。この方法では小さな情報量のデータしか扱えないが、信号線数の多い従来のようなデータバスを設置することなく、力つ、第 5の態様の方式と同じ効果を得ることができる。図 13 (a) の例では、アドレス 1に対するライトは、共有メモリ空間上の同ァドレスに対するデータ 1のライトとして扱っている。更新通知の認識時、更新データが同時に伝達されたものとして扱えるため、第 5の態様において（ P = 1) とした場合と同じタイミングで処理を行うことができる。また、データチャネルの占有が発生しないため、後続のアクセスがある場合は、そのァクセスにかかわるレイテンシを低減する効果も得られる。

例えば、図 1 3 (a) の例において、アドレス 2に対するライトをアドレス 1に対するデータ 0のライトとして扱う規約を設けて併用すれば、アクセス競合のオーバへッドが少なく、他のプロセッサへの反映時間も高速な 2値のフラグとしての機能をソフトウェアに提供することができる（図 1 3 (b))。図 14は、本発明の実施形態に基づくより具体的なシステム構成図である。システムはプロセッサ 10基（14 a— 1) 〜（14 a— 10) と、バスァ一ビタ/リピータ（14 b) 力ら構成されている。バスアービタとリピータはまったく独立した機能を提供するものであるが、システム構成を簡易にするため、両ブロックを同一のュニットに収容している。更新通知バス（14 c) は、バスク口ック BC 1〜BC 10、バス要求信号 NR 1〜NR 10、バス許可信号 NG 1〜NG 10、更新通知ァドレス NA (30ビット）、更新通知ァドレスマスク NM ( 4ビット）、即時更新データ N D ( 4ビット）、更新通知信号 N V、更新データ要求信号 RV，即時更新属性信号 N Iからなり、 BCに同期して動作する。データチャネル T SD 1〜T SD 10、 R S D 1〜R S D 10は、約 3ギガビット Z秒の伝送帯域を持つシリアル伝送線路を対向させた全二重通信チャネルを用いている。プロセッサのうち少なくとも 2つは共有メモリ空間の全内容を保持しており、うち 1つはマスタプロセッサとして更新データ要求に応答する。

図 1 5は、図 14中の各プロセッサ（14 a— 1) 〜（14 a— 10) の内部構成図である。

プロセッサ内部の機能プロックは、プロセッサコア（1 5 a)、プロセッサバスブリッジ（1 5 b)、更新通知バスブリッジ（1 5 e)、データチャネル I F (1 5 h)、更新キュー（1 5 k)、共有メモリキャッシュ（15 η) に大別される。各部の機能概略を以下に示す。

(1 5 a) プロセッサコア

主処理部である。

(1 5 b) プロセッサバスブリッジ

共有メモリ空間へのアクセスの包括的制御を行う。

制御ブロック（1 5 c) は全体の制御を、リダイレクタ（1 5 d) は、各機能ブロック間のバススィツチングと、ァドレス及びデータの変換を行う。

(1 5 e) 更新通知バスブリッジ

更新通知バスの制御を行う。

( 1 5 h ) データチャネル I F

他プロセッサとの間で更新データの送受信を行う。

(1 5 k) 更新キュー .

更新キユーを収容しており、キュ一状態を外部に出力する。

(15 η) 共有メモリキヤッシュ

共有メモリ空間のデータを保持し、プロセッサコアに対して高速なァクセスを提供する。

図 16は、本発明の実施形態における第 1の態様のライトアクセス時の信号の流れを示す図である。

そのフローを以下に示す。各行頭の番号は、図 16中の各信号に付した番号に対応する。

(1) プロセッサコア（1 6 a) がプロセッサアドレス PA、プロセッサデータ PD、プロセッサ転送タイプ P Tを設定し、プロセッサライト信号 PWを送信する。

(2) プロセッサバスプリッジ ( 1 6 b) の制御ロジック（1 6 c) はリダイレクタ機能制御信号 F Cを設定する。リダイレクタ（1 6 d) は、それに応じ、プロセッサァドレス P Aを実効ァドレス EAとキャッシュァドレス CAに、プロセッサデータ P Dを実効データ E D及ぴキャッシュデ一タ C Dにェコ一する。

(3) プロセッサバスブリッジ（1 6 b) の制御ロジック（1 6 c) は更新通知送信信号 NSを送信する。

(4) 更新通知バスプリッジ（1 6 e ) の送信部（1 6 f ) は N Sを受け、ノス要求信号 NRを送信する。

(5) 更新通知バスプリッジ（1 6 e ) の送信部（1 6 ί ) がバス許可信号 Ν Gを受信し、更新通知バスを獲得する。

(6) 更新通知アドレス ΝΑに Ε Αがエコーされ、更新通知信号 NVが全プロセッサに送信される。 NA及び NVは自プロセッサの更新通知バスブリッジ監視部（1 6 g) にもループバックし受信される。

(7) 更新通知バスプリッジ（1 6 e ) の監視部（1 6 g) は、自身が送出した NVを受け取ると、 NAを更新通知ァドレス S Aとしてエコーすると共に、 NVを更新通知受信信号 S Vとして自プロセッサ内に送信する。 S Vを受け、更新キュー（1 6 k) のキューレジスタ（1 6 1 ) に該更新通知がキュ一^ f ングされる。このとき、他のプロセッサ上でも同じ制御が行われる。

(8) プロセッサバスブリッジ（1 6 b) の制御ロジック（1 6 c ) は SVを受けて更新データ送信信号 U Sを送信し、これを受けたデータチャネル I F ( 1 6 h) のフレーマ（1 6 i ) は、 EA/EDの内容を送信バッファにキューィングする。 USの送信後、プロセッサコアにァクナリッジ信号 ACKが送信され、プロセッサコア側のアクセスは完了する。 (9) データチャネル I F (16 h) のフレーマ（1 6 i) では、送信バッファにキューイングされたデータが随時バケツ卜に構築されており、完了した分から SERDE S (16 j ) (シリアライザ 'デシリアライザの略であり、シリアル信号をパラレル信号に変換したり、パラレル信号をシリアル信号に変換する機能ブロックである）に送信パラレルデータ TPDとして送出される。 SE RDE Sはこれを受け、データチャネルで搬送できる電気信号に変調を行い、送信シリアルで TSDとして更新データを送出する。

図 17は、本発明の実施形態の第 1の態様に基づく更新データ受信時の信号の流れを示す図である。

そのフローを以下に示す。各行頭の番号は図 1 7中の各信号に付した番号に対応する。

(1) データチャネル I F (1 7 h) の SERDES ( 17 j ) が受信シリアルデータ RSDを復調し、フレーマ（1 7 i ) に受信パラレルデータ R PDとして送出する。 '

(2) データチャネル I F ( 1 7 h) のフレーマ（1 7 i) は RPDを受け、データ中のパケットの抽出及び展開を行い、更新データアドレス UA、更新データ UDを設定し、更新データ受信信号 URを送信する。これにあわせて、キユーレジスタ（ 1 7 1 )のキュークリァァドレス QC Aに U Aがセットさ lる。

(3) プロセッサバスブリッジ（1 7 b) の制御ロジック（17 c) は URを受け、リダイレクタ機能制御信号 F Cを設定する。リダイレクタ（ 17 d ) はそれに応じ、 UAを CAに、 UDを CDにエコーする。制御ロジック（1 7 c) にて他の処理が行われている場合、いったん待機し、それが完了しだい本処理を実行する。

(4) プロセッサバスブリッジ（1 7 b) の制御ロジック（1 7 c) はキヤッシュライト信号 CWを送信し、これを受けた共有メモリキャッシュ（1 7 η) は CAで指定される所望のデータを CDにて更新する。また、制御ロジック（1 7 c) は、キュークリア信号 QCを送信し、これを受けた更新キュー（1 7 k) は、ズ 2) でセットした QCAをキューレジスタ（1 7 1) からクリアする。図 18は、本発明の実施形態の第 1の態様において、共有メモリキヤッシュのデータを利用できる典型的なリードアクセス時の信号の流れを示す図である。そのフローを以下に示す。各行頭の番号は図 1 8中の各信号に付した番号に対応する。

(1) プロセッサコア（18 a) が PA、 PTを設定し、プロセッサリード信号 PRを送信する。

(2) プロセッサバスブリッジ（18 b) の制御ロジック（18 c) は FCを設定し、リダイレクタ（18 d) は、それに応じ、？入を£ と〇にェコーする。

(3) プロセッサバスブリッジ（18 b) の制御ロジック（18 c) が CRを送信する。

(4) 共有メモリキャッシュ（18 η) は CRを受け、 CAにて指定されたキャッシュ上のデータが利用できない場合は利用不能信号 N Pを送信し、利用可能な場合はキャッシュデータ CDを送信する。また、更新キュー（18 k) の比較器（1 8 m)は、 E Aで指定されるキューがキューレジスタ上にある場合、競合信号 CO Lを送信する。

(5) プロセッサバスブリッジ（18 b) の制御ロジック（1 8 c) は、 NP、 COLのいずれも受信しなかった場合、 CDを PDにエコーし、 ACKを送信してアクセスは完了する。 C〇Lを受信した場合は CRを解除した後、 COL が解除されるまで待ち、 COL解除の後に（3) 以降の処理を再度行う。ここで、 CO Lを受信せず、 NPを受信した場合の処理は以下で説明する。

図 1 9は、本発明の実施形態の第 1の態様におけるリ一ドアクセスにて、共有メモリキャッシュ上のデータを利用できず、更新データ要求処理を伴う場合の信号の流れを示す図である。

そのフローを以下に示す。各行頭の番号は図 1 9中の各信号に付した番号に対応する。なお,、途中（4) までは前項で述べたリードアクセス時のフローとまったく同じであるため、省略する。

(5) プロセッサバスブリッジ（19 b) の制御ロジック（19 c) が C〇L を受信せず、 NPを受信した場合は、更新データ要求信号 R Sを送信する。

(6) 更新通知バスブリッジ（1 9 e) の送信部（1 9 ί) は RSを受け、バス要求信号 NRを送信する。

(7) 更新通知バスプリッジ（1 9 e) の送信部（1 9 f ) がバス許可信号 N

Gを受信し、更新通知バスを獲得する。

(8) 更新通知アドレス N Aに E Aがエコーされ、更新データ要求信号 RVが全プロセッサに送信される。 NA及ぴ RVは自プロセッサの更新通知バスブリッジ監視部（ 1 9 g ) にもループバックし受信される。

(9) 更新通知バスブリッジ（1 9 e) の監視部（1 9 g) は NAを SAとしてエコーするとともに、自プロセッサが送出した RVを検知すると、自プロセッサ内に S Vとしてエコーする。更新キュー (1 9 k) は SVをキューセット信号 QSとして受け、 SAの内容をキューセットアドレス QSAとしてキューレジスタ（1 9 1) にキューイングする。

(10) リードアクセス対象に一致するキューがキューイングされるため、更新キュー（1 9 k) より COLが必ず送信される。 COLの受信をもって、プ口セッサバスブリッジ（1 9 b) は COLが解除されるまで、プロセッサコア (1 9 a) からのリードアクセスを保留したまま更新通知と更新データの受信処理を行レヽながら待機する。

(1 1) (8)で送出された更新デ^ "タ要求を受けて、マスタプロセッサから更新データが送出され、データチャネル I F (1 9 h) は更新データアドレス U A、更新データ UDを設定し、更新データ受信信号 URを送信する。これにあわせて、キューレジスタ（1 9 1 ) めキュークリアアドレス QCAに UAがセッ卜さる。

(12)、更新キュー（19 k) からリードアクセス対象のキューがクリアされるため、 CO Lが解除される。

(1 3) プロセッサバスブリッジ（1 9 b) の制御ロジック（1 9 c) は、 C OLの解除を受け、 F Cを制御してリダイレクタ（1 9 d) を制御し、 UAを CAに、 UDを CDと PDにエコーする。

(14) プロセッサバスブリッジ（1 9 b) の制御ロジック（1 9 c) はキヤッシュライト信号 CWを送信して共有メモリキヤッシュ上の所望のデータを C Dにて更新すると共に、プロセッサコアに対して ACKを送信し、リードァクセスを完了する。

図 20は、本発明の実施形態の第 1の態様において、他のプロセッサから送信された更新データ要求に対する、マスタプロセッサによる応答時の信号の流れを示す図である。

そのフローを以下に示す。各行頭の番号は図 20中の各信号に付した番号に対応する。

(1) 更新通知バスプリッジ（1 9 e) の監視部（1 9 g) は RVを検知すると、 NAを S Aにエコーすると共に、更新データ要求信号 S Rをプロセッサ内部に送信する。

(2) プロセッサバスブリッジ（20 b) の制御ロジック（20 c) は、自身がマスタプロセッサである場合、 SRを受けて F Cを設定してリダイレクタ（2 0 d) を制御して S Aを EAと CAにエコーし、 CDと EDを接続する。ここで自身がマスタプロセッサでない場合、 SRは無視される。なお、制御ロジック（17 c) にて他の処理が行われている場合ー且待機し、それが完了しだい本処理を実行する。

(3) プロセッサバスブリッジ（20 b) の制御ロジック（20 c,) は、 CR を共有メモリキャッシュ（2011) に送信する。

(4) 共有メモリキャッシュ（20 η) から CDが送出され EDにエコーされる。

(5) プロセッサバスブリッジ (20 b) の制御ロジック (20 c) は USを送信し、ライトアクセス時の更新データ送出処理と同様に、データチャネルに更新データが送出される。

. 図 21は、本発明の実施形態の第 2の態様におけるライトアクセス時の信号の流れを示す図である。

そのフローを以下に示す。各行頭の番号は図 21中の各信号に付した番号に対応する。

(1) プロセッサコア（21 a) がプロセッサアドレス PA、プロセッサデータ PD、プロセッサ転送タイプ PTを設定し、バースト転送により複数サイズのデータをリダイレクタに転送する。

(2) プロセッサバスブリッジ (21 b) の制御ロジック (21 c) はリダイレクタ機能制御信号 F Cを設定する。リダイレクタ（ 21 d ) はそれに応じ、プロセッサァドレス P Aで設定された先頭のァドレスを実効ァドレス E Aにェコーする。また、バースト転送されたデータサイズをカウントし、そこから実行ァドレスマスク EMを算出して出力する。ここで、実効ァドレスマスクは、実効アドレスの下位何ビットを無視するかを示す信号である。 PDに設定された複数サイズのデータはリダイレクタ内部のバッファに格納する。

(3) プロセッサバスブリッジ（21 b) の制御ロジック（21 c) は更新通知送信信号 N Sを送信する。 (4) 更新通知バスプリッジ（21 e) の送信部（21 ί) は NSを受け、バス要求信号 NRを送信する。

(5) 更新通知バスプリッジ（21 e) の送信部（21 f ) がバス許可信号 N Gを受信し、更新通知バスを獲得する。

(6) 更新通知アドレス NAに E Aが、更新通知アドレスマスク NMに EMがエコーされ、更新通知信号 NVが全プロセッサに送信される。 NA、 NM、 N Vは自プロセッサの更新通知バスブリッジ監視部（2 1 g) にもループバックし受信される。

(7) 更新通知バスプリッジ（21 e) の監視部（21 g) は NVを受け、 N Aを更新設定アドレス SA、 NMを更新設定アドレスマスク SMにエコーして更新通知受信信号 SVを送信する。更新キュー（21 k) は SVをキューセット信号 QSとして受け、 SAの内容をキューセットアドレス QS A、 SMの内容をキューセットアドレスマスク QSMとしてキューレジスタ（21 1 ) にキュ一イングする。

(8) プロセッサバスブリッジ（21 b) の制御ロジック（21 c) は、 SV を受けると更新データ送信信号 USを送信し、同時に FCを設定する。リダイレクタ（2 I d) はこれに応じてバッファ内に格納した更新データの先頭のデータから順番に EDとして設定する。これを受けたデータチャネル I F (2 1 h) のフレーマ（21 i ) は E AZEM/EDの内容を送信バッファにキューイングする。 USの送信後、プロセッサコアにァクナリッジ信号 ACKが送信され、プロセッサコア側のアクセスは完了する。

(9) データチャネル I F (21 h) のフレーマ（2 1 i) では、送信バッファにキューイングされたデータを随時バケツ卜に構築しており、完了した'分から SERDES (21 j ) に送信パラレルデータ TPDとして送出される。 S ERDESは、これを受け、データチャネルで搬送される電気信号に変調を行レ、、送信シリアルデータ T S Dとして更新データを送出する。

図 22は、本発明の実施形態の第 2の態様において、他プロセッサから送出された更新データ受信時の信号の流れを示す図である。

そのフローを以下に示す。各行頭の番号は図 22中の各信号に付した番号に対応する。

(1) データチャネル I F (22 h) の SERDES ( 22 j ) が受信シリアルデータ RSDを復調し、フレーマ（22 i ) に受信パラレルデータ R PDとして送出する。

(2) データチャネル I F ( 22 h ) のフレーマ ('22 i ) は R PDを受け、データ中のパケットの抽出及び展開を行い、更新データアドレス UA、更新ァドレスマスク UMに設定し、更新データ受信信号 URを送信する。これに合わせて、キューレジスタ（22 1 ) のキュークリアアドレス QCAに UAがセットされる。また、 UR送信と同時に更新データを先頭データから順番に UDに i XE ~る。

(3) プロセッサバスブリッジ（22 b) の制御ロジック（22 c) は URを受け、リダイレクタ機能制御信号 FCを設定する。 UAと UDは一旦リダイレクタ内のバッファに格納し、 UAが CA、 UDの先頭データが CDに設定される。 CAに設定制御ロジック（22 c) にて他の処理が行われている場合、一且待機し、それが完了しだい本処理を実行する。

(4) プロセッサバスブリッジ (22 b) の制御ロジック（22 c) はキヤッシュライト信号 CWを送信し、これを受けた共有メモリキャッシュ（22 η) は C Αで指定される所望のデータを CDにて更新する。続けてリダイレクタのバッファに格納された次の更新データを CDに設定し、 CAの値を 1つインクリメントして、同様のキャッシュメモリ更新処理を、 UMの設定値にしたがつて、バッファ內の更新データがなくなるまで繰り返し行う。その後、キュークリア信号 QCを送信し、これを受けた更新キュー（22 k) は、（2) でセットした QCAをキューレジスタ（22 1 ) からクリアする。

図 23は、本発明の実施形態の第 3の態様における更新通知を省略したライトアクセス時の信号の流れを示す図である。

そのフローを以下に示す。各行頭の番号は図 23中の各信号に付した番号に対応する。

(1) プロセッサコア（23 a) がプロセッサ転送タイプ PTにデータオンリ属性を設定し、プロセッサアドレス PA、プロセッサデータ PD、プロセッサライト信号 PWを送信する。，

(2) プロセッサバスブリッジ（23 b) の制御ロジック（23 c) は、リダィレクタ機能制御信号 FCを設定する。リダイレクタ（23 d)はそれに応じ、プロセッサァドレス P Aを実行ァドレス E Aに、プロセッサデータ PDを実効データ EDにエコーする。

(3) プロセッサバスブリッジ（23 b) の制御ロジック（23 c) は、データオンリ属性信号 DOを設定し、更新データ送信信号 USを送信する。 USの送信後プロセッサコアにァクナリツジ信号 A C Kが送信され、プロセッサコア側のアクセスは完了する。

( 4 ) 更新データ送信信号 U Sとデータオンリ属性信号 D Oを受信したデータチャネル I F (23 h) のフレーマ（23 i) は E A/EDの内容及びデータオンリ属性を送信バッファにキューイングする。

(5) データチャネル I F (23 h) のフレーマ（23 i ) では、送信バッファにキューイングされたデータおよび属性を随時バケツトに構築しており、完了した分から SERDES (23 j ) に送信パラレルデータ T P Dとして送出される。 S ERDE Sはこれを受け、データチャネルで搬送できる電気信号に変調を行い、送信シリアルデータ TSDとして更新データを送出する。図 24は、本発明の実施形態の第 3の態様において、他プロセッサから送出された更新通知を省略した更新データ受信時の信号の流れを示す図ある。そのフローを以下に示す。各行頭の番号は図 24中の各信号に付した番号に対応する。

(1) データチャネル I F (24 h) の SERDES (24 j ) が受信シリアルデータ RSDを復調し、フレーマ（24 ί ) に受信パラレルデータ RPDとして送出する。

(2) データチャネル I F (24 h) のフレーマ（24 i ) は R PDを受け、データ中のパケットの抽出および展開を行い、更新データアドレス UA、更新データ UD、データオンリ属性 DOを設定し、更新データ受信信号 URを送信する。

(3) プロセッサバスブリッジ（24 b) の制御ロジック（24 c) は更新データ受信信号 URとデータオンリ属性信号 DOを受け、リダイレクタ機能制御信号 FCを設定する。リダイレクタ（24 d) はそれに応じ、 U Aをキヤッシユアドレス CAに、 UDをキャッシュデータ CDにエコーする。制御ロジック (24 c) にて他の処理が行われている場合一旦待機し、それが完了しだい本処理を実行する。

(4) プロセッサバスブリッジ（24 b) の制御ロジック（24 c) はキヤッシュライト信号 CWを送信し、これを受けた共有メモリキャッシュ（24 η) は C Αで指定される所望のデータを C Dにて更新する。

図 25は、本発明の実施形態の第 2の態様におけるキャッシュフィル動作において、システムに増設されたプロセッサが全データ送信要求を行うときの信号の流れを示す図である。

そのフローを以下に示す。各行頭の番号は図 25中の各信号に付した番号に対応する。 (1) プロセッサバスブリッジ（25 b) の制御ロジック（25 c) は、自プ口セッサがシステムに増設されたことを検知すると、全デ一タ送信要求信号として RSと I Sを同時に送信する。

(2) 更新通知バスブリッジ（25 e) の送信部（25 f ) は R Sと I Sを受け、バス要求信号 NRを送信する。

(3) 更新通知バスプリッジ（25 e) の送信部（25 f ) がバス許可信号 N Gを受信し、更新通知バスを獲得する。

(4) 更新通知バスブリッジ（25 e) の送信部（25 f ) は RVと N Iを同時に送信する。

図 26は、本発明の実施形態の第 4の態様におけるキャッシュフィル動作において、マスタプロセッサが全データ送信要求に応答して全データ送信を行うときの信号の流れを示す図である。

そのフローを以下に示す。各行頭の番号は、図 26中の各信号に付した番号に対応する。

(1) マスタプロセッサの更新通知バスブリッジ（26 e) の監視部（26 g) ' は、 RVと同時に N Iを受信すると、 SRと S Iを同時に送信する。

(2) プロセッサバスブリッジ（26 b) の制御ロジック（26 c) は SRと S Iを同時に受信すると全データ送信要求信号と解釈し、共有メモリ空間の先頭のアドレスを送信開始アドレス、及び、次送信アドレスとして記憶する。

(3) システムに別のプロセッサが増設され、マスタプロセッサの制御ロジック（26 c) 1 再び全データ要求信号を受信した場合、制御ロジック（26 c) は先に記憶した次送信ァドレスを送信開始ァドレスとして記憶する。

(4) 制御ロジック（26 c) はキューェンプティ信号 QEが有効であり、かつ、他に要求されている処理がないとき、リダイレクタ機能制御信号 FCを設定し、リダイレクタ（26 d) は先に記憶した次送信アドレスをキャッシュァドレス CAに設定し、制御ロジック（26 c) はキャッシュリード信号 CRを送信する。

(5) 共有メモリキャッシュ（26 η) は CRを受け、. CAにて指定されたキャッシュ上のデータをキヤッシュデータ CDに送信する。

(6) プロセッサバスブリッジ (26 b) のリダイレクタ（26 d) は、先に設定した C Aを実効ァドレス EAにも設定し、 CDを実効データ EDにエコーする。制御ロジック（26 c) はデータオンリ属性 DOを設定し、更新データ送信信号 USを送信する。これを受けたデータチャネル I F (26 h) のフレ一マ（26 i ) は EA/EDの内容及びデータオンリ属性を送信バッファにキユーイングする。

(7) プロセッサバスブリッジ（26 b) の制御ロジック（26 c) は、送信したァドレスの次のァドレスを次送信ァドレスとして記憶する。送信したァドレスが共有メモリ空間の最後のァドレスに達した場合は、共有メモリ空間の先頭のァドレスを次送信ァドレスとして記憶する。次送信ァドレスが先に記憶した送信開始アドレスと一致した場合、全データ送信を終了する。

(8) (3) 〜（7) の手順を繰り返して、順次データを送出する。

(9) データチャネル I F (26 h) のフレーマ（26 i) では、送信バッファにキュ一されたデータを随時バケツトに構築しており、完了した分から SE RDES (26 j ) に送信パラレルデータ TPDとして送出される。 SERD ESはこれを受け、データチャネルで搬送できる電気信号に変調を行い、送信シリアルデータ T SDとしてデータを送出する。

図 27は、本発明の実施形態の第 4の態様におけるキャッシュフィル動作において、システムに増設されたプロセッサが全データ受信を行うときの信号の流れを示す図である。

そのフローを以下に示す。各行頭の番号は図 27中の各信号に付した番号に対応する。

(1) 全データ受信動作中に制御ロジック（27 c) 力プロセッサリード信号 PR、または、プロセッサライト信号 PWを受信した場合、制御ロジック（2 7 c) は、この要求を保留する。全データ受信動作中であっても、更新キューへのキューィング、クリァはそれぞれ図 16、図 17で示されたフローで行う。

(2) データチャネル I F (27 h) の SERDES (27 j ) が受信シリアルデータ RSDを復調し、フレーマ（27 i ) に受信パラレルデータ R PDとして送出する。

(3) データチャネル I F (27 h) のフレーマ（27 i ) は R PDを受け、データ中のパケットの抽出および展開を行い、更新データアドレス UA、更新データ UD、データオンリ属性 DOを設定し、更新データ受信信号 URを送信する。

(4) プロセッサバスブリッジ (27 b) の制御ロジック (27 c) は URを受け、リダイレクタ機能制御信号 F Cを設定する。リダイレクタ（ 27 d )は、それに応じ、 UAをキャッシュアドレス CAに、 UDをキャッシュデータ CD にエコーする。制御ロジック（27 c) にて他の処理が行われている場合一旦待機し、それが完了次第本処理を実行する。

(5) プロセッサバスブリッジ (27 b) の制御ロジック (27 c) はキヤッシュライト信号 CWを送信する。データオンリ属性 D〇を受信しているので、キュークリア信号 QCは送信しない。

(6)キャッシュライト信号 CWを受けた共有メモリキャッシュ（2711)は、 C A及び CDで指定される所望のデータを更新し、更新前の状態において該データが利用不可能な状態であった場合、利用不可能信号 NPを送信する。

(7) プロセッサバスブリッジ（27 b) の制御ロジック（27 c) は、全データ受信動作中に利用不能信号 NPを受信した回数を計測することで、共有メモリキャッシュの全領域が有効データでフィルされたことを認識すると、全データ受信動作を終了する。

(8) 全データ受信動作が終了したときに、保留されているプロセッサリード信号 PR、または、プロセッサライト信号 PWがあった場合には、 'その動作を開始する。

図 28は、本発明の実施形態の第 5の態様に基づくライトアクセス時の信号の流れを示す図である。

そのフローを以下に示す。

(1) プロセッサコア（28 a) が PA、 PD、 P Tを設定して P Wを送信。 (2) プロセッサバスブリッジ (28 b) の制御ロジック (28 c) はリダイレクタ機能制御信号 FCを設定する。リダイレクタ（28 d) はそれに応じ、プロセッサァドレス P Aを実効ァドレス E Aとキヤッシュアドレス C Aに、プ口セッサデータ P Dを実効データ ED及びキヤッシュデータ CDにエコーする <

(3) プロセッサバスブリッジ（28 b) の制御ロジック（28 c) は更新通知送信信号 NSを送信する。あわせて、 PAが規定のアドレス空間にある場合に即時更新属性送信信号 I Sを送信する。

(4) 更新通知バスブリッジ（28 e) の送信部（28 f ) は N Sを受け、 N Rを送信する。

(5) 更新バスプリッジ（28 e) の送信部（28 f ) が NGを受信し、更新通知バスを獲得する。

(6) 更新通知アドレス NAに EAが、即時更新属性信号 N Iに I Sが、即時更新データ N Dに E Dがそれぞれェコ一され、更新通知信号 N Vが全プロセッサに送信される。 NA、 ND、 NV、 N Iは自プロセッサの更新通知パスプリッジ監視部（28 g) にもループバックし受信される。

(7) 更新通知バスブリッジ（28 e) の監視部（28 g) は、 NVを N I と共に受信すると、即時更新信号 S I として自プロセッサ内にエコーする。他のプロセッサ上でも同じ動作が行われる。

(8) プロセッサバスブリッジ（2 8 b) の制御ロジック（28 c) は、リダィレクタ機能制御信号 FCを設定する。リダイレクタ（28 d)はそれに応じ、 SAを CAに、 SDを CDにエコーする。他のプロセッサ上でも同じ動作が行われる。この際プロセッサバスブリッジ（2 8 b) が別の処理を行っている場合、その処理の完了後にこの処理を最優先で行う。

(9) プロセッサバスブリッジ (2 8 b) の制御ロジック (28 c) は、キヤッシュライト信号 CWを送信し、これを受けた共有メモリキャッシュ（28 η) は C Αで指定される所望のデータを CDにて更新する。他のプロセッサ上でも同じ動作が行われる。

(1 0) プロセッサコアに ACKが送信され、プロセッサコア側のアクセスが完了する。

本発明の実施形態の第 6の態様に基づくライトアクセスは、特定アドレスへのライト時に予約データを用いるもので、そのフローは第 5の態様におけるラィトアクセスにほぼ準じる。以下の点が差分である。

(8) プロセッサバスブリッジ（28 b) のリダイレクタ（28 d) は、 SA がそのアクセスに予約データを用いる特定ァドレスと解釈される場合、 SDを無視し、 SAに対応する予約データを生成して CDに出力する。 . 産業上の利用可能性

以上の通り、共有メモリキャッシュを具備するプロセッサにより構成される共有メモリ型マルチプロセッサシステムにおいて、本発明の適用によりコヒーレンシ保証に必要な時間と、データ転送に必要な時間が明確に分離され、共有メモリ空間のアクセスにおいて従来技術に存在した問題が以下の点で解決される。

-バス占有時間の最小化と、不要なレイテンシ増大要因の排除

-データ転送経路のレイテンシ隠蔽と、これによる帯域拡大の容易化

これにより、共有メモリキャッシュの高速性を最大限に活用することが可能となり、共有メモリ空間アクセスの帯域とレイテンシの双方が改善され、システムの処理能力向上に寄与することができる。

Claims

請求の範囲

1 . それぞれが共有メモリキャッシュを備える複数のプロセッサと少なくとも 1つの共有メモリが相互に結合されたマルチプロセッサシステムにおいて、共有メモリ領域のデータの更新において、更新に用いるべきデータをプロセッサと共有メモリとの間で専用に送受する専用回線手段と、

データの更新通知を、各プロセッサに該更新通知を送信する権利を調停しながら、伝送するグローバルバス手段とを備え、

プロセッサからの該データの更新通知の送信と更新に用いるべきデータの送信を独立に行い、各プロセッサ及び共有メモリでは、更新通知の受信によって、該更新通知によって示されるァドレスへのアクセスを制限し、各プロセッサ及び共有メモリに到着した更新に用いるべきデータによって、共有メモリ領域の該ァドレスのデータが更新された後、該ァドレスへのアクセスを許可することを特徴とするマルチプロセッサシステム。

2 . 前記専用回線手段は、前記プロセッサからの回線を前記共有メモリに接続するリビータ手段を備えることを特徴とする請求項 1に記載のマルチプロセッサシステム。

3 . 前記専用回線手段は、前記複数のプロセッサのそれぞれに設けられた専用線からなることを特徴とする請求項 2に記載のマルチプロセッサシステム。

4 . 前記更新通知に複数の更新データを対応付け、 1度の更新で複数の更新データ単位の更新を行うことを特徴とする請求項 1に記載のマルチプロセッサシステム。

5 . 前記更新通知では、 1度の更新で更新に使うデータのサイズを可変とすることを特徴とする請求項 4に記載のマルチプロセッサシステム。

6 . 前記共有メモリ空間上の、キャッシュコヒーレンシの維持が必要ないデータの更新は、前記更新通知を送信することなく、該キャッシュコヒーレンシの維持が必要でないデータのァドレスに更新データを送信することによって、行うことを特徴とする請求項 1に記載のマルチプロセッサシステム。

7 . 前記マルチプロセッサシステムに新しいプロセッサが増設された場合、該プロセッサの共有メモリキヤッシュに、他のプロセッサの共有メモリキヤッシュの内容を転送し、その後に、該新しいプロセッサを運用することを特徴とする請求項 1に記載のマルチプロセッサシステム。

8 . 前記グローバルバス手段を用いて、更新通知と更新に使うべきデータを転送して、前記共有メモリ領域の更新を行う手段を更に備えることを特徴とする請求項 1に記載のマルチプロセッサシステム。

9 . 前記共有メモリ領域の特定のアドレスへのアクセスについては、前記更新通知のみを送受し、該更新通知を受け取ったプロセッサあるいは共有メモリは、予め定められたデータを用いて、該ァドレスの更新を行うことを特徴とする請求項 1に記載のマルチプロセッサシステム。

1 0 . それぞれが共有メモリキャッシュを備える複数のプロセッサと共有メモリが相互に結合されたマルチプ口セッサシステムにおけるメモリアクセスを高速化する方法において、

共有メモリ領域のデータの更新において、更新に用いるべきデータをプロセッサと共有メモリとの間で専用に送受する専用回線を設けるステップと、データの更新通知を、各プロセッサに該更新通知を送信する権利を調停しながら、伝送するグ口一バルバスを設けるステップと、

プロセッサからの該データの更新通知の送信と更新に用いるべきデータの送信を独立に行い、各プロセッサ及び共有メモリでは、更新通知の受信によって、該更新通知によって示されるァドレスへのアクセスを制限し、各プロセッサ及び共有メモリに到着した更新に用いるべきデータによって、共有メモリ領域の該ァドレスのデータが更新された後、該ァドレスへのァクセスを許可するステップと、、

を備えることを特徴とする方法。