JPH06124242A - 二重化共有メモリ等価性保証方式 - Google Patents

二重化共有メモリ等価性保証方式

Info

Publication number
JPH06124242A
JPH06124242A JP4271671A JP27167192A JPH06124242A JP H06124242 A JPH06124242 A JP H06124242A JP 4271671 A JP4271671 A JP 4271671A JP 27167192 A JP27167192 A JP 27167192A JP H06124242 A JPH06124242 A JP H06124242A
Authority
JP
Japan
Prior art keywords
shared memory
module
processor module
memory module
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4271671A
Other languages
English (en)
Inventor
Toshio Ogawa
敏男 小川
Akira Kabemoto
章 河部本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4271671A priority Critical patent/JPH06124242A/ja
Publication of JPH06124242A publication Critical patent/JPH06124242A/ja
Priority to US08/942,724 priority patent/US6237108B1/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 最小限の複写量で等価性を保証する。 【構成】 プロセッサモジュールPM#1が共有メモリ
モジュールSSM#0にデータを書き込んだ後、同じデ
ータを共有メモリモジュールSSM#1に書き込みの
際、プロセッサモジュールPM#0はPM#1を監視
し、PM#1が異常終了して停止した場合、PM#0は
データの最初のアドレスをPM#1より読み出し、その
アドレスのデータをSSM#0より読み出してSSM#
1に複写する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数のプロセッサと複
数の共有メモリを有するシステムにおける共有メモリの
二重化の等価性を保証する方式に関する。
【0002】
【従来の技術】FTC(フォールトトレラントコンピュ
ータ)では、共有メモリの二重化は、データの保全のた
めに必須である。この二重化された共有メモリモジュー
ルのデータ等価性が失われる要因は基本的に次の3種存
在する。
【0003】第一に、プロセッサモジュールから、共有
メモリモジュールへの書き込みアクセスが、一方の共有
メモリモジュールでは正常終結して書き込みが完了し、
他方の共有メモリモジュールでは異常終結して未書き込
みで終わった場合である。この場合には、書き込みアク
セス元のプロセッサモジュールは動作継続中であり、こ
のプロセッサモジュールが書き込みアクセスに失敗した
アドレス部のデータを、責任をもってリカバリすれば良
い。
【0004】第二に、二重化された共有メモリモジュー
ル(の一方)が、共有メモリモジュール自身の矛盾によ
り正常動作不可能と判断し、保存データの保証が出来な
くなり、HALTした場合である。ここで共有メモリモジュ
ール自身の矛盾とは、ハード的暴走状態となり論理矛盾
を生じている場合である。具体的には、システムバスへ
の接続ユニットである後述するSBC−S内のシーケン
サ異常や共有メモリユニット中にあるメモリコントロー
ラのシーケンサ異常等である。
【0005】この場合には、HALTした共有メモリモジュ
ール内のデータは全く信用出来ない。このタイプのリカ
バリ方法としては、HALTした共有メモリモジュールを正
常動作可能状態(一時的な要因によるHALTであればリセ
ットをかけHALTを解除、恒久的な要因によるHALTであれ
ば共有メモリモジュールの交換等による)にし、正常側
の共有メモリモジュールからHALT側共有メモリモジュー
ルへのデータの全複写しかない。
【0006】しかし、この全複写においては共有メモリ
モジュールの容量が大きければ当然時間がかかり、複写
アクセスにシステムバスをかなり占有する。しかも他の
プロセッサモジュールから全複写中の二重化ペアの共有
メモリモジュールに書き込みアクセスを行った場合、複
写アクセスとの競合により、全複写終了時に既に等価性
が失われていることになりかねない。しかしながら、共
有メモリモジュールのHALTは、ハードウェアエラー要因
が殆どであり、頻度も極めて希である。更に、ハードウ
ェアエラー要因によるHALTの場合、共有メモリモジュー
ルの交換が多く、当然この交換の場合は、全複写しかリ
カバリ手段はない。
【0007】第三は、複数のプロセッサモジュール中の
あるプロセッサモジュールが共有メモリモジュールに書
き込み中にHALTの場合である。つまり、このHALTしたプ
ロセッサモジュールが二重化された共有メモリモジュー
ルアクセス中にHALTし、一方共有メモリモジュールには
書き込みが完了し、他方のメモリモジュールでは書き込
みが完了しなかった場合である。これまでは、このよう
な1つのプロセッサモジュールのHALTに際して、二重化
共有メモリアクセスを行っていたかどうかが不明のため
二重化共有メモリモジュールの等価性の有無もまた不明
であった。つまり、従来は、二重化共有メモリアクセス
を行なっていないプロセッサモジュールがHALTしても、
二重化共有メモリモジュールの等価性は不明としてい
た。
【0008】等価性の有無が不明であれば、等価性無し
とみなさざるを得ず、リカバリを行うために、共有メモ
リモジュールのHALT時と同様に、一方の共有メモリモジ
ュールから、他方の共有メモリモジュールへデータの全
複写を行っていた。この全データ複写にあたっては、前
述のような問題(時間がかかる、システムバスの占有、
複写中の該当共有メモリモジュールへのアクセスの禁
止)が存在する。しかもプロセッサモジュールにおいて
は、ハードウェア要因のHALTのみでなく、ソフトウェア
要因のHALT(実際にはソフトウェア要因のHALTが殆ど)
があり、共有メモリモジュールのHALTに比較して、かな
り発生頻度が高い。
【0009】
【発明が解決しようとする課題】本発明は、前記第三の
要因である複数のプロセッサモジュール中のあるプロセ
ッサモジュールがHALTした場合の問題点に鑑みてなされ
たもので、プロセッサモジュールのHALTにあたって、二
重化された共有メモリモジュールの等価性を明確にし、
等価性が存在するにもかかわらず、ただ等価性が不明と
いうだけで全複写形式のリカバリを行うことを避け、更
に等価性が失われている場合にも、等価性が失われてい
る部分のみの複写で済ませ、全複写は行わないことをも
って、システムとしての一時的な性能低下を防ぐ事を目
的とする。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、中央処理ユニットとシステムバスへの接続ユニット
を有する複数のプロセッサモジュールと、共有メモリユ
ニットと前記システムバスへの接続ユニットを有する複
数の共有メモリモジュールとを有し、前記プロセッサモ
ジュールのうち第1プロセッサモジュールが前記共有メ
モリモジュールのうちの第1共有メモリモジュールにデ
ータを書き込んだ後、前記共有メモリモジュールのうち
第2共有メモリモジュールに前記データを書き込む際の
二重化共有メモリ等価性保証方式において、前記プロセ
ッサモジュールのうちの第2プロセッサモジュールが前
記第1プロセッサモジュールの状態を監視し、この第1
プロセッサモジュールが停止した場合書き込み動作を終
了したか否かを検出するようにしたものである。
【0011】また、前記第2プロセッサモジュールが、
前記書き込み動作の終了が正常終了か異常終了かを検出
するようにしたものである。
【0012】また、前記第2プロセッサモジュールは、
前記第1プロセッサモジュールが停止して前記データの
書き込みが前記異常終了であるとき、前記データの最初
のアドレスを前記第1プロセッサモジュールより読み出
して、前記第1共有メモリモジュールより前記データの
最初のアドレスより前記データを前記第2共有メモリモ
ジュールに複写するようにしたものである。
【0013】また、前記第2プロセッサモジュールの動
作は、前記第1プロセッサモジュールの前記第1共有メ
モリモジュールと前記第2共有メモリモジュールへの同
期転送、非同期転送を行うアクセス形式ごと行なわれる
ようにしたものである。
【0014】
【作用】第1プロセッサモジュールがあるデータを第1
共有メモリモジュールに書き込んだ後、同じデータを二
重化のため第2共有メモリモジュールに書き込む場合、
第2プロセッサモジュールは第1プロセッサモジュール
の状態を監視し、第1プロセッサモジュールが停止した
とき、既に書き込み動作は終了していたかを検出する。
従来は二重化のため共有メモリモジュールへの書き込み
が行なわれているとき、第1プロセッサモジュール以外
のプロセッサモジュールが停止してもその二重化メモリ
の等価性が不明として全複写をしていたが、本発明では
停止したプロセッサモジュールが二重化していた共有メ
モリモジュールに関係していたか否かを明らかにする。
【0015】第2プロセッサモジュールの書き込み終了
が正常終了であったか、異常終了であったかを検出する
ことにより、正常終了であれば二重化は正しく行なわれ
たことがわかり、異常終了であれば、書き込んだデータ
について、第1共有メモリモジュールと第2共有メモリ
モジュールの等価性がないことがわかる。
【0016】第2プロセッサモジュールは異常終了であ
ることを検出したときは、第1プロセッサモジュールよ
り第2共有メモリモジュールに書き込んだデータの最初
のデータのアドレスを読み出し、このアドレスで第1共
有メモリモジュールにアクセスしてこのアドレスより始
まるデータを読み出して第2共有メモリモジュールに複
写する。これにより異常の生じたデータのみを複写する
だけなので二重化メモリの等価性のリカバリに要する時
間を短時間にすることができる。
【0017】プロセッサモジュールと共有メモリモジュ
ールとのデータ転送の方法として、プロセッサモジュー
ルがプログラムに従って転送する同期転送とDMA転送
のようにプロセッサモジュールのプロセッサと非同期な
転送とがあるが、上述したデータ書き込みの終了、終了
が異常終了であったか正常終了であったかの判別、異常
終了の場合に、その異常データについて正常なデータの
記憶されている第1共有メモリモジュールより第2共有
メモリモジュールへ正しいデータの複写を行うことは、
同期転送、非同期転送のいずれの場合でも実施可能であ
る。
【0018】
【実施例】以下、本発明の実施例を図面を参照して説明
する。図1は、本発明の共有メモリ構成方式が適用され
るマルチプロセッサシステムの一部を示したシステム構
成図である。図1において、マルチプロセッサシステム
は、複数個のプロセッサモジュール(PM)1と、複数個
の共有メモリモジュール(SSM )2を有し、各プロセッ
サモジュール1と共有メモリモジュール2は、共有シス
テムバス(SSBUS )3に接続ユニット(SBC −P 、SBC
−S )を通して接続される。
【0019】共有システムバス3は、共有システムバス
ハンドラ(SSBH)5により制御され、共有システムバス
3のアービトレーションは、共有システムバスハンドラ
5が集中管理する。また、各プロセッサユニット1はI
/OバスIOBUS 4に接続ユニット(IBC −P )を通して
接続される。I/Oバス4も共有システムバス3と同様
にI/Oバスハンドラ(IOBH)6により制御され、I/
Oバス4のアービトレーションは、I/Oバスハンドラ
6が集中管理する。共有システムバス3は、各プロセッ
サユニット1の共有メモリモジュール2のアクセスに使
用され、I/Oバス4は各プロセッサユニット1からの
外部装置アクセス及び各プロセッサユニット1間のアク
セスに使用される。
【0020】図2は図1に示したプロセッサユニット1
の構成図である。プロセッサユニット1内には中央処理
ユニット(μP)10、各プロセッサユニット1に固有の
ローカルなメインメモリユニット(LSU)11、及び共
有システムバス3へのバス接続ユニット(SBC−P)
12とI/Oバス4へのバス接続ユニット(IBC−P)
13が内部バス14を介して設けられている。
【0021】図3は、図1に示した共有メモリモジュー
ル2の構成図である。共有メモリモジュール2には、共
有メモリユニット(SSU)15と、共有システムバス3
に対する接続ユニット(SBC−S)16が内部バス17を
介して設けられる。共有メモリモジュール2には、複数
のプロセッサモジュール1で共有化が必要なデータが格
納される。
【0022】図4は図2のプロセッサユニット1に設け
た共有システムバス3への接続ユニット(SBC−P)
12の構成図である。SBC−P12は、共有システムバス
3を介して、共有メモリモジュール2に対し ソフトウェアに基づく中央処理ユニット10の命令によ
り、物理アドレスで直接アクセスするプログラムモード
と、 アクセスすべき共有メモリモジュール2を選択し、対
象共有メモリモジュール2内のアクセスアドレスと転送
長を指示してプロセッサユニット1と共有メモリモジュ
ール2間のデータ転送を起動するDMAモードの2モー
ドによるアクセスを行う。
【0023】SBC−P12は、これらの2つのアクセス
モードに対応してプログラムモードアクセス制御回路2
0,DMAモードアクセス制御回路21,共有システムバ
ス3との送受信回路22及びバッファとして機能するデュ
アルポートRAM23,プロセッサモジュール1の状態
と、二重化共有メモリモジュール2へアクセス中であっ
たかを示すレジスタEPST24によって構成される。
【0024】ここで、プログラムモードアクセス制御回
路20には、アドレスデゴーダ25、タイミング制御回路2
6、プログラムモード制御レジスタ27、最終共有メモリ
モジュールアクセスアドレスを示すレジスタEPSSAP28が
設けられ、DMAモードアクセス制御回路21には、アド
レス発生器29、タイミング制御回路30、DMA制御レジ
スタ31、及び最終共有メモリモジュールアクセスアドレ
スを示すレジスタEPSSAS32が設けられる。
【0025】タイミング制御回路26,30は次のような働
きをする。 デュアルポートRAM23へのアクセスを調整する。 デュアルポートRAM23自体のタイミング制御を行
う。 内部バス14とデータの送受信するとき、バスの制御信
号等のタイミング制御をする。
【0026】図5は、図2のプロセッサユニット1に設
けた接続ユニットIBC−P13の構成図である。IBC
−P13は、I/Oバス4を介して、 外部装置へのI/Oアクセス 他プロセッサユニット1へのアクセス の2モードによるアクセスを行う。IBC−P13は、こ
れらの2つのアクセスモードに対応してI/Oアクセス
制御回路33、他プロセッサモジュールアクセス制御回路
34、I/Oバス4との送受信回路35及びバッファとして
機能するデュアルポートRAM36によって構成される。
ここで、I/Oアクセス制御回路33には、アドレス発生
器37、タイミング制御回路38、I/O制御レジスタ39が
設けられ、他プロセッサモジュールアクセス制御回路34
には、アドレス発生器40、タイミング制御回路41、及び
他プロセッサモジュールアクセス制御レジスタ42が設け
られる。
【0027】図6は、図3に示した共有メモリモジュー
ル2に設けた接続ユニットSBC−S16の構成図であ
る。SBC−S16は、DMA制御回路43、共有システム
バス3との送受信回路44及びバッファとして機能するデ
ュアルポートRAM45によって構成される。DMA制御
回路43は、アドレス発生器46及びタイミング制御回路4
7、内部バス制御回路48を備えている。
【0028】共有システムバス3、I/Oバス4のバス
制御においては、各プロセッサモジュール1,共有メモ
リモジュールごとにユニットID(UID)を割付け、
UIDをバス上のモジュール識別子とする。
【0029】図7に起動転送コマンド(SC)と応答転
送コマンド(EC)の例を示す。SCにおいて、DID
(Destination ID)は受信先のモジュールのユニットI
Dであり、SID(Source ID )は送信元モジュールユ
ニットIDである。オペランドはアクセス種類を示す。
アクセス種類としては、共有メモリモジュール2に対す
るメモリアクセス、I/Oアクセス、共有メモリモジュ
ール2/他プロセッサモジュール1に対するリセット指
示等の構成制御レジスタアクセス等がある。更に、BC
T(Byte Count)は、各アクセスにおけるデータ容量を
示す。また、応答転送コマンド(EC)におけるDI
D、SIDはSCと同じであるが、終結コードは、アク
セス先における終結状態(正常終結か、あるいは異常終
結の場合はそのエラー要因をコード化したもの)を示
す。
【0030】図8(a)は、共有メモリモジュール2か
らプロセッサモジュール1にデータを読み出すフェッチ
アクセスのバス動作説明図である。先ずアクセス元のプ
ロセッサモジュール1は、SCを作成する。即ち自己の
UIDを示すSID、アクセス先の共有メモリモジュー
ル2のUIDを示すDID、メモリ読み出しアクセスを
示すオペランド、アクセス容量を示すBCTによってS
Cを作成する。プロセッサモジュール1は、SCに続い
て、アクセス先の共有メモリモジュール2上のアクセス
アドレス(A)を送信する。
【0031】受信側の共有メモリモジュール2は、共有
システムバス3を監視し、SCに含まれる受信先を示す
DIDと自UIDを比較し、両者が一致した場合に受信
動作を行う。受信動作を行った共有メモリモジュール2
は、共有メモリモジュール2内の共有メモリユニットS
SU15に読み出しアクセスを行う。SSU15からの読み
出しアクセス終了後、共有メモリモジュール2は読み出
しアクセス終結コードを含め、転送方向が起動転送と応
答転送では逆のためDIDとSIDを交換したECを作
成してアクセス元のプロセッサモジュール1に対して送
信する。更に、ECに続いて読み出しデータをアクセス
元のプロセッサモジュール1に対して送信する。
【0032】アクセス元のプロセッサモジュール1は、
共有システムバス3を監視し、EC中のDIDが自UI
Dと一致した場合に受信動作を行い、1回のアクセスを
終了する。このSC送信終了後からECの送信開始迄の
空時間については、他のプロセッサモジュール1からの
共有メモリモジュール2へのアクセスに使用できる。
【0033】図8(b)は、共有システムバス3によ
り、プロセッサモジュール1から共有メモリモジュール
2にデータを転送して書き込むストアアクセスのバス動
作説明図である。先ずアクセス元のプロセッサモジュー
ル1は、SCを作成する。即ち自己のUIDを示すSI
D、アクセス先の共有メモリモジュール2のUIDを示
すDID、メモリ書き込みアクセスを示すオペランド、
アクセス容量を示すBCTによってSCを作成する。プ
ロセッサモジュール1は、SCに続いて、アクセス先の
共有メモリモジュール2上のアクセスアドレス(A)、
及び書き込みデータ(D)を送信する。
【0034】受信側の共有メモリモジュール2は、共有
システムバス3を監視、SCに含まれる受信先を示すD
IDと自UIDを比較し、両者が一致した場合に受信動
作を行う。受信動作を行った共有メモリモジュール2
は、共有メモリモジュール2内の共有メモリユニットS
SU15に書き込みアクセスを行う。SSU15への書き込
みアクセス終了後、共有メモリモジュール2は書き込み
アクセス終結コードを含め、転送方向が起動転送と応答
転送では逆のためDIDとSIDを交換したECを作成
してアクセス元のプロセッサモジュール1に対して送信
する。アクセス元のプロセッサモジュール1は、共有シ
ステムバス3を監視し、EC中のDIDが自UIDと一
致した場合に受信動作を行い、1回のアクセスを終了す
る。
【0035】図9はプロセッサモジュール1から二重化
共有メモリモジュール2にデータを転送して書き込む二
重化書き込みストアアクセスのバス動作説明図である。
1回目のアクセスは、図8(b)に示した普通の書き込
みストアアクセスと同様であるが、1回目のアクセス正
常終了後、SC中のDIDの最下位ビットを反転し、二
重化された共有メモリモジュール2へ2回目の書き込み
アクセスを行う。
【0036】SC中のDIDの最下位ビットを反転する
のは次の理由による。二重化を行う一方の共有メモリモ
ジュール2のDIDを例えば、「100」とし、他方の
共有メモリモジュール2のDIDのDIDを「101」
とする。これにより「100」の最下位ビット「0」を
反転することにより「101」が得られる。
【0037】プロセッサモジュール1から共有メモリモ
ジュール2へのアクセス方法として、プログラムモー
ド、DMAモードアクセスがあるが、各アクセス方法の
違いは、プロセッサモジュール1内の接続ユニットSB
C−P12での処理の差であり、いずれのアクセスにおい
ても、共有システムバス3/共有メモリモジュール2上
の動作は同じである。また、I/Oバス4上のアクセス
も基本動作は同じである。
【0038】図10は図4におけるレジスタEPSTS24 レジ
スタEPSSAP28、レジスタEPSSAS32の表示内容を説明する
図である。(a)はレジスタEPSTS の表示内容を示す。 PS(PM STATUS )はアクセス対象となるプロセッサ
モジュール1の状態、つまりHALTしているかいないかを
0と1で表現する。 SBHT(SBC HALT)はアクセス対象になるプロセッ
サモジュール1の接続ユニットSBC−P12の状態、つ
まりHALTしているか、いないかを示す。 PAT(P−PORT ACTIVE )はアクセス対象となるプ
ロセッサモジュール1のプログラムモードアクセスが現
在動作中であるか否かを示す。 SAT(S−PORT ACTIVE )はアクセス対象となるプ
ロセッサモジュール1のDMAアクセスが現在動作中で
あるか否かを示す。 SUCP(SSU −UNMATCH P−PORT)は最後にプログ
ラムモードで二重化アクセスをした共有メモリモジュー
ル2の等価性が保証されたか否かを表わす。 SUCS(SSU −UNMATCH S−PORT)は最後にDMA
モードで二重化アクセスをした共有メモリモジュール2
の等価性が保証されたか否かを表わす。
【0039】図11は図1に示すマルチプロセッサシステ
ムに接続されたプロセッサモジュール1相互の関係を説
明する図である。システムに接続されるプロセッサモジ
ュール1は他のプロセッサモジュール1のレジスタEPST
S24 ,レジスタEPSSAP28,レジスタEPSSAS32を互にポー
リングしている。ただし、プロセッサモジュール1の数
が多くなった場合は、マスタープロセッサモジュール1
を設け、他のプロセッサモジュール1をポーリングし、
他のプロセッサモジュール1の内の1つがマスタープロ
セッサモジュール1をポーリングするようにした方がよ
い。
【0040】ここで、レジスタEPSTS24 はそのレジスタ
24を有するプロセッサモジュール1の状態、二重化共有
メモリモジュールアクセス中にHALTしたかを示し、レジ
スタEPSSAP28、レジスタEPSSAS32は最後にアクセスした
共有メモリモジュール2と、その内部アドレスを示す。
これらのレジスタに定期的ポーリングすることにより、
マスタープロセッサモジュール1は、このレジスタを有
するプロセッサモジュール1が正常動作中か、HALT中か
を判断する。さらに、HALT中の場合は、そのHALTしたプ
ロセッサモジュール1のアクセスによって二重化共有メ
モリモジュール2の等価性が保たれているかを判断す
る。
【0041】PAT/SATは現在アクセス中であるこ
とを示す。つまり、このレジスタを有するプロセッサモ
ジュール1がHALTしていたら、新たに共有メモリモジュ
ール2をアクセスすることはないが、HALT前のアクセス
における共有メモリモジュールからのECを待っている
状態などであることを示す。二重化アクセスをした共有
メモリモジュール2の等価性の保証は、アクセス終了後
でなければ得られない。これは図8(b)に示すECの
終結コードが正常終了であることを確認した後に初めて
等価性の保証が得られるからである。このためPAT/
SATはアクセス終了迄WAITするために使用する。
【0042】SBHTにより、接続ユニットSBC−P
12がHALTしている場合には、SBC−P12が内部自己矛
盾を検出した事が原因であるため、二重化共有メモリモ
ジュールの等価性は判断不能である。このため、SBC
−P12がHALTした場合のリカバリは、二重化共有メモリ
モジュールの全複写が必要である。
【0043】このSBC−P12の内部自己矛盾とは、例
えば内部シーケンサの異常などである。各LSIは自己
動作のチェック回路があり、常に自己監視をしている。
この自己矛盾が発生すると、例えばSBC−P12が共有
システムバス3に命令を発行していないのに、正常終了
したと中央処理ユニット10に報告したり、余分な書き込
みアクセスなどを行う。つまり暴走状態になってしまう
ので、等価性の判断は不可能となる。
【0044】図10に戻り、(b)はレジスタEPSSAP28、
(c)はレジスタEPSSAS32を表わす。SSUA(SUU −ACCE
SS ADRS )は最後にプロセッサモジュール1がアクセス
した共有メモリモジュール2上の内部アドレスを4KB
単位で表示する。またDID(Destination UID)は
SSUAA に対応する共有メモリモジュール2のUIDを表
示する。
【0045】このレジスタ(ESPSSAP /EPSSAS)28,32
はそれぞれのアクセスモードおける最後にアクセスした
共有メモリモジュール2のDID(SC,ECにおける
DIDと同じ)と、その共有メモリモジュール2内アド
レスを4KB単位に表示するSSUAA で構成される。この
レジスタは28,32、レジスタEPSTS24 によってあるプロ
セッサモジュール1のHALTが検出され、更にSBC−P
12はHALTしておらず、該当モードによるアクセスは動作
中でなく、かつ二重化共有メモリモジュール1の等価性
が無くなっている場合に参照され、DIDの示す共有メ
モリモジュール2のSSUAA の示す4KBの領域の複写に
よるリカバリに使用される。
【0046】図12はプロセッサモジュールPM#1がHA
LTし、プロセッサモジュールPM#0が二重化共有メモ
リモジュールSSM#0,SSM#1のリカバリを行う
構成図であり、図13はそのフローチャートを示す。PM
#0の中央処理ユニットMPU10はプログラムに従って
PM#1のSBC−P12に存在するレジスタEPSTS24を
I/Oバス4経由でポーリングし、PM#1の状態を監
視する(ステップ50)。このときPM#1もまたPM#
0を監視している。PM#0はPM#1のHALTを検出す
ると(ステップ51)、SBC−P12が正常か否かを示す
SBHTを参照し、SBC−P12がHALTしていないかチェッ
クする(ステップ52)。PM#1のSBC−P12がHALT
している場合には、共有システムバス3を使用し、PM
#0の制御下で二重化共有メモリモジュールの全複写、
つまりSSM#0の内容をSSM#1に全て複写する
(ステップ53)。
【0047】SBC−P12がHALTしていない場合には、
PAT,SATが動作終了を示すまでWAITする(ステッ
プ54,55)。プログラムモード、DMAモードのアクセ
ス終了後、先ずプログラムモードアクセスによる二重化
共有メモリモジュールの等価性の判断をSUCPを参照し、
二重化共有メモリモジュール2の内容が等価性を有して
いないときは(ステップ56)、レジスタEPSSAP28を読み
出し(ステップ57)、そのDIDで示されている共有メ
モリモジュール2のSSUAA で示された4KB領域を共有
システムバス3を使用し、PM#0の制御下で二重化さ
れたSSM#0よりSSM#1に複写する(ステップ5
8)。さらにDMAモードアクセスにより二重化共有メ
モリモジュール2の等価性の判断をSUCSを参照して判断
し(ステップ59)、二重化共有メモリモジュールの内容
が等価性を有していないときは、レジスタEPSSA32 を読
み出し(ステップ60)、そのDIDで示される共有メモ
リモジュール2のSSUAA で示された4KB領域を共有シ
ステムバス3を使用し、PM#0の制御下で二重化され
たSSM#0よりSSM#1へ複写する(ステップ6
1)。
【0048】
【発明の効果】以上の説明より明らかなように本発明
は、二重化共有メモリモジュールに書き込み中プロセッ
サモジュールを監視しHALTした場合に書き込み動作が正
常に行なわれたか否か調べ、異常終了した場合、異常終
了したデータのみ正常な二重化共有メモリモジュールよ
り複写するようにしたので、複写量を少くすることがで
きる。
【図面の簡単な説明】
【図1】本発明の実施例のマルチプロセッサシステムを
示す図である。
【図2】プロセッサモジュール構成図である。
【図3】共有メモリモジュール構成図である。
【図4】プロセッサモジュール内蔵の共有システムバス
接続ユニットの構成図である。
【図5】プロセッサモジュール内蔵のI/Oバス接続ユ
ニットの構成図である。
【図6】共有メモリモジュール内蔵の共有システムバス
接続ユニットの構成図である。
【図7】システムバス上の転送コマンド説明図である。
【図8】読み出し/書き込み転送バス動作説明図であ
る。
【図9】二重化共有メモリモジュール書き込み転送バス
動作説明図である。
【図10】レジスタEPSTS , EPSSAP,EPSSASの内容を説
明する図である。
【図11】プロセッサモジュール間のポーリングを説明
する図である。
【図12】実施例の動作を説明するための構成図を示
す。
【図13】実施例の動作フロー図である。
【符号の説明】
1 プロセッサモジュール 2 共有メモリモジュール 3 共有システムバス 4 I/Oバス 10 中央処理ユニット 12 接続ユニットSBC−P 15 共有メモリユニット 24 レジスタEPSTS 28 レジスタEPSSAP 32 レジスタEPSSAS

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 中央処理ユニットとシステムバスへの接
    続ユニットを有する複数のプロセッサモジュールと、共
    有メモリユニットと前記システムバスへの接続ユニット
    を有する複数の共有メモリモジュールとを有し、前記プ
    ロセッサモジュールのうち第1プロセッサモジュールが
    前記共有メモリモジュールのうちの第1共有メモリモジ
    ュールにデータを書き込んだ後、前記共有メモリモジュ
    ールのうち第2共有メモリモジュールに前記データを書
    き込む際の二重化共有メモリ等価性保証方式において、
    前記プロセッサモジュールのうちの第2プロセッサモジ
    ュールが前記第1プロセッサモジュールの状態を監視
    し、この第1プロセッサモジュールが停止した場合書き
    込み動作を終了したか否かを検出するようにしたことを
    特徴とする二重化共有メモリ等価性保証方式。
  2. 【請求項2】 前記第2プロセッサモジュールが、前記
    書き込み動作の終了が正常終了か異常終了かを検出する
    ようにしたことを特徴とする請求項1記載の二重化共有
    メモリ等価性保証方式。
  3. 【請求項3】 前記第2プロセッサモジュールは、前記
    第1プロセッサモジュールが停止して前記データの書き
    込みが前記異常終了であるとき、前記データの最初のア
    ドレスを前記第1プロセッサモジュールより読み出し
    て、前記第1共有メモリモジュールより前記データの最
    初のアドレスより前記データを前記第2共有メモリモジ
    ュールに複写するようにしたことを特徴とする請求項2
    記載の二重化共有メモリ等価性保証方式。
  4. 【請求項4】 前記第2プロセッサモジュールの動作
    は、前記第1プロセッサモジュールの前記第1共有メモ
    リモジュールと前記第2共有メモリモジュールへの同期
    転送、非同期転送を行うアクセス形式ごと行なわれるこ
    とを特徴とする請求項1〜3のいずれかに記載の二重化
    共有メモリ等価性保証方式。
JP4271671A 1992-10-09 1992-10-09 二重化共有メモリ等価性保証方式 Pending JPH06124242A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP4271671A JPH06124242A (ja) 1992-10-09 1992-10-09 二重化共有メモリ等価性保証方式
US08/942,724 US6237108B1 (en) 1992-10-09 1997-10-02 Multiprocessor system having redundant shared memory configuration

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4271671A JPH06124242A (ja) 1992-10-09 1992-10-09 二重化共有メモリ等価性保証方式

Publications (1)

Publication Number Publication Date
JPH06124242A true JPH06124242A (ja) 1994-05-06

Family

ID=17503262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4271671A Pending JPH06124242A (ja) 1992-10-09 1992-10-09 二重化共有メモリ等価性保証方式

Country Status (1)

Country Link
JP (1) JPH06124242A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100810009B1 (ko) * 2005-12-22 2008-03-07 인터내셔널 비지네스 머신즈 코포레이션 반동기식 메모리 복사 동작에서 사용되는 어드레스 범위의유효성

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100810009B1 (ko) * 2005-12-22 2008-03-07 인터내셔널 비지네스 머신즈 코포레이션 반동기식 메모리 복사 동작에서 사용되는 어드레스 범위의유효성

Similar Documents

Publication Publication Date Title
US4958273A (en) Multiprocessor system architecture with high availability
US5255367A (en) Fault tolerant, synchronized twin computer system with error checking of I/O communication
US5423044A (en) Shared, distributed lock manager for loosely coupled processing systems
US4757442A (en) Re-synchronization system using common memory bus to transfer restart data from non-faulty processor to failed processor
JP3645281B2 (ja) 共用メモリを有するマルチプロセッサ・システム
US20090044044A1 (en) Device and method for correcting errors in a system having at least two execution units having registers
JP3807250B2 (ja) クラスタシステム、コンピュータ及びプログラム
JPS63238634A (ja) 分散多重処理トランザクション処理システム
US6237108B1 (en) Multiprocessor system having redundant shared memory configuration
JPH01154243A (ja) 耐欠陥性でない要素と耐欠陥性システムとのインターフェイス
JP2000181887A (ja) 情報処理装置における障害処理方法及び記憶制御装置
US4858234A (en) Method and apparatus for error recovery in a multibus computer system
JP4182948B2 (ja) フォールト・トレラント・コンピュータシステムと、そのための割り込み制御方法
US4837767A (en) Bus adapter module with improved error recovery in a multibus computer system
JP4161276B2 (ja) フォルトトレラントコンピュータ装置およびその同期化方法
KR20050054940A (ko) 동기 또는 비동기 클록킹된 처리 유닛을 동기화하기 위한방법 및 회로장치
JP3052857B2 (ja) クラスタ間共有メモリアクセス方式
JPH06242979A (ja) 二重化コンピュータ装置
US7243257B2 (en) Computer system for preventing inter-node fault propagation
JPH06124242A (ja) 二重化共有メモリ等価性保証方式
JP5748214B2 (ja) 二重化情報処理システム
JP3141948B2 (ja) 計算機システム
JP3696689B2 (ja) 情報処理システムのメモリコピー装置
JP2906197B2 (ja) 二重化バス装置
JPH06259274A (ja) 二重系システム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000321