JPH06282496A - 二重化共有メモリにおける排他制御命令のリカバリ方法 - Google Patents

二重化共有メモリにおける排他制御命令のリカバリ方法

Info

Publication number
JPH06282496A
JPH06282496A JP5068265A JP6826593A JPH06282496A JP H06282496 A JPH06282496 A JP H06282496A JP 5068265 A JP5068265 A JP 5068265A JP 6826593 A JP6826593 A JP 6826593A JP H06282496 A JPH06282496 A JP H06282496A
Authority
JP
Japan
Prior art keywords
shared memory
data
exclusive control
control instruction
memory module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5068265A
Other languages
English (en)
Other versions
JP2963298B2 (ja
Inventor
Hajime Takahashi
肇 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5068265A priority Critical patent/JP2963298B2/ja
Publication of JPH06282496A publication Critical patent/JPH06282496A/ja
Priority to US08/955,718 priority patent/US5903763A/en
Application granted granted Critical
Publication of JP2963298B2 publication Critical patent/JP2963298B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/17Interprocessor communication using an input/output type connection, e.g. channel, I/O port

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)
  • Memory System (AREA)

Abstract

(57)【要約】 【目的】 二重化共有メモリ・モジュールの書き換えを
伴う排他制御命令のリカバリの可能性を高め、システム
の信頼性、稼働率を向上させること。 【構成】 二重化された共有メモリ・モジュール2,
2’に対して、排他制御命令を実行すると、まず、主系
共有メモリ・モジュール2の排他制御領域のデータを読
み出し(同図の)、期待した値との一致を判別する。
一致している場合には、從系の共有メモリ・モジュール
2’への書き込みアクセスを行い(同図の)、つい
で、主系共有メモリ・モジュール2への書き換き込みア
クセスを行う(同図の)。また、その際、異常を検出
すると、主系共有メモリ・モジュールに対する書き込み
動作が行われていない場合には、その命令を再実行して
処理を続行する。また、上記書き込み動作が行われたこ
とを判別するフラグ2c,2c’を設けることにより、
再実行可能な場合を増加させることが可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数のプロセッサから
構成されるマルチ・プロセッサ・システムにおいて、複
数のプロセッサにより共有される二重化共有メモリの排
他制御命令のリカバリ方法に関する。複数のプロセッサ
がそれぞれに別の処理を実行することでシステム全体の
性能を高めるように構成されたマルチ・プロセッサ・シ
ステムにおいては、リソース(資源)の競合を回避する
目的などで、プロセッサ間の排他制御が必須となってく
る。
【0002】このような制御の実現方法として、全ての
プロセッサからアクセス出来る共有メモリ上に排他制御
用のエリアを設け、その内容によってリソースの使用権
を排他的に与える方式がある。この方式は全てのプロセ
ッサが同一の手順、即ち、先ず内容を読み出してから、
条件の一致によって書き込みを行うという手順を踏むこ
と、かつ、その一連の動作中に他のプロセッサのアクセ
スを割り込ませないことで実現される。さらに、共有メ
モリが二重化されている場合は、全てのプロセッサが読
み出しを行う共有メモリ・モジュールを同一にするこ
と、共有メモリ・モジュールの書き換えを行う場合に
は、二重化された両方に行うことが必要となる。
【0003】本発明は、上記のような二重化共有メモリ
・モジュールを備えた計算機システムにおいて、システ
ムの間欠障害等により排他制御命令が異常終結した際の
排他制御命令のリカバリ方法に関するものである。
【0004】
【従来の技術】図17は従来の二重化された共有メモリ
を持つ計算機システムにおける排他制御命令の実行動作
を示す図であり、同図はデータを書き込む場合を示して
いる。同図において、171、172は二重化された共
有メモリ・モジュールであり、共有メモリ・モジュール
171、172はそれぞれ、共有メモリ・ユニット17
1aと172aを備え、共有メモリ・ユニット171
a、172aはバス接続ユニット171b、172bを
介してシステム・バス173と接続されている。また、
共有メモリ・モジュール171のユニットIDはID=
0000000であり、共有メモリ・モジュール172
のユニットIDはID=0000001である。
【0005】174は処理モジュールであり、処理モジ
ュール174は中央処理ユニット174aとメイン・メ
モリ174bとシステム・バス173と中央処理ユニッ
ト174a等を接続するバス接続ユニット174cを備
えており、処理モジュールのユニットIDはID=11
00000である。図17において、処理モジュール1
74の中央処理ユニット174aが排他制御命令が実行
すると、まず、共有メモリ・モジュールの読み出し動作
がバス接続ユニット174cに認識され、バス接続ユニ
ット174cは、ID=0000000の主系共有メモ
リ・モジュール171の読み出しアクセスを行う。そし
て、上記、共有メモリ・モジュール171の排他制御領
域のデータを読み出し(リード・アクセス、同図の
R:Read)、処理モジュール174において期待し
た値との一致を判別し、一致しなければ、排他制御に失
敗したものとしてその命令を終了し、次の命令に進む。
【0006】また、一致している場合には、共有メモリ
・モジュール171、172の書き換え動作を開始す
る。バス接続ユニット174cがその書き換えを認識す
ると、まず、ID=0000000の主系の共有メモリ
・モジュール171への書き込みアクセスを行い(同図
のMW:MasterへのWrite)、正常終結し
た通知を受けてから、続けて、ID=0000001の
従系の共有メモリ・モジュール172への書き込みアク
セスを行う(同図のSW:SlaveへのWrit
e)。従系の共有メモリ・モジュール172への書き込
み完了通知を受けると、バス接続ユニット174cが中
央処理ユニット174aに対して完了を通知し、排他制
御命令が終了する。
【0007】上記バス接続ユニット174cは読み出し
アクセス、主系の共有メモリ・モジュール171の書き
込みアクセス、従系の共有メモリ・モジュール172の
書き込みアクセスのいずれにおいても、異常を検出する
と、中央処理ユニット174aに対してその命令に同期
した異常通知を行う。異常通知を受けた中央処理ユニッ
ト174aはその異常通知の内容を調べ、リカバリ可能
な場合には、その排他制御命令を再実行することで処理
を続行し、リカバリ不可能な場合には、中央処理ユニッ
ト174aが自ら動作不可と判断しHALT(停止)さ
せ、他の処理モジュールによるマクロなリカバリを行っ
ていた。
【0008】ここで、上記したリカバリ不可能な場合と
しては、主系の共有メモリ・モジュール171への書き
換えが行われたにもかかわらず、あるいは、主系の共有
メモリ・モジュール171への書き換えが保証できない
ような要因で、その排他制御命令が異常終結した場合で
あり、この場合には、その排他制御命令を再実行して
も、すでに主系の共有メモリ・モジュール171のデー
タは書き換えられているので、期待する値と一致するこ
とはない。
【0009】この様な状態が発生すると、その処理モジ
ュールの中央処理ユニットは自らをHALTさせ、他の
プロセッサによるリカバリを期待する。他の処理モジュ
ールはある処理モジュールの中央処理ユニットのHAL
Tを検出すると、その中央処理ユニットが獲得した排他
制御を解放する。すなわち、主系の共有メモリ・モジュ
ールの排他制御領域の内容を書き戻す。この処理によ
り、その資源は再び使用可能となる。また、HALTし
た中央処理ユニットの処理は、共有メモリ・モジュール
に格納された引き継ぎ情報によって他の中央処理ユニッ
トにより最初から再実行される。
【0010】
【発明が解決しようとする課題】上記のように、排他制
御アクセスの異常終結がリカバリ不可能な場合は、処理
モジュールをHALTさせ、他のプロセッサによりリカ
バリを行う必要があるなど、そのリカバリ処理が非常に
重くなるため、極力避けなければならない。本発明は上
記した問題点を解決するためになされたものであって、
二重化共有メモリ・モジュールを備えた計算機システム
において、主系の共有メモリ・モジュールの書き換えを
伴う排他制御命令の異常終結時のリカバリの可能性を高
め、システムの信頼性、稼働率を向上させた排他制御命
令のリカバリ方法を提供することを目的とする。
【0011】
【課題を解決するための手段】図1は本発明の原理ブロ
ック図であり、同図において、1は処理モジュール、1
aは処理モジュール1に設けられた中央処理ユニット、
1bはメイン・メモリ、1cは接続ユニット、2、2’
は共有メモリ・モジュール、2a、2a’は共有メモリ
・ユニット、2c、2c’は排他制御命令における読み
出し動作でセットされ、排他制御命令における書き換え
動作が正常に行われることでリセットされるフラグであ
る。
【0012】本発明の請求項1の発明は、図1に示す、
少なくとも、処理ユニット(1a)を備えた複数の処理モジ
ュール1と、少なくとも、共有メモリ・ユニット2a,
2a’を備えた複数の共有メモリ・モジュール2,2’
とから構成され、上記複数の共有メモリ・モジュール
2,2’の全てもしくは一部が二重化され、上記処理モ
ジュール1が、共有メモリモジュール2,2’にアクセ
スする計算機システムの排他制御命令のリカバリ方法に
おいて、処理モジュール1の中央処理ユニット1aが任
意の共有メモリ・モジュールのアドレスを指定して、そ
のアドレスからデータを読み出し、読み出しデータと上
記中央処理ユニット1aが期待するデータとの一致が判
別されたとき、そのアドレスのデータの書き換えを行う
排他制御命令を実行するに際して、上記二重化共有メモ
リ・モジュール2,2’のうち、主系となる一方の共有
メモリ・モジュール2からデータを読み出したのち、デ
ータの書き換えを行う際、データを読み出した二重化共
有メモリ・モジュール2の対となる従系の他方の共有メ
モリ・モジュール2’のデータを書き換えたのち、上記
一方の共有メモリ・モジュール2のデータを書き換え、
排他制御命令が異常終結した場合には、主系となる一方
の共有メモリ・モジュール2のデータが書き換えられた
か否かを判別して、上記排他制御命令を再実行するよう
にしたものである。
【0013】本発明の請求項2の発明は、少なくとも、
メイン・メモリ1bと、中央処理ユニット1aと、シス
テム・バス3への接続ユニット1cとを備えた複数の処
理モジュール1と、少なくとも、共有メモリ・ユニット
2a、2a’と、上記システム・バス3への接続ユニッ
ト2b、2b’とを備えた複数の共有メモリ・モジュー
ル2、2’とから構成され、上記複数の共有メモリ・モ
ジュール2、2’の全てもしくは一部が二重化された計
算機システムの排他制御命令のリカバリ方法において、
処理モジュール1の中央処理ユニット1aが任意の共有
メモリ・モジュールのアドレスを指定して、そのアドレ
スからデータを読み出し、読み出しデータと上記中央処
理ユニット1aが期待するデータとの一致が判別された
とき、そのアドレスのデータの書き換えを行う排他制御
命令を実行するに際して、上記二重化共有メモリ・モジ
ュール2、2’のうち、主系となる一方の共有メモリ・
モジュール2からデータを読み出したのち、データの書
き換えを行う際、データを読み出した二重化共有メモリ
・モジュール2の対となる従系の他方の共有メモリ・モ
ジュール2’のデータを書き換えたのち、上記一方の共
有メモリ・モジュール2のデータを書き換え、排他制御
命令が異常終結した場合には、主系となる一方の共有メ
モリ・モジュール2のデータが書き換えられたか否かを
判別して、上記排他制御命令を再実行するようにしたも
のである。
【0014】本発明の請求項3の発明は、請求項2の発
明において、排他制御命令における読み出し動作でセッ
トされ、排他制御命令における書き換え動作が正常に行
われることでリセットされる、各処理モジュール1から
読み出し可能なフラグ2c、2c’を各処理モジュール
1毎に独立して設け、排他制御命令が異常終結した際
に、排他制御命令を実行した処理モジュール1の中央処
理ユニット1aが、上記フラグを参照して主系となる一
方の共有メモリ・モジュール2のデータの書き換えが行
われたか否かを判断するようにしたものである。
【0015】
【作用】図1において、処理モジュール1の中央処理ユ
ニット1bが二重化された共有メモリ・モジュール2、
2’に対して、排他制御命令を実行すると、接続ユニッ
ト1cは、主系共有メモリ・モジュール2の読み出しア
クセスを行う。そして、上記、共有メモリ・モジュール
2の排他制御領域のデータを読み出し(同図の)、処
理モジュール2において期待した値との一致を判別し、
一致しなければ、排他制御に失敗したものとしてその命
令を終了し、次の命令に進む。
【0016】また、一致している場合には、共有メモリ
・モジュール2、2’の書き換え動作を開始し、まず、
從系の共有メモリ・モジュール2’への書き込みアクセ
スを行い(同図の)、正常終結した通知を受けてか
ら、続けて、主系の共有メモリ・モジュール2への書き
込みアクセスを行う(同図の)。また、主系の共有モ
ジュール2からの読み出しアクセス、従系の共有メモリ
・モジュール2’の書き込みアクセス、主系の共有メモ
リ・モジュール2の書き込みアクセスのいずれにおいて
も、異常を検出すると、中央処理ユニット1bは、その
異常通知の内容を調べ、主系の共有メモリ・モジュール
に対する書き込み動作が行われておらずリカバリ可能な
場合には、その排他制御命令を再実行して処理を続行
し、また、リカバリ不可能な場合には、中央処理ユニッ
ト1bが自ら動作不可と判断しHALT(停止)し、他
の処理モジュールによるマクロなリカバリを行う。
【0017】本発明の請求項1および請求項2の発明に
おいては、上記のように、二重化された共有メモリ・モ
ジュール2、2’に対する排他制御命令の実行に際し、
從系の共有メモリ・モジュール2’への書き込みアクセ
スを行い、続けて、主系の共有メモリ・モジュール2へ
の書き換き込みアクセスを行っているので、システムの
間欠障害等により、読み出し動作や、従系の共有メモリ
・モジュール2’への書き込み動作時に異常終結して
も、その段階では、主系の共有メモリ・モジュール2へ
書き換えが行われておらず、その排他制御命令の再実行
が可能となる。したがって、処理モジュール自らHAL
Tするような事態を減少させることができ、システムの
信頼性、稼働率を向上させることができる。
【0018】本発明の請求項3の発明においては、請求
項2の発明において、排他制御命令における読み出し動
作でセットされ、排他制御命令における書き換え動作が
正常に行われることでリセットされる、各処理モジュー
ル1から読み出し可能なフラグ2c、2c’を各処理モ
ジュール1毎に独立して設けたので、主系の共有メモリ
・モジュール2への書き込み動作時に異常が発生した場
合でも、上記フラグを調べ、主系の共有メモリ・モジュ
ール2のデータの書き換えが行われたか否かを判断する
ことができ、請求項1,2の発明より一層再実行可能な
場合を増加させることが可能となる。
【0019】
【実施例】図2は本発明の一実施例のシステム構成を示
す図である。同図において、21は処理モジュールであ
り、処理モジュール21は、少なくとも、中央処理ユニ
ット21aと、メイン・メモリ21bと、システム・バ
ス23へのバス接続ユニット21cを備えている。処理
モジュール21は各自のメイン・メモリ21b内のプロ
グラムを実行して処理を遂行し、複数の処理モジュール
21は同時に並列に処理を進めることで、システムの処
理能力を高めることができる。
【0020】22は共有メモリ・モジュールであり、共
有メモリ・モジュール22は少なくとも、共有メモリ・
ユニット22aとバス接続ユニット22bを備えてい
る。また、23はシステム・バスであり、システム・バ
スには複数の共有メモリ・モジュール22を設けること
ができ、これらの複数の共有メモリ・モジュール22は
全ての処理モジュール21からアクセスすることができ
る。
【0021】図3は図2に示す処理モジュール21内の
中央処理ユニット21aからアクセス可能な共有メモリ
空間の一例を示す図である。本実施例においては、同図
に示すように、共有メモリ空間が#0から#3までの4
つの空間(部分共有メモリ空間)に分割され、4台の共
有メモリ・モジュールが搭載されている例について説明
する。
【0022】同図に示すように、共有メモリ空間の#0
にはID=0000000とID=0000001の共
有メモリ・モジュールが二重のペアで定義され、#1
は、未実装と定義され、#2はID=0000010の
共有メモリ・モジュールが、また、#3にはID=00
00011の共有メモリ・モジュールがそれぞれ一重で
定義される。
【0023】上記共有メモリ空間は処理モジュール21
のバス接続ユニット21cが具備する制御レジスタに中
央処理ユニットがセットすることで実現される。図4は
上記した共有メモリ空間を定義する制御レジスタの構成
を示す図であり、同図(a)は上記した#0〜#3の4
つの空間の共有メモリ・モジュールの有無を指定する制
御レジスタの構成を示し、(b)は同図(a)の制御レ
ジスタで定義された空間が実際にどの共有メモリ・モジ
ュールとつながるかを定義する制御レジスタを示してい
る。
【0024】同図(a)において、I0(Install 0 )
は部分共有メモリ空間#0に対する共有メモリ・モジュ
ールの有無、I1(Install 1 )は部分共有メモリ空間
#1に対する共有メモリ・モジュールの有無、I2(In
stall 2 )は部分共有メモリ空間#2に対する共有メモ
リ・モジュールの有無、I3(Install 3 )は部分共有
メモリ空間#3に対する共有メモリ・モジュールの有無
を指定しており、共有メモリ・モジュールが存在する空
間には「1」を、存在しない区間には「0」を定義す
る。
【0025】この例においては、空間#1のみ未実装で
あり、他の空間には実装されているので、〔1011〕
が設定されている。同図(b)において、D0は部分共
有メモリ空間#0に対する共有メモリモジュールの二重
化を示し、D1は部分共有メモリ空間#1に対する共有
メモリモジュールの二重化を示し、D2は部分共有メモ
リ空間#2に対する共有メモリモジュールの二重化を示
し、D3は部分共有メモリ空間#3に対する共有メモリ
モジュールの二重化を示している。また、UID0〜3
には部分共有メモリ空間に対する共有メモリ・モジュー
ルのシステム・バス上のユニットIDが指定され、二重
化構成時において、二重化される共有メモリ・モジュー
ルは、UIDの最下位ビットのみが異なる共有メモリ・
モジュールで構成される。
【0026】この例においては、空間#0が2台の共有
メモリ・モジュールを二重化して定義されている。この
定義のため、D0のビットを「1」として、UID0の
フィールドを「0000000」としており、処理モジ
ュールのバス接続ユニットは、D0のビットを参照する
ことで、その空間が二重化されていることを認識する。
【0027】また、この例においては、上記したよう
に、二重化するペアのUIDは、その最下位ビット以外
は一致するモジュールを指定する必要があり、二重化す
るペアとしてID=0000000とID=00000
01の共有メモリ・モジュールが割り当てられている。
図5は処理モジュールが共有メモリ・モジュールをアク
セスする場合の動作を説明する図であり、同図は処理モ
ジュールが共有メモリ・モジュールをリードする場合を
示している。同図において、SCは転送コマンド、EC
は応答コマンド、Aはアドレス、Dはデータを示してお
り、転送コマンドSCは、宛て先のユニットIDを示す
DIDと、自ユニットのユニットIDを示すSIDと、
リード/ライト等の情報を示すオペランド、転送データ
長を示すBCTからなる。また、応答コマンドECに
は、転送コマンドSCで受けた転送元のユニットIDを
示すSDIがDIDフィールドに、自メモリ・モジュー
ルのユニットIDを示すUIDがSIDフィールドに、
さらに、アクセスの成否を示す終結コードが載せられ
る。
【0028】図5において、中央処理ユニットがメモリ
空間をアクセスすると、接続ユニットが同図に示す転送
コマンドSC、アドレスAをシステム・バスに送出す
る。転送コマンドSCは上記したように宛て先のユニッ
トIDを示すDIDと、自ユニットのユニットIDを示
すSIDと、リード/ライト等の情報を示すオペランド
と、転送データ長を示すBCTからなり、宛て先のユニ
ットIDを示すDIDは図4に示した制御レジスタの内
容に基づいて、接続ユニットが付加する。
【0029】システム・バス上に送出された転送コマン
ドSCは全ての共有メモリ・モジュールで受信される
が、DIDフィールドが一致する共有メモリ・モジュー
ルのみによって受け取られる。受信した共有メモリ・モ
ジュールはコマンド内からリード/ライト情報、BC
T、アドレスを取り出し、共有メモリ・ユニットにアク
セスを行う。
【0030】そして、図5に示すリード時には、共有メ
モリ・モジュールはアクセスの成否を示す終結コードを
含む応答コマンドECと読み出したデータをシステム・
バスへ送出する。応答コマンドEC内には、転送コマン
ドSCで受けた自ユニットのユニットIDを示すSID
がDIDフィールドに、共有メモリ・モジュールのユニ
ットIDがSIDフィールドに載せられる。
【0031】このようにして送出された応答コマンドE
Cは全ての処理モジュールで受信されるが、DIDが一
致する処理モジュールのみで受け取られる。図6は処理
モジュールが共有メモリ・モジュールに1ワードのデー
タを書き込む場合の動作を説明する図である。同図にお
いて、図5と同様、SCは転送コマンド、ECは応答コ
マンド、Aはアドレス、Dはデータを示しており、転送
コマンドSCは、DID、SID、オペランド、および
BCTからなり、応答コマンドECは、DID、SI
D、終結コードからなる。
【0032】同図において、処理モジュールから共有メ
モリ・モジュールにデータを書き込む場合には、図5の
場合と同様に、転送コマンドSCとアドレスAに加え、
データDがシステム・バスを介して共有メモリ・モジュ
ールに送出される。共有メモリ・モジュールは送られた
データDを共有メモリ・ユニットに書き込み、DID、
SID、終結コードからなる応答コマンドECをシステ
ム・バスを介して処理モジュールに送出する。
【0033】図7は一つの排他制御命令実行動作を示す
フローチャートであり、同図により、排他制御命令の実
行動作について説明する。同図において、ステップS1
において、共有メモリ・ユニットの排他制御領域のデー
タを読み出し(リード・アクセス)、ステップS2にお
いて、期待した値と一致を判別する。一致しなければ、
排他制御に失敗したものとして、その命令を終了し、一
致がとれれば、ステップS3において、排他制御領域の
書き換え(ライト・アクセス)を行う。これにより、そ
の処理モジュールは共有メモリ・モジュールに対して排
他制御権を獲得する。
【0034】上記のように、排他制御命令の実行におい
ては、1命令でリード・アクセスとライト・アクセスが
行われるが、共有メモリ空間が二重化されている場合に
は、接続ユニットによって、主系と従系の2つの共有メ
モリ・モジュールに書き込みが行われる。これらの一連
の処理の際、どこかで異常が発生すると、バス接続ユニ
ットは処理を打ち切り、中央処理ユニットに対してバス
・アクセスの例外通知を行う。
【0035】ここで、上記のような例外事象が発生した
ときの中央処理ユニットの動作について説明する。中央
処理ユニットはメイン・メモリに格納された処理プログ
ラムを順次実行するが、例えば、メイン・メモリの実装
領域外をアクセスする実装領域例外(Exception )が発
生した場合や、また、タイマによる一定間隔の割込み
(Interrupt)が発生した場合、あるいは、命令(トラ
ップ命令:Trap)によって割り込みが発生した場合に
は、処理が中断され、予め準備された処理ルーチンを移
行する。これらの例外/割込み/トラップをまとめてE
IT処理と呼ぶ。
【0036】図8は中央処理ユニットが処理プログラム
を実行中にバス・アクセス例外がバス接続ユニットから
通知された場合の動作を示す図である。同図において、
処理プログラムを実行中に上記したEITが発生し、中
央処理ユニットがEITを受け付けると、中央処理ユニ
ットは、同図にハードウェア処理において、プログラム
・カウンタPCや、プロセッサ・ステータス・ワードP
WSなど、処理プログラムに復帰するときに必要となる
情報と、どのような事象が発生したかを示す情報などの
EIT処理ルーチンで必要となる情報をメイン・メモリ
に退避する。ついで、予め決められたEIT処理ルーチ
ンに入り、EIT処理ルーチンでのソフトウェア処理が
終わると、ハードウェア処理において、退避した情報を
復元して、再び、処理プログラムに戻る。
【0037】また、処理プログラムに戻る場合には、同
図に示すように、再び同じ命令を実行する場合(同図の
a)と、次の命令に進む場合(同図のb)があり、例外
によるEIT処理の場合には、同図aのように復帰し、
トラップによるEIT処理の場合には、同図bのように
復帰する。すなわち、排他制御命令による例外の場合に
は、同図aのように復帰する。
【0038】図9はEIT処理の先頭でハードウェアが
退避する情報の一例を示す図であり、同図において、P
SWはプロセッサ・ステータス・ワードと呼ばれ、プロ
セッサの動作を制御したり、動作状態を表示するレジス
タ、EITINFはEIT情報が示す要因コードを含ん
でおり、要因コードには、前記したような各種例外要因
や割込み要因、あるいは、トラップ要因がコード化され
格納されている。
【0039】PCはEIT処理から復帰するときのプロ
グラム・アドレスが格納され、また、EXPCはEIT
要因を発生したプログラム・アドレスが格納されてい
る。IOINFはEIT要因を発生したバス・アクセス
の詳細情報であり、IOINFにおけるBL(BUS LOC
) は実行中の命令が排他制御命令であることを示し、
RDはリード/ライト種別を、BAT(BUS Access Typ
e )はプログラム・リードかオペランド・アクセス(リ
ード/ライト)かを、また、BC(Byte Cotrol )は4
バイトのデータ・バスの各バイトの有効/無効を示して
いる。
【0040】また、ERADDRは例外を発生させたア
ドレスを、ERDATAは上記したRDビットが
「0」、すなわち、ライト時に有効で、例外を発生させ
た時のデータを示している。図10は処理モジュールの
バス接続ユニットが具備する共有メモリ・アクセスの終
結コード(PPCST)のレジスタを示す図であり、同
図のSUD(SSM Undefined )は図4で未実装と定義さ
れたアドレス空間にアクセスした場合にセットされるビ
ットであり、未実装と定義されたアドレス空間にアクセ
スしSUDのビットが立つと、バス接続ユニットは一切
なにもせずに例外を通知する。この場合には、当然なが
ら終結コード(PPCST)は無意味である。
【0041】DI7(DID−BIT7)は例外を発生
させたアクセス時の共有メモリ・モジュールのユニット
IDであるUIDの最下位ビットを示す。アクセス空間
アドレス毎にメモリ・モジュールのUIDと一重/二重
が定義されているので、上記DI7を調べることによ
り、どのモジュールにアクセスした時に例外が発生した
かを容易に調べることができる。
【0042】図11はEIT処理ルーチンの概要を示す
フローチャートであり、同図により、EIT処理ルーチ
ンについて説明する。EIT処理ルーチンに入ると、ス
テップT1において、図9に示したEITINFの要因
コードをチェックし、要因を認識する。ステップT2に
おいて、IOINF情報のBLビットを調べ、排他制御
命令実行中の例外か否かを判別する。
【0043】排他制御命令実行中の例外でない場合に
は、ステップT6に行き、一般命令の例外処理を行う。
また、排他制御命令実行中の例外の場合には、ステップ
T4に行き、終結コード(PPCST)を調べ、ステッ
プT5において、その内容からその排他制御命令が再実
行可能か判断する。排他制御命令が再実行が不可能と判
断されると、ステップT7に行き、その処理モジュール
はHALTする。また、再実行可能であると判断される
と、そのEIT処理を終了する。
【0044】また、例外によりEIT処理の場合には、
前記したように、先に退避された情報における復帰時の
プログラム・アドレス(PC)はEIT要因を発生した
プログラム・アドレスEXPCと同じに設定されている
ので、EIT処理を終了させることで、EIT処理に入
る前と同じ命令を再び実行することができる。ここで、
上記EIT処理において、命令の再実行が可能であるか
否かは、読み出しを行う主系の共有メモリ・モジュール
のデータが例外を発生したアクセスで書き換えられたか
どうかであり、もし書き換えられていなければ、その命
令が実行されていないに等しい。
【0045】したがって、主系の共有メモリ・モジュー
ルの書き換えを伴う例外が極力発生しないようにすれ
ば、排他制御命令を再実行できる可能性を増やすことが
できる。図12は上記原理に基づき、主系の共有メモリ
・モジュールの書き換えを伴う例外が極力発生しないよ
うにした排他制御命令の実行処理の実施例を示す図であ
り、同図は、図17の従来例で示した場合と同様、デー
タを書き込む場合を示している。
【0046】同図において、121、122は二重化さ
れた共有メモリ・モジュールであり、共有メモリ・モジ
ュール121、122はそれぞれ、共有メモリ・ユニッ
ト121aと122aを備え、共有メモリ・ユニット1
21a、122aはバス接続ユニット121b、122
bを介してシステム・バス123と接続されている。ま
た、図17と同様、共有メモリ・モジュール121のユ
ニットIDはID=0000000であり、共有メモリ
・モジュール122のユニットIDはID=00000
01である。
【0047】124は処理モジュールであり、処理モジ
ュール124は中央処理ユニット124aと、メイン・
メモリ124bと、システム・バス123と、中央処理
ユニット124a等を接続するバス接続ユニット124
cを備えており、処理モジュールのユニットIDはID
=1100000である。図12において、処理モジュ
ール124の中央処理ユニット124aが排他制御命令
が実行すると、まず、共有メモリ・モジュールの読み出
し動作がバス接続ユニット124cに認識され、バス接
続ユニット124cは、ID=0000000の主系共
有メモリ・モジュール121の読み出しアクセスを行
う。そして、上記、共有メモリ・モジュール121の排
他制御領域のデータを読み出し(リード・アクセス、同
図のR:Read)、処理モジュール124において
期待した値との一致を判別し、一致しなければ、排他制
御に失敗したものとしてその命令を終了し、次の命令に
進む。
【0048】また、一致している場合には、共有メモリ
・モジュール121、122の書き換え動作を開始す
る。その際、図17に示した従来例とは書き換え動作の
順番を逆にし、従系の共有メモリ・モジュール122か
ら書き換え動作を行う。すなわち、バス接続ユニット1
24cがその書き換えを認識すると、まず、ID=00
00001の從系の共有メモリ・モジュール122への
書き込みアクセスを行い(同図のSW:Slaveへ
のWrite)、正常終結した通知を受けてから、続け
て、ID=0000000の主系の共有メモリ・モジュ
ール121への書き込みアクセスを行う(同図のM
W:MasterへのWrite)。そして、主系の共
有メモリ・モジュール121への書き込み完了通知を受
けると、バス接続ユニット124cが中央処理ユニット
124aに対して完了を通知し、排他制御命令が終了す
る。
【0049】上記バス接続ユニット124cは読み出し
アクセス、従系の共有メモリ・モジュール122の書き
込みアクセス、主系の共有メモリ・モジュール121の
書き込みアクセスのいずれにおいても、異常を検出する
と、中央処理ユニット124aに対してその命令に同期
した異常通知を行う。異常通知を受けた中央処理ユニッ
ト124aは、図17の場合と同様、その異常通知の内
容を調べ、リカバリ可能な場合には、その排他制御命令
を再実行することで処理を続行し、リカバリ不可能な場
合には、中央処理ユニット124aが自ら動作不可と判
断しHALT(停止)させ、他の処理モジュールによる
マクロなリカバリを行う。
【0050】上記のように、本実施例においては、従系
の共有メモリ・モジュール122から書き換え動作を行
うので、システムの間欠障害等により、ライト・アクセ
ス時の異常が従系の共有メモリ・モジュール122で発
生しても、その段階では、主系の共有メモリ・モジュー
ル121へ書き換えがまだ行われていないため、再実行
が可能となる。
【0051】図13、図14は本発明の他の実施例を説
明する図であり、本実施例においては、図12に示した
実施例において排他制御命令の実行フラグを追加し、上
記実行フラグを参照することにより、排他制御命令の実
行状態を判断し、再実行可能か否かを判別できるように
したものである。図13は上記排他制御命令実行フラグ
を定義するレジスタを示す図であり、同図に示すよう
に、PM0〜PM31の処理モジュール(ID=110
0000〜ID=1111111)の排他制御命令実行
フラグがそれぞれ独立して定義される。これらのフラグ
は各共有メモリ・モジュール内に設けられ、各処理モジ
ュールからアクセス可能である。
【0052】図14は排他制御命令実行フラグのセット
/リセット条件を示す図であり、排他制御命令実行フラ
グは同図に示すように、排他制御命令のリード処理でセ
ットされ(同図)、排他制御命令のライト処理の正常
終了でリセットされる(同図)。また、上記実行フラ
グのセット/リセットは、各共有メモリ・モジュール
が、図5、図6に示したコマンド内のSDIを参照し
て、処理モジュール毎にセット/リセットを行う。
【0053】図15は上記した実施例において、排他制
御命令実行時に異常が発生した場合のリカバリ処理の再
実行可否判断処理を示すフローチャートであり、同図に
より上記処理について説明する。再実行の可否判断処理
において、ステップR1において、未実装と定義された
アドレス空間にアクセスした場合にセットされるビット
SUD(図10参照)を参照して、SUDビットがオン
であれば、プログラム論理ミスと判断する。SUDビッ
トがオンでなければ、ステップR2にいき、リード・ア
クセスであるか否か、すなわち、図9に示したIOIN
Fのリード/ライト種別を示すRDビットを参照し、リ
ード時の異常であるか否かを判断し、リード時の異常で
あれば、共有メモリ・モジュールの書き換えは行われて
いないので、再実行可能と判断し、再実行を行う。
【0054】また、リード時の異常でなければ、ステッ
プR3に行き、例外を発生させたアクセス時の共有メモ
リ・モジュールのUID(ユニットID)の最下位ビッ
トを示すDI7(図10参照)を参照して、DI7が従
系を示しているか否かを判断し、DI7が従系を示して
いる場合には、主系の共有メモリ・モジュールの書き換
えが行われていないので、再実行可能と判断する。
【0055】DI7が主系を示している場合には、ステ
ップR4に行き、共有メモリ・モジュールの終結コード
PPCST(図10参照)の内容を判断し、その内容か
ら明らかに書き換えが行われていないことが保証された
場合には、再実行可能と判断する。また、そうでない場
合には、ステップR5に行き、上記終結コードPPCS
Tが、明らかに主系の共有メモリ・モジュールの書き換
えが行われたことを示しているか否かを判断し、書き換
えが行われたことを示している場合には、再実行不可能
と判断する。
【0056】さらに、主系の共有メモリ・モジュールの
書き換えが行われていないことが保証できない場合に
は、ステップR6に行き、図13に示した排他制御命令
実行フラグを参照して、フラグがオンであるか否かを判
別する。フラグがオンである場合には、まだ、主系の共
有メモリ・モジュールの書き換えが行われていないの
で、再実行可能と判断する。また、上記フラグがオフの
場合には、主系共有メモリ・モジュールの書き換えが行
われたものとして、再実行不可能と判断する。
【0057】図16は図17に示した従来例における、
排他制御命令実行時に異常が発生した場合のリカバリ処
理の再実行可否判断処理を示すフローチャートであり、
同図のステップP1ないしP5は、それぞれ、図15の
フローチャートのR1ないしR5に対応する。図15と
図16のフローチャートを対比することにより明らかな
ように、本発明の実施例においては、従系の共有メモリ
・モジュール122から書き換え動作を行うので、図1
5のステップR3において従系と判断された場合にも、
再実行が可能となるとともに、ステップR5において、
主系の共有メモリ・モジュールの書き換えが行われてい
ないことが保証できない場合においても、ステップR6
において、排他制御命令実行フラグを参照することによ
り、再実行可能か否かが判断できる。したがって、図1
5の斜線で示すように、従来においては再実行不可能で
あるとされていた2つのパターンにおいて再実行を可能
とすることができる。
【0058】
【発明の効果】以上説明したことから明らかなように、
本発明においては、二重化された共有メモリ・モジュー
ルに対する排他制御命令の実行に際し、從系の共有メモ
リ・モジュールへの書き込みアクセスを行い、続けて、
主系の共有メモリ・モジュールへの書き換き込みアクセ
スを行っているので、システムの間欠障害等により、読
み出し動作や、従系の共有メモリ・モジュールへの書き
込み動作時に異常終結しても、その段階では、主系の共
有メモリ・モジュールの書き換えがまだ行われておら
ず、その排他制御命令の再実行が可能となる。したがっ
て、処理モジュール自らHALTするような事態を減少
させることができ、システムの信頼性、稼働率を向上さ
せることが可能となる。
【0059】また、排他制御命令における読み出し動作
でセットされ、排他制御命令における書き換え動作が正
常に行われることでリセットされるフラグを各処理モジ
ュール毎に独立して設けることにより、主系の共有メモ
リ・モジュールへの書き込み動作時に異常が発生した場
合でも、主系の共有メモリ・モジュールのデータの書き
換えが行われたか否かを判断することができ、一層再実
行可能な場合を増加させることが可能となる。
【図面の簡単な説明】
【図1】本発明の原理ブロック図である。
【図2】本発明の実施例のシステム構成を示す図であ
る。
【図3】共有メモリ空間における部分共有メモリ空間の
一例を示す図である。
【図4】共有メモリ空間を定義する制御レジスタの構成
を示す図である。
【図5】共有メモリ空間アクセス時の動作(リード動
作)を説明する図である。
【図6】共有メモリ空間アクセス時の動作(ライト動
作)を説明する図である。
【図7】本発明の実施例における排他制御命令の動作フ
ローチャートである。
【図8】中央処理ユニットのEIT処理動作を説明する
図である。
【図9】EIT処理に伴う退避/復元情報を示す図であ
る。
【図10】アクセス完了コードを表示するレジスタの一
例を示す図である。
【図11】排他制御命令に伴うEIT処理の概略フロー
チャートを示す図である。
【図12】本発明における排他制御命令の実行処理の実
施例を示す図である。
【図13】他の実施例における排他制御命令実行フラグ
のレジスタを示す図である。
【図14】排他制御命令実行フラグのセット/リセット
条件を示す図である。
【図15】本発明の実施例の再実行可否判断論理を示す
フローチャートである。
【図16】従来の再実行可否判断論理を示すフローチャ
ートである。
【図17】従来の排他制御命令の実行処理を示す図であ
る。
【符号の説明】
1,21,124 処理モジュール 1a,21a,124a 中央処理ユニット 1b,21b,124b メイン・メモリ 1c,21c,22b,121b、122b バス接続
ユニット 2,2’,22 共有メモリ・モジュ
ール 2a,2a, 共有メモリ・ユニッ
ト 2c,2c フラグ 23 システム・バス 121、122 二重化された共有メ
モリ・モジュール 121aと122a 共有メモリ・ユニッ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも、処理ユニット(1a)を備えた
    複数の処理モジュール(1) と、 少なくとも、共有メモリ・ユニット(2a,2a')を備えた複
    数の共有メモリ・モジュール(2,2')とから構成され、上
    記複数の共有メモリ・モジュール(2,2')の全てもしくは
    一部が二重化され、上記処理モジュール(1) が、共有メ
    モリモジュール(2,2')にアクセスする計算機システムの
    排他制御命令のリカバリ方法において、 処理モジュール(1) の中央処理ユニット(1a)が任意の共
    有メモリ・モジュールのアドレスを指定して、そのアド
    レスからデータを読み出し、読み出しデータと上記中央
    処理ユニット(1a)が期待するデータとの一致が判別され
    たとき、そのアドレスのデータの書き換えを行う排他制
    御命令を実行するに際して、 上記二重化共有メモリ・モジュール(2,2')のうち、主系
    となる一方の共有メモリ・モジュール(2) からデータを
    読み出したのち、データの書き換えを行う際、データを
    読み出した二重化共有メモリ・モジュール(2) の対とな
    る従系の他方の共有メモリ・モジュール(2')のデータを
    書き換えたのち、上記一方の共有メモリ・モジュール
    (2) のデータを書き換え、 排他制御命令が異常終結した場合には、主系となる一方
    の共有メモリ・モジュール(2) のデータが書き換えられ
    たか否かを判別して、上記排他制御命令を再実行するこ
    とを特徴とする二重化共有メモリにおける排他制御命令
    のリカバリ方法。
  2. 【請求項2】 少なくとも、中央処理ユニット(1a)と、
    メイン・メモリ(1b)と、システム・バス(3) への接続ユ
    ニット(1c)とを備えた複数の処理モジュール(1) と、 少なくとも、共有メモリ・ユニット(2a,2a')と、上記シ
    ステム・バス(3) への接続ユニット(2b,2b')とを備えた
    複数の共有メモリ・モジュール(2,2')とから構成され、
    上記複数の共有メモリ・モジュール(2,2')の全てもしく
    は一部が二重化された計算機システムの排他制御命令の
    リカバリ方法において、 処理モジュール(1) の中央処理ユニット(1a)が任意の共
    有メモリ・モジュールのアドレスを指定して、そのアド
    レスからデータを読み出し、読み出しデータと上記中央
    処理ユニット(1a)が期待するデータとの一致が判別され
    たとき、そのアドレスのデータの書き換えを行う排他制
    御命令を実行するに際して、 上記二重化共有メモリ・モジュール(2,2')のうち、主系
    となる一方の共有メモリ・モジュール(2) からデータを
    読み出したのち、データの書き換えを行う際、データを
    読み出した二重化共有メモリ・モジュール(2) の対とな
    る従系の他方の共有メモリ・モジュール(2')のデータを
    書き換えたのち、上記一方の共有メモリ・モジュール
    (2) のデータを書き換え、 排他制御命令が異常終結した場合には、主系となる一方
    の共有メモリ・モジュール(2) のデータが書き換えられ
    たか否かを判別して、上記排他制御命令を再実行するこ
    とを特徴とする二重化共有メモリにおける排他制御命令
    のリカバリ方法。
  3. 【請求項3】 排他制御命令における読み出し動作でセ
    ットされ、排他制御命令における書き換え動作が正常に
    行われることでリセットされる、各処理モジュール(1)
    から読み出し可能なフラグ(2c,2c')を各処理モジュール
    (1) 毎に独立して設け、 排他制御命令が異常終結した際に、排他制御命令を実行
    した処理モジュール(1) の中央処理ユニット(1a)が、上
    記フラグを参照して主系となる一方の共有メモリ・モジ
    ュール(2) のデータの書き換えが行われたか否かを判断
    することを特徴とする請求項2の排他制御命令のリカバ
    リ方法。
JP5068265A 1993-03-26 1993-03-26 二重化共有メモリにおける排他制御命令のリカバリ方法および計算機システム Expired - Fee Related JP2963298B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP5068265A JP2963298B2 (ja) 1993-03-26 1993-03-26 二重化共有メモリにおける排他制御命令のリカバリ方法および計算機システム
US08/955,718 US5903763A (en) 1993-03-26 1997-10-22 Method of recovering exclusive control instruction and multi-processor system using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5068265A JP2963298B2 (ja) 1993-03-26 1993-03-26 二重化共有メモリにおける排他制御命令のリカバリ方法および計算機システム

Publications (2)

Publication Number Publication Date
JPH06282496A true JPH06282496A (ja) 1994-10-07
JP2963298B2 JP2963298B2 (ja) 1999-10-18

Family

ID=13368754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5068265A Expired - Fee Related JP2963298B2 (ja) 1993-03-26 1993-03-26 二重化共有メモリにおける排他制御命令のリカバリ方法および計算機システム

Country Status (2)

Country Link
US (1) US5903763A (ja)
JP (1) JP2963298B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079676A (ja) * 2008-09-26 2010-04-08 Fujitsu Ltd 処理方法及び記憶システム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6295585B1 (en) * 1995-06-07 2001-09-25 Compaq Computer Corporation High-performance communication method and apparatus for write-only networks
AU7474200A (en) * 1999-08-31 2001-03-26 Times N Systems, Inc. Cache-coherent shared-memory cluster
US6877036B1 (en) * 1999-09-24 2005-04-05 Akamba Corporation System and method for managing connections between a client and a server
US9678830B2 (en) * 2014-11-17 2017-06-13 International Business Machines Corporation Recovery improvement for quiesced systems

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6426256A (en) * 1987-07-22 1989-01-27 Nec Corp Data changing method

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4574350A (en) * 1982-05-19 1986-03-04 At&T Bell Laboratories Shared resource locking apparatus
US4827399A (en) * 1986-10-03 1989-05-02 Nec Corporation Common file system for a plurality of data processors
EP0323013B1 (en) * 1987-11-30 1995-08-30 International Business Machines Corporation Method of operating a multiprocessor system employing a shared virtual memory
EP0348628A3 (en) * 1988-06-28 1991-01-02 International Business Machines Corporation Cache storage system
DE3886756T2 (de) * 1988-10-28 1994-06-23 Ibm Betriebsmittelzugriff für Multiprozessorrechnersystem.
JP2830218B2 (ja) * 1989-11-22 1998-12-02 株式会社日立製作所 キャッシュ付ディスク制御装置の障害処理方法
US5226143A (en) * 1990-03-14 1993-07-06 International Business Machines Corporation Multiprocessor system includes operating system for notifying only those cache managers who are holders of shared locks on a designated page by global lock manager
US5297269A (en) * 1990-04-26 1994-03-22 Digital Equipment Company Cache coherency protocol for multi processor computer system
AU633724B2 (en) * 1990-06-29 1993-02-04 Digital Equipment Corporation Interlock queueing
JPH06342396A (ja) * 1990-07-02 1994-12-13 Internatl Business Mach Corp <Ibm> 共有データのアクセスを直列化する方法及び装置
JPH04128957A (ja) * 1990-09-20 1992-04-30 Fujitsu Ltd マルチプロセッサシステムにおける共有資源の排他制御方法
US5291442A (en) * 1990-10-31 1994-03-01 International Business Machines Corporation Method and apparatus for dynamic cache line sectoring in multiprocessor systems
JPH04271453A (ja) * 1991-02-27 1992-09-28 Toshiba Corp 複合電子計算機
US5237694A (en) * 1991-05-30 1993-08-17 Advanced Micro Devices, Inc. Processing system and method including lock buffer for controlling exclusive critical problem accesses by each processor
EP0543560B1 (en) * 1991-11-19 1999-12-22 Sun Microsystems, Inc. Arbitrating multiprocessor accesses to shared resources
US5469573A (en) * 1993-02-26 1995-11-21 Sytron Corporation Disk operating system backup and recovery system
US5581750A (en) * 1993-03-15 1996-12-03 International Business Machines Corporation System and method for improving data recovery performance

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6426256A (en) * 1987-07-22 1989-01-27 Nec Corp Data changing method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079676A (ja) * 2008-09-26 2010-04-08 Fujitsu Ltd 処理方法及び記憶システム

Also Published As

Publication number Publication date
JP2963298B2 (ja) 1999-10-18
US5903763A (en) 1999-05-11

Similar Documents

Publication Publication Date Title
US9860315B2 (en) Controlling the state of duplexing of coupling facility structures
US7631214B2 (en) Failover processing in multi-tier distributed data-handling systems
JP3072048B2 (ja) 計算機システムおよび計算機システムのソフトウェア故障回復方法
US7627781B2 (en) System and method for establishing a spare processor for recovering from loss of lockstep in a boot processor
JP2675955B2 (ja) データ処理システム
US20030196025A1 (en) Synchronizing processing of commands invoked against duplexed coupling facility structures
US20090044044A1 (en) Device and method for correcting errors in a system having at least two execution units having registers
US5450590A (en) Authorization method for conditional command execution
US6237108B1 (en) Multiprocessor system having redundant shared memory configuration
JPH0394321A (ja) アクセス制御方法
JP3030658B2 (ja) 電源故障対策を備えたコンピュータシステム及びその動作方法
JP3329986B2 (ja) マルチプロセッサシステム
JP2963298B2 (ja) 二重化共有メモリにおける排他制御命令のリカバリ方法および計算機システム
JP2001022599A (ja) フォールトトレラント・システム,フォールトトレラント処理方法およびフォールトトレラント制御用プログラム記録媒体
US6092084A (en) One system of a multisystem environment taking over log entries owned by another system
US20030196016A1 (en) Coupling of a plurality of coupling facilities using peer links
US6076095A (en) Method of one system of a multisystem environment taking over log entries owned by another system
JP3424968B2 (ja) 計算機システム及びプロセッサチップ及び障害復旧方法
JPH07141176A (ja) コマンドリトライ制御方式
JPH06149485A (ja) データ完結性保証処理方法
JP3255934B2 (ja) ベーシックプロセッシングユニット及び高信頼化コンピュータシステム
US20060107116A1 (en) System and method for reestablishing lockstep for a processor module for which loss of lockstep is detected
JP3141948B2 (ja) 計算機システム
JP2937857B2 (ja) 共通記憶装置のロックフラグ解除方式および方法
JP2002229811A (ja) 論理分割システムの制御方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990727

LAPS Cancellation because of no payment of annual fees