JPH06301658A - 疎結合電子計算機システムのリカバリ方式 - Google Patents

疎結合電子計算機システムのリカバリ方式

Info

Publication number
JPH06301658A
JPH06301658A JP5110976A JP11097693A JPH06301658A JP H06301658 A JPH06301658 A JP H06301658A JP 5110976 A JP5110976 A JP 5110976A JP 11097693 A JP11097693 A JP 11097693A JP H06301658 A JPH06301658 A JP H06301658A
Authority
JP
Japan
Prior art keywords
computer
shared resource
control device
exclusive control
notification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5110976A
Other languages
English (en)
Inventor
Shunei Motoki
俊英 元木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5110976A priority Critical patent/JPH06301658A/ja
Publication of JPH06301658A publication Critical patent/JPH06301658A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 複数の電子計算機が共有資源排他制御装置の
制御に従って共有資源を共有する疎結合電子計算機シス
テムに於いて、障害時に複数の電子計算機によって共有
資源が同時に使用されないようにする。 【構成】 電子計算機20は一定時間以内毎に共有資源排
他制御装置10に対して正常使用中通知を行なっている。
共有資源排他制御装置10は正常使用中通知を検出できな
くなると、電子計算機20或いは接続パス41に障害が発生
したと判断し、正常な電子計算機30に対して障害通知を
行なう。これにより、電子計算機30は、電子計算機20に
対して共有資源排他制御装置10,共有資源15の切断を要
求する。これに応答して電子計算機20では接続パス41,4
3 を強制的に使用不能状態にし、その後、電子計算機30
に切断完了通知を行なう。この切断完了通知を受ける
と、電子計算機30は共有資源排他制御装置10に対して電
子計算機20が占有していた資源の解放を要求する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の電子計算機がお
互いに関係を保ちながら処理を行なう疎結合電子計算機
システムに関し、特に、共有資源排他制御装置を使用し
て複数の電子計算機間でデータベース群等の資源を共有
する疎結合電子計算機システムに於いて電子計算機の障
害時および共有資源排他制御装置と電子計算機との接続
パスの障害時にリカバリ処理を行なう疎結合電子計算機
システムのリカバリ方式に関する。
【0002】
【従来の技術】従来、共有資源排他制御装置を使用して
複数の電子計算機間でデータベース群等の資源を共有す
る疎結合電子計算機システムに於いては、各電子計算機
は共有排他制御装置の排他制御機能を使用している間
は、一定時間以内毎に共有資源排他制御装置に対して正
常使用中通知を行なっている。
【0003】共有資源排他制御装置では一定時間以内毎
に電子計算機から正常使用中通知がこないことを検出す
ると、正常使用中通知のこなかった電子計算機に障害が
発生したと判断し、正常な電子計算機に対して障害通知
を行なう。
【0004】障害通知を受けた正常な電子計算機の内の
1つの電子計算機(例えば、装置番号が障害の発生した
電子計算機の次に大きい電子計算機)は、共有資源の状
態を障害の発生した電子計算機が使用する以前の状態に
戻した後、共有資源排他制御装置に対して占有解除指示
を行なう。
【0005】占有解除指示を受けると、共有資源排他制
御装置は障害の発生した電子計算機が占有していた共有
資源を解放し、他の正常な電子計算機がそれを使用でき
るようにする。
【0006】
【発明が解決しようとする課題】上述したように、従来
は、一定時間以内毎に電子計算機から正常使用中通知が
こないことを検出した場合、電子計算機に障害が発生し
たと判断し、その電子計算機が占有していた共有資源を
解放するようにしているが、次のような問題があった。
【0007】共有資源排他制御装置で電子計算機からの
一定時間以内毎の正常使用中通知を検出できなくなるの
は、電子計算機に障害が発生した場合だけでなく、電子
計算機と共有資源排他制御装置との間の接続パスに障害
が発生した場合も検出できなくなる。
【0008】もし、電子計算機と共有資源排他制御装置
との間の接続パスの障害により電子計算機からの正常使
用中通知を検出できなくなった場合に、上述したよう
に、障害の発生したと判断した電子計算機が占有してい
た占有資源を解放してしまうと、複数の電子計算機によ
って同時に共有資源が使用されてしまう場合があるとい
う問題があった。即ち、障害が発生したと判断した電子
計算機は実際には正常であるので、共有資源を継続して
使用しており、この状態に於いて占有資源の解放を行な
うと、上記障害が発生したと判断した電子計算機と他の
計算機とによって同時に共有資源が使用されてしまう。
【0009】本発明の目的は、障害発生時、共有資源が
複数の電子計算機によって同時使用されないようにする
ことができる疎結合電子計算機システムのリカバリ方式
を提供することにある。
【0010】
【課題を解決するための手段】本発明は共有資源が複数
の電子計算機によって同時に使用されないようにするた
め、(A)複数の電子計算機と、該複数の電子計算機に
接続され、該複数の電子計算機によって共有される共用
資源と、前記複数の電子計算機に接続され、前記複数の
電子計算機による前記共有資源の使用を排他的に制御す
る共有資源排他制御装置とを備えた疎結合電子計算機シ
ステムに於いて、前記複数の電子計算機の間それぞれに
通信パスを設け、前記各電子計算機は、一定時間以内毎
に前記共有資源排他制御装置に対して正常使用中通知を
行ない、前記共有資源排他制御装置は、前記各電子計算
機からの正常使用中通知に基づいて電子計算機の障害ま
たは前記共有資源排他制御装置と電子計算機との間の接
続パスの障害を検出することにより他の正常な電子計算
機に障害通知を行ない、該障害通知を受けた電子計算機
の内の特定の電子計算機は、前記障害の発生した電子計
算機または共有資源排他制御装置との間の接続パスに障
害の発生した電子計算機に対して前記通信パスを介して
その電子計算機に接続されている共有資源排他制御装置
及び共有資源の切断を指示し、共有資源排他制御装置及
び共有資源の切断を指示された電子計算機は、前記共有
資源排他制御装置及び前記共有資源を自電子計算機から
切断し、切断が完了することにより前記特定の電子計算
機に対して前記通信パスを介して切断完了通知を行な
い、該切断完了通知を受けた前記特定の電子計算機は、
前記共有資源排他制御装置に対して前記障害の発生した
電子計算機または前記共有資源排他制御装置との間の接
続パスに障害が発生した電子計算機が占有していた資源
の解放指示を行ない、該解放指示を受けた前記共有資源
排他制御装置は、前記障害の発生した電子計算機または
前記共有資源排他制御装置との間の接続パスに障害が発
生した電子計算機が占有していた資源を解放するように
構成したものである。
【0011】また、本発明は、正常な電子計算機が障害
の発生した電子計算機が占有していた共有資源を速やか
に使用できるようにするため、(A)の構成に於いて、
(B)前記各電子計算機は、自電子計算機から一定時間
以内毎に正常使用中通知が出力されなくなったことを検
出することにより、自電子計算機に接続されている共有
資源排他制御装置及び共有資源を切断し、その後、他の
電子計算機に対して前記通信パスを介して切断完了通知
を行ない、該切断完了通知を受けた電子計算機の内の特
定の電子計算機は、前記共有資源排他制御装置に対して
一定時間以内毎に正常使用中通知が出力されなくなった
電子計算機が占有していた資源の解放指示を行なうよう
に構成したものである。
【0012】更に、本発明は電子計算機間の通信パスに
障害が発生した場合に於いても、障害の発生した電子計
算機が占有していた資源を解放できるようにするため、
(B)の構成に於いて、(C)前記障害通知を受けた電
子計算機の内の特定の電子計算機は、前記障害の発生し
た電子計算機に対してその電子計算機に接続されている
共有資源排他制御装置及び共有資源の切断を要求すると
共にタイマを起動し、該タイマがタイムオーバすること
により或いは前記障害の発生した電子計算機から切断完
了通知が送られてくることにより前記共有資源排他制御
装置に対して前記障害の発生した電子計算機が占有して
いた資源の解放指示を行なうように構成したものであ
る。
【0013】
【作用】(A)の構成に於いては、各電子計算機は、一
定時間以内毎に共有資源排他制御装置に対して正常使用
中通知を行なっている。
【0014】共有資源排他制御装置は、各電子計算機か
らの正常使用中通知に基づいて電子計算機障害または電
子計算機と共有資源排他制御装置との間の接続パスの障
害を検出すると、他の正常な電子計算機に対して障害通
知を行なう。
【0015】障害通知を受けた電子計算機の内の特定の
電子計算機は、通信パスを介して障害の発生した電子計
算機または共有資源との間の接続パスに障害の発生した
電子計算機に対してその電子計算機に接続されている共
有資源排他制御装置及び共有資源の切断を指示する。
【0016】この切断指示を受けた電子計算機は、自電
子計算機を共有資源排他制御装置及び共有資源から切断
した後、切断完了通知を上記特定の電子計算機に対して
行なう。
【0017】上記特定の電子計算機は切断完了通知を受
け取ると、共有資源排他制御装置に対して資源の解放を
要求する。
【0018】これにより、共有資源排他制御装置は障害
の発生した電子計算機または共有資源排他制御装置との
間の接続パスに障害が発生した電子計算機が占有してい
た資源を解放する。
【0019】(B)の構成に於いては、各電子計算機
は、自電子計算機から一定時間以内毎に正常使用中通知
が出力されなくなったことを検出することにより、自電
子計算機に接続されている共有資源排他制御装置及び共
有資源を切断し、その後、他の正常な電子計算機に対し
て通信パスを介して切断完了通知を行なう。
【0020】この切断完了通知を受けた電子計算機の内
の特定の電子計算機は、共有資源排他制御装置に対して
正常使用中通知が出力されなくなった電子計算機が占有
していた資源の解放指示を行なう。
【0021】(C)の構成に於いては、共有資源排他制
御装置から障害通知を受けた電子計算機の内の特定の電
子計算機は、障害の発生した電子計算機に対してその電
子計算機に接続されている共有資源排他制御装置及び共
有資源の切断を要求すると共にタイマを起動する。
【0022】そして、タイマがタイムオーバすることに
より或いは障害の発生した電子計算機から切断完了通知
が送られてくることにより共有資源排他制御装置に対し
て前記障害の発生した電子計算機が占有していた資源の
解放指示を行なう。
【0023】
【実施例】次に本発明の実施例について図面を参照して
詳細に説明する。
【0024】図1は本発明の実施例のブロック図であ
り、共有資源排他制御装置10と、電子計算機20,3
0と、共有資源15と、共有資源排他制御装置10と電
子計算機20とを接続する接続パス41と、共有資源排
他装置10と電子計算機30とを接続する接続パス42
と、共有資源15と電子計算機20とを接続する接続パ
ス43と、共有資源15と電子計算機30とを接続する
接続パス44と、電子計算機20と電子計算機30とを
接続する通信パス50とから構成されている。
【0025】共有資源排他制御装置10は、通知受信監
視手段11と、障害通知手段12と、占有解除手段13
とを含んでいる。
【0026】通知受信監視手段11は、各電子計算機2
0,30から一定時間内毎に正常使用中を示す正常使用
中通知が送られてきているか否かを監視する機能を有す
る。
【0027】障害通知手段12は、通知受信監視手段1
1が一定時間以内毎に電子計算機20,30から正常使
用中通知が送られてこないことを検出した場合、電子計
算機20,30或いは接続パス41,42に障害が発生
したと判断し、接続されている他の正常な電子計算機に
障害通知を行なう機能を有する。
【0028】占有解除手段13は、障害の発生した電子
計算機が占有していた共有資源を、正常な電子計算機か
らの指示により解放する機能を有する。
【0029】電子計算機20,30は、それぞれ正常使
用中通知手段21,31と、通知処理監視手段22,3
2と、強制切断手段23,33と、占有解除手段24,
34と、電子計算機間通信手段25,35と、通知管理
手段26,36と、監視タイマ手段27,37とを含ん
でいる。
【0030】正常使用中通知手段21,31は、それぞ
れ共有資源排他制御装置10に対して一定時間以内毎に
正常使用中通知を行なう機能を有する。
【0031】通知処理監視手段22,32は、それぞれ
正常使用中通知手段21,31が一定時間以内毎に正常
使用中通知を行なっているか否かを監視する機能を有す
る。
【0032】強制切断手段23,33は、それぞれ通知
処理監視手段22,32が正常使用中通知手段21,3
1の異常を検出した場合、自電子計算機20,30と共
有資源排他制御装置10との間の接続パス41,42及
び自電子計算機20,30と共有資源15との間の接続
パス43,44を強制的に使用不可状態にする機能を有
する。
【0033】占有解除手段24,34は、共有資源排他
制御装置10から障害通知があった場合及び通知管理手
段26,36から依頼を受けた場合、自電子計算機が占
有解除通知を行なう電子計算機か否かを判断し、そうで
あると判断した場合には共有資源15の状態を障害の発
生した電子計算機の使用前の状態に戻した後、共有資源
排他制御装置10に対して占有解除通知を行なう機能を
有する。尚、自電子計算機が資源の解放を指示する電子
計算機か否かの判断は、例えば、自電子計算機に割り当
てられている装置番号が、共有資源排他制御装置10に
接続されている各電子計算機に割り当てられている装置
番号中で、障害の発生した電子計算機に割り当てられて
いる装置番号の次に大きい装置番号であるか否かに基づ
いて行なう。但し、障害の発生した電子計算機に割り当
てられている装置番号が、共有資源排他制御装置10に
接続されている電子計算機に割り当てられている装置番
号の内で最も大きなものである場合は、最も小さな装置
番号が割り当てられている電子計算機を解放指示を行な
う電子計算機とする。
【0034】電子計算機間通信手段25,35は、通信
パス50を利用して電子計算機20,30間で通信を行
なう機能を有する。
【0035】通知管理手段26,36は、電子計算機間
通信手段25,35からの切断完了通知及び共有資源排
他制御装置10からの問い合わせを管理する機能,電子
計算機間通信手段25,35を使用して通信を行なう機
能,占有解除手段24,34を使用して自電子計算機2
0,30と共有資源排他制御装置10との間の接続パス
41,42及び自電子計算機20,30と共有資源15
との間の接続パス43,44を強制的に使用不可状態に
する機能を有する。
【0036】監視タイマ手段27,37は、それぞれ通
知管理手段26,36によって起動されてから一定時間
後に通知管理手段26,36に通知を行なう機能を有す
る。
【0037】図2〜図4は本発明の動作説明図であり、
以下各図を参照して本実施例の動作を説明する。尚、図
2〜図4に於いて、図1と同一符号は同一部分を表して
いる。
【0038】先ず、図2を参照し、共有資源排他制御装
置10では電子計算機20からの一定時間以内毎の正常
使用中通知に基づいて電子計算機20または接続パス4
1の障害を検出したのに対し、電子計算機20の通知処
理監視手段22ではまだ正常使用中通知手段21の障害
を検出していない場合の動作を説明する。
【0039】共有資源排他制御装置10内の通知受信監
視手段11は、電子計算機20からの一定時間以内毎の
正常使用中通知に基づいて電子計算機20または接続パ
ス41の障害を検出すると、障害通知手段12を用いて
正常使用中である電子計算機30の占有解除手段34に
対して障害通知を行なう。また、通知受信監視手段11
が一定時間以内毎の正常使用中通知を検出できなかった
場合、共有資源排他制御装置10はそれ以降、電子計算
機20からの使用を拒否する。
【0040】障害通知を受け取った電子計算機30の占
有解除手段34は、自電子計算機30が占有解除通知を
行なう電子計算機であるか否かを前述したようにして判
断する。この例の場合、共有資源排他制御装置10に接
続されている電子計算機は2台だけであるので、占有解
除手段34は自電子計算機30が占有解除通知を行なう
電子計算機であると判断する。
【0041】その後、占有解除手段34は、電子計算機
20が占有していた資源の状態を電子計算機20が使用
する前の状態に戻し、その後、通知管理手段36に対し
て共有資源排他制御装置10へ占有解除通知を行なって
良いか否かを問い合わせる。
【0042】この問い合せが行なわれると、通知管理手
段36は、障害の発生した電子計算機20からの切断完
了通知を受け取っているか否かを判断する。そして、切
断完了通知を受け取っている場合、即ち電子計算機20
に於いて共有資源排他制御装置10,共有資源15の強
制切断が既に行なわれている場合は占有解除手段34に
対して占有解除通知を行なって良い旨を通知し、受け取
っていない場合、即ち共有資源排他制御装置10,共有
資源15の強制切断がまだ行なわれていない場合は、電
子計算機20に於いて共有資源排他制御装置10,共有
資源15を強制切断させるため、電子計算機間通信手段
35を使用して電子計算機20に強制切断要求を送り、
更に、監視タイマ手段37を起動する。
【0043】この例の場合、通知管理手段36は電子計
算機20からの切断完了通知を受け取っていないため、
電子計算機間通信手段35を使用して電子計算機20に
対して共有資源排他制御装置10及び共有資源15の強
制切断要求を送ると共に、監視タイマ手段37を起動す
ることになる。
【0044】電子計算機30からの強制切断要求は、通
信パス50及び電子計算機20の電子計算機間通信手段
25を経由して通知管理手段26に届く。
【0045】これにより、通知管理手段26は、強制切
断手段23を使用し、共有資源排他制御装置10との間
の接続パス41及び共有資源15との間の接続パス43
を強制的に使用不可能状態にした後、電子計算機間通信
手段25を使用して電子計算機30に対して切断完了通
知を行なう。
【0046】電子計算機20からの切断完了通知は、通
信パス50及び電子計算機30の電子計算機間通信手段
35を経由して通知管理手段36に届く。
【0047】切断完了通知により電子計算機20での切
断完了を認識した通知管理手段36は、占有解除手段3
4に対して占有解除通知の実施を許可する。尚、通知管
理手段36は、監視タイマ手段37から一定時間が経過
したことが通知された場合も占有解除手段34に対して
占有解除通知の実施を許可するが、両者の内、最初に発
生した事象に基づいて占有解除手段34に対して許可を
与えるものであるので、電子計算機20からの切断完了
通知に基づいて許可を与えた後、監視タイマ手段37か
ら一定時間が経過したことが通知されたとしても、それ
は無視する。
【0048】許可を受けた占有解除手段34は、共有資
源排他制御装置10に対して電子計算機20が占有して
いた資源を解放することを要求する占有解除通知を行な
う。
【0049】この占有解除通知を受けた占有解除手段1
3は電子計算機20が占有していた資源を解放する。
【0050】上記したように、共有資源排他制御装置1
0の通知受信監視手段11が障害を検出しただけの場合
でも、電子計算機20に共有資源排他制御装置10及び
共有資源15の強制切断を行なわせて電子計算機20か
らそれらを使用できない状態にし、その後、共有資源排
他制御装置10の占有解除手段13に占有解除通知を行
なって電子計算機20が占有していた資源を解放させる
ので、複数の電子計算機により共有資源15が同時に使
用されることを確実に防止できる。
【0051】次に図3を参照し、電子計算機20の通知
処理監視手段22では正常使用中通知手段21の障害を
検出したのに対し、共有資源排他制御装置10の通知受
信監視手段11では電子計算機20または接続パス41
の障害を検出していない場合の動作を説明する。
【0052】電子計算機20の通知処理監視手段22
は、正常使用中通知手段21の障害を検出すると、強制
切断手段23を使用して共有資源排他制御装置10との
接続パス41及び共有資源15との接続パス43を強制
的に使用不可状態にし、その後、電子計算機間通信手段
25を使用して電子計算機30に対して切断完了通知を
行なう。
【0053】電子計算機20からの切断完了通知は、通
信パス50及び電子計算機30の電子計算機間通信手段
35を経由して通知管理手段36に届く。
【0054】通知管理手段36は、切断完了通知に基づ
いて電子計算機20で共有資源排他制御装置10,共有
資源15の強制切断が行なわれたことを確認すると、電
子計算機20から切断完了通知が送られてきたことを記
録した後、占有解除手段34に対して共有資源排他制御
装置10から障害通知を受けた場合と同様の処理を行な
うことを依頼する。
【0055】この依頼を受けた占有解除手段34は、自
電子計算機30が占有解除通知を行なう電子計算機であ
るので、電子計算機20が占有していた資源の状態を電
子計算機20が使用する前の状態に戻し、その後、通知
管理手段36に対して共有資源排他制御装置10へ占有
解除通知を行なって良いか否かを問い合わせる。
【0056】この問い合わせを受けると、通知管理手段
36は、電子計算機20からの切断完了通知を受け取っ
ているか否かを判断する。この場合、通知管理手段36
は電子計算機20からの切断完了通知を既に受け取って
いるので、占有解除手段34に対して占有解除通知を許
可することを通知する。
【0057】この許可通知を受けると、占有解除手段3
4は、共有資源排他制御装置10の占有解除手段13に
対し、電子計算機20が占有していた資源を解放するこ
とを要求する占有解除通知を行なう。
【0058】この占有解除通知を受けた占有解除手段1
3は電子計算機20が占有していた資源を解放する。
【0059】このように、共有資源排他制御装置10の
通知受信監視手段11が電子計算機20の障害を検出し
ていない時期であっても、通知処理監視手段22により
正常使用中通知手段21の障害が検出されれば、占有解
除手段13によって電子計算機20が占有していた資源
が解放されるので、他の電子計算機30が速やかに共有
資源15を使用することが可能になる。
【0060】次に図4を参照し、通信パス50の障害等
により電子計算機20と電子計算機30との間の通信が
不通になっている時に、共有資源排他制御装置10が電
子計算機20からの正常使用中通知を検出できなくなっ
た場合の動作を説明する。
【0061】共有資源排他制御装置10の通知受信監視
手段11は、電子計算機20からの一定時間以内毎の正
常使用中通知を検出できなかった場合、障害通知手段1
2を用いてを正常使用中である電子計算機30に対して
障害通知を行なう。また、通知受信監視手段11が一定
時間以内毎の正常使用中通知を検出できなかった場合、
共有資源排他制御装置10はそれ以降電子計算機20か
らの使用を拒否する。
【0062】この障害通知を受けた電子計算機30の占
有解除手段34は、自電子計算機30が占有解除通知を
行なう電子計算機であるので、電子計算機20が占有し
ていた資源の状態を電子計算機20が使用する前の状態
に戻し、その後、共有資源排他制御装置10へ占有解除
通知を行なっても良いか否かを通知管理手段36に問い
合わせる。
【0063】この問い合わせを受けると、通知管理手段
36は、電子計算機20からの切断完了通知を受け取っ
ていないため、占有解除手段34を使用して電子計算機
20に対し、共有資源排他制御装置10及び共有資源1
5の強制切断を要求すると共に、監視タイマ手段37を
起動する。
【0064】この処理に於いて、電子計算機20と電子
計算機30との間の通信パス50の障害により、電子計
算機20から電子計算機30への切断完了通知が正常に
行なわれなかった場合、通知管理手段36は、電子計算
機20からの切断完了通知を受け取る前に、監視タイマ
手段37から一定時間経過を通知される。尚、上記一定
時間は電子計算機20に対して共有資源排他制御装置1
0及び共有資源15の強制切断を要求した後、電子計算
機20から切断完了通知が送られてくるまでの時間より
も長い時間とすることが必要である。
【0065】この一定時間経過通知を受け取った通知管
理手段36は、通信パス50に障害が発生したと判断
し、電子計算機20からの切断完了通知を待たずに占有
解除手段34に対して占有解除通知の実施を指示する。
【0066】この指示を受けた占有解除手段34は、共
有資源排他制御装置10に対し、電子計算機20が占有
していた資源の解放を要求する。
【0067】この要求を受けた占有解除手段13は電子
計算機20が占有していた資源を解放する。
【0068】このように、通信パス50の障害等により
電子計算機間通信が行なえない状態になっても、電子計
算機30は占有解除手段34により電子計算機20が占
有していた資源を解放することができる。
【0069】
【発明の効果】以上説明したように、本発明は、共有資
源排他制御装置が正常使用中通知に基づいて電子計算機
の障害を検出した場合、先ず、共有資源排他制御装置か
ら正常な電子計算機に対して障害通知が行なわれ、次い
で、正常な電子計算機の内の特定の電子計算機から障害
の発生した電子計算機に対して共有資源排他制御装置,
共有資源の切断指示が行なわれ、次いで、共有資源排他
制御装置に対して障害の発生した電子計算機が占有して
いた資源の解放指示が行なわれるので、障害発生時に複
数の計算機が同時に共有資源を使用するということがな
くなる効果がある。
【0070】また、本発明は、自電子計算機から一定時
間以内毎に正常使用中通知が出力されなくなった場合、
自電子計算機と共有資源排他制御装置及び共有資源とを
切断し、その後、他の正常な電子計算機に対して電子計
算機間の通信パスを介して切断完了通知を送り、切断完
了通知を受けた電子計算機が共有資源排他制御装置に対
して正常使用中通知が出力されなくなった電子計算機が
占有していた資源の解放を要求するものであるので、障
害が発生した電子計算機が占有していた資源を他の正常
な電子計算機が速やかに使用することが可能になる効果
がある。
【0071】更に、本発明は、正常使用中通知に基づい
て電子計算機の障害を検出した共有資源排他制御装置か
らの障害通知を受けた正常な電子計算機がタイマを起動
し、タイマがタイムオーバした場合、障害の発生した電
子計算機と共有資源排他制御装置及び共有資源との切断
が完了したと推測して共有資源排他制御装置に対して障
害の発生した電子計算機が占有していた資源の解放を要
求するものであるので、通信パス等の電子計算機間の通
信機能に障害が発生した場合でも、障害の発生した電子
計算機が占有していた資源を解放することができる効果
がある。
【図面の簡単な説明】
【図1】本発明の実施例のブロック図である。
【図2】本発明の実施例の動作説明図である。
【図3】本発明の実施例の動作説明図である。
【図4】本発明の実施例の動作説明図である。
【符号の説明】
10…共有資源排他制御装置 11…通知受信監視手段 12…障害通知手段 13…占有解除手段 15…共有資源 20,30…電子計算機 21,31…正常使用中通知手段 22,32…通知処理監視手段 23,33…強制切断手段 24,34…占有解除手段 25,35…電子計算機間通信手段 26,36…通知管理手段 27,37…監視タイマ手段 41,42,43,44…接続パス 50…通信パス

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数の電子計算機と、 該複数の電子計算機に接続され、該複数の電子計算機に
    よって共有される共用資源と、 前記複数の電子計算機に接続され、前記複数の電子計算
    機による前記共有資源の使用を排他的に制御する共有資
    源排他制御装置とを備えた疎結合電子計算機システムに
    於いて、 前記複数の電子計算機の間それぞれに通信パスを設け、 前記各電子計算機は、一定時間以内毎に前記共有資源排
    他制御装置に対して正常使用中通知を行ない、 前記共有資源排他制御装置は、前記各電子計算機からの
    正常使用中通知に基づいて電子計算機の障害または前記
    共有資源排他制御装置と電子計算機との間の接続パスの
    障害を検出することにより他の正常な電子計算機に障害
    通知を行ない、 該障害通知を受けた電子計算機の内の特定の電子計算機
    は、前記障害の発生した電子計算機または共有資源排他
    制御装置との間の接続パスに障害の発生した電子計算機
    に対して前記通信パスを介してその電子計算機に接続さ
    れている共有資源排他制御装置及び共有資源の切断を指
    示し、 共有資源排他制御装置及び共有資源の切断を指示された
    電子計算機は、前記共有資源排他制御装置及び前記共有
    資源を自電子計算機から切断し、切断が完了することに
    より前記特定の電子計算機に対して前記通信パスを介し
    て切断完了通知を行ない、 該切断完了通知を受けた前記特定の電子計算機は、前記
    共有資源排他制御装置に対して前記障害の発生した電子
    計算機または前記共有資源排他制御装置との間の接続パ
    スに障害が発生した電子計算機が占有していた資源の解
    放指示を行ない、 該解放指示を受けた前記共有資源排他制御装置は、前記
    障害の発生した電子計算機または前記共有資源排他制御
    装置との間の接続パスに障害が発生した電子計算機が占
    有していた資源を解放することを特徴とする疎結合電子
    計算機システムのリカバリ方式。
  2. 【請求項2】 前記各電子計算機は、自電子計算機から
    一定時間以内毎に正常使用中通知が出力されなくなった
    ことを検出することにより、自電子計算機に接続されて
    いる共有資源排他制御装置及び共有資源を切断し、その
    後、他の電子計算機に対して前記通信パスを介して切断
    完了通知を行ない、 該切断完了通知を受けた電子計算機の内の特定の電子計
    算機は、前記共有資源排他制御装置に対して正常使用中
    通知が出力されなくなった電子計算機が占有していた資
    源の解放指示を行なうことを特徴とする請求項1記載の
    疎結合電子計算機システムのリカバリ方式。
  3. 【請求項3】 前記障害通知を受けた電子計算機の内の
    特定の電子計算機は、前記障害の発生した電子計算機に
    対してその電子計算機に接続されている共有資源排他制
    御装置及び共有資源の切断を要求すると共にタイマを起
    動し、該タイマがタイムオーバすることにより或いは前
    記障害の発生した電子計算機から切断完了通知が送られ
    てくることにより前記共有資源排他制御装置に対して前
    記障害の発生した電子計算機が占有していた資源の解放
    指示を行なうことを特徴とする請求項2記載の疎結合電
    子計算機システムのリカバリ方式。
JP5110976A 1993-04-14 1993-04-14 疎結合電子計算機システムのリカバリ方式 Pending JPH06301658A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5110976A JPH06301658A (ja) 1993-04-14 1993-04-14 疎結合電子計算機システムのリカバリ方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5110976A JPH06301658A (ja) 1993-04-14 1993-04-14 疎結合電子計算機システムのリカバリ方式

Publications (1)

Publication Number Publication Date
JPH06301658A true JPH06301658A (ja) 1994-10-28

Family

ID=14549262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5110976A Pending JPH06301658A (ja) 1993-04-14 1993-04-14 疎結合電子計算機システムのリカバリ方式

Country Status (1)

Country Link
JP (1) JPH06301658A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011164918A (ja) * 2010-02-09 2011-08-25 Nec Corp データベース管理装置、データベース管理方法、及びプログラム
JP2015141589A (ja) * 2014-01-29 2015-08-03 Necプラットフォームズ株式会社 サーバ装置、サーバシステムおよび障害対策方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6242242A (ja) * 1985-08-20 1987-02-24 Matsushita Electric Ind Co Ltd Cpuの異常監視装置
JPS6356755A (ja) * 1986-08-28 1988-03-11 Fujitsu Ltd スレ−ブプロセツサの異常監視方式
JPS63157257A (ja) * 1986-12-22 1988-06-30 Nec Corp マルチプロセツサ構成における資源制御方式
JPH03240859A (ja) * 1990-02-19 1991-10-28 Nec Corp マルチプロセッサ共有資源管理方式
JPH04127261A (ja) * 1990-09-18 1992-04-28 Fujitsu Ltd マルチプロセッサシステム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6242242A (ja) * 1985-08-20 1987-02-24 Matsushita Electric Ind Co Ltd Cpuの異常監視装置
JPS6356755A (ja) * 1986-08-28 1988-03-11 Fujitsu Ltd スレ−ブプロセツサの異常監視方式
JPS63157257A (ja) * 1986-12-22 1988-06-30 Nec Corp マルチプロセツサ構成における資源制御方式
JPH03240859A (ja) * 1990-02-19 1991-10-28 Nec Corp マルチプロセッサ共有資源管理方式
JPH04127261A (ja) * 1990-09-18 1992-04-28 Fujitsu Ltd マルチプロセッサシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011164918A (ja) * 2010-02-09 2011-08-25 Nec Corp データベース管理装置、データベース管理方法、及びプログラム
JP2015141589A (ja) * 2014-01-29 2015-08-03 Necプラットフォームズ株式会社 サーバ装置、サーバシステムおよび障害対策方法

Similar Documents

Publication Publication Date Title
US7418627B2 (en) Cluster system wherein failover reset signals are sent from nodes according to their priority
US5875290A (en) Method and program product for synchronizing operator initiated commands with a failover process in a distributed processing system
JP4695705B2 (ja) クラスタシステムおよびノード切り替え方法
US20080288812A1 (en) Cluster system and an error recovery method thereof
JP3537281B2 (ja) 共有ディスク型多重系システム
US6002665A (en) Technique for realizing fault-tolerant ISDN PBX
CN101110608B (zh) 一种主备板数据检测的方法、系统和装置
JP2773424B2 (ja) ネットワークシステムおよび接続コンピュータ切替え方法
JPH06301658A (ja) 疎結合電子計算機システムのリカバリ方式
JP3025732B2 (ja) 多重化コンピュータシステムの制御方式
JPH10116261A (ja) 並列計算機システムのチェックポイントリスタート方法
JP5691248B2 (ja) タスク引継プログラム、処理装置及びコンピュータ・システム
JPH07141308A (ja) 情報処理システムにおけるバックアップ方法
JP4284732B2 (ja) 生産システム
JPH08329023A (ja) 並列電子計算機システム
JPH05224964A (ja) バス異常通知方式
KR960010879B1 (ko) 공통의 버스 자원을 공유한 다수 프로세서의 버스 이중화 제어 및 버스 이상 상태 발생시 복구 처리방법
JP2885583B2 (ja) 通信手順制御システム
JP3411309B2 (ja) マルチキャスト通信システム
JPH03237556A (ja) マルチホストシステムの通信管理方式
JPS5962967A (ja) マルチ計算機システムにおけるコントロ−ルステ−シヨン構成制御方式
JPH02310755A (ja) ヘルスチェック方式
JPH07200335A (ja) 高信頼化プラットフォーム
JPS6375843A (ja) 異常監視方式
JPH11110325A (ja) 情報処理システム