JPH0740690B2

JPH0740690B2 - マスタ−コントロ−ルステ−シヨンのバツクアツプ方法

Info

Publication number: JPH0740690B2
Application number: JP60279178A
Authority: JP
Inventors: 克男鈴木; 広和笠嶋
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1985-12-13
Filing date: 1985-12-13
Publication date: 1995-05-01
Anticipated expiration: 2010-05-01
Also published as: JPS62139442A

Description

【発明の詳細な説明】〔発明の利用分野〕本発明は多重計算機システムに於るマスターコントロー
ルステーシヨンのバツクアツプ方法に関するものであ
る。

〔発明の背景〕

多重計算機システムは、システムの処理性，信頼性及び
拡張性を向上させることを目的として構成される。第11
図はそのような多重系計算機システムの一例を示すもの
で、各処理装置１〜５には対応するコントロールステー
シヨン６〜10（以下CSTと略記する）が設けられ、処理
装置１台と対応CSTとで１つのノードを構成する。但し
各CSTは対応処理装置と伝送路11間のデータ転送制御を
行うとともに、複数の処理装置から同時にデータ送出が
行われて伝送路11上で衝突しないように、伝送路内の１
つのCSTがマスターとなつてこれがこの転送の優先制御
を行う。そしてマスターCSTのノードが異常となつた時
のバツクアツプは以下のように行われていた（「HIDIC
V90シリーズプロセスモニタシステムマルチコンピユー
タシステム編」マニユアルp51参照）。

第12図はこのような多重系計算機システムにおける正常
状態での従来のマスターCST管理方式の構成例を示すも
ので、処理装置間共有メモリ15内のシステム構成監視テ
ーブル16を使用して、処理装置１が２を、処理装置２が
３を、また処理装置３が１を相互監視している。一方、
伝送路11内のデータ転送の占有制御はCST7が行つている
ものとする。このようなシステムで正常状態が損われ、
第13図のようにマスターCST7対応の処理装置２がダウン
した場合、これを監視していた処理装置１が共有メモリ
15内のシステム構成監視テーブル16を書き換えて処理装
置２を死の状態にし、それ以降は処理装置１が３をまた
処理装置３が１を相互監視する。また同時にマスターCS
TはCST6,8のうちのいずれか一方となり、伝送路11内の
データ転送の占有制御を行う。なお、通常は早い者勝ち
でマスターCSTとなり、システム構成監視テーブル16に
自分をマスターとして登録する。

ところが、以上の従来方式によると、処理装置の相互監
視のために処理装置間の共有メモリが必要になるだけで
なく、処理装置が１対１の関係で他の処理装置の監視を
行つているから、異常発生時や処理装置の増設時の監視
テーブルの書き換えが複雑となり、これはマスターCST
のバツクアツプ実現時にも大きな障害になつているとい
う問題があつた。

〔発明の目的〕

本発明の目的は、多重系計算機システムにおいて特殊な
ハードウエアを必要としない、安価で実現容易な、マス
ターコトロールステーシヨンのバツクアツプ方法を提供
するにある。

〔発明の概要〕

本発明は、各ノードが自ノードの生存報告データを周期
的に伝送路上に送出しかつ伝送路上の全てのノードから
の生存報告データをとり込んで自ノード内に設けたシス
テム構成監視テーブルを作成・更新し、このテーブルを
参照して生状態のノードの各々が他ノードの生死の監視
を行うようにするとともに、マスターCSTがダウンした
時には当該ダウンしたノードからの報告データにより生
状態のノードがCSTダウンを検出し、予め定められた順
位を有するノードが自ノードのCSTをマスターCSTとする
ように制御することでマスターCSTのバツクアツプを実
現するようにしたことを特徴とするものである。

〔発明の実施例〕

以下、本発明を実施例により詳細に説明する。

第１図は本発明を適用したシステムに於る、正常状態を
示すもので、各処理装置１〜３とCST6〜８はそれぞれノ
ードN1〜N3を形成しており、このうちのマスターCST7が
伝送路11の占有制御を行つている。各ノードN1〜N3から
は周期的に生存報告データ22,24,26が伝送路11へ送出さ
れ、これらは受信データ21,23,25として各ノードで受信
され、各ノードのシステム構成監視テーブル31〜33に書
き込まれる。

第２図は第１図のシステムで、マスターCST7を含むノー
ドN2が異常になつた状態を示す。すなわち、マスターCS
T7対応の処理装置２がダウンすると、生存報告データ24
が処理装置２の死状態を他へ知らせるから、処理装置1,
3はそれぞれのシステム構成監視テーブル31,33を参照
し、処理装置３はシステム構成監視テーブルの配列順を
もとにCST8をマスターCSTにする。また処理装置１はシ
ステム構成監視テーブルの配列順をもとにCST6はマスタ
ーになるべきではないと判断し、伝送路の回復を待つ。

以上のような本発明の方法の細部を以下に詳述する。第
３図は各ノード内に設けられたシステム構成監視テーブ
ルのフオーマツト例を示したもので、各ノード毎の生死
状態を生は０、死は１なるフラグで、またマスターCST
か否かをマスターのとき１、そうでない時０なるフラグ
で示している。第３図のフラグの例は（）の付かない
場合が第１図に、（）のついたものが第２図の状態に
対応する。

第４図は生存報告データ22,24,26等の伝送フオーマツト
であり、データの性質、属性を表わす制御部39、発信ノ
ードを示す発信ノード番号40、及び該当ノードのCSTが
マスターか否かを示すフラグ41から構成される。

第５図は各ノードの生存報告処理のフローチヤートであ
つて、まずステツプ42にて自ノードのCSTがマスターか
否かを判断し、マスターCSTなら第４図のフラグ41にマ
スターで生存を示すフラグを立て（ステツプ43）、反対
にマスターCSTでなければ生存報告のフラグを立てる
（ステツプ44）。

第６図は各ノードの生存報受信処理のフローチヤートで
あつて、まず該当ノードのCSTがマスターか否かを判定
し（ステツプ45）、マスターCSTならシステム構成監視
テーブル内の該当ノード部をマスターでかつ生存状態の
フラグにする（ステツプ46）。反対にマスターCSTでな
ければシステム構成監視テーブル内の該当ノード部を単
なる生存状態（CST）にする（ステツプ47）。

第７図は各ノードの伝送路異常処理のフローチヤートで
あつて、マスターCSTのノードから生存報告なし（死状
態）のとき（ステツプ48,59）、またはマスターCSTにな
つていたノードがダウンしたことによる伝送路ダウン
（ステツプ48,49）であるときは、ステツプ50にて自ノ
ードのCSTがマスターになるべきか否かを判断する。こ
の判断は、予めマスターCSTになる順位を、例えばノー
ド番号1,2,……でマスター２がダウンなら次の３という
ように定めておけばよい。そして自ノードのCSTがマス
ターになるべきと決定したときには、まずシステム構成
監視テーブルの該当ノード部を死の状態にし（ステツプ
51）、次に自ノード内のデータ転送を行う送信タスクの
実行を休止状態にする（ステツプ52）。そして自ノード
のCSTをマスターにし（ステツプ53）、同時にシステム
構成監視テーブル内の自ノード部を生存状態（マスター
CST）にする（ステツプ54）。その後、送信タスクの実
行を開始する（ステツプ55）。

自ノードのCSTがマスターで伝送路異常（ギブアツプ）
となつた場合（ステツプ49）、又は伝送路ダウンでも自
ノードのCSTがマスターになるべきでないと決定したと
きには（ステツプ50）、システム構成監視テーブルの該
当ノード部を死の状態にし（ステツプ56）、次に自ノー
ド内のデータ転送を行う送信タスクの実行を休止状態に
し（ステツプ57）、そしてループ回復タイマをセツトし
一定時間休止する（ステツプ58）。

マスターでないCSTから生存報告がなかつた時（ステツ
プ48,59）は、システム構成監視テーブル内の該当ノー
ド部を死の状態にする（ステツプ60）。

第８図は第７図のステツプ58でセツトされる各ノードの
伝送路回復タイマタイムアウト処理のフローチヤートで
あつて、伝送路回復タイマがタイムアウトになつた時点
で送信タスクの実行を再開する（ステツプ61）。ここで
伝送路が回復していなければ、再度第７図に示した異常
処理を行う。

第９図は、第７図のステツプ57で休止中となつていたノ
ードに対し、他ノードによる伝送路回復が行われたとき
の処理を示すもので、このときは伝送路回復中のメツセ
ージが連絡されてくる。そうするとまず伝送路回復タイ
マをタイムアウトを持たずにすぐリセツトし（ステツプ
62）、次に送信タスクの実行を再開する（ステツプ6
3）。

以上に説明した本発明の実施例によつたときのマスター
CSTのバツクアツプ方法を第10図の多重系計算機システ
ムによつて説明する。同図に於て、各処理装置１〜５内
のシステム構成監視テーブル31〜35の初期値は全ノード
死の状態にしておく。この状態で処理装置２が最初に立
ち上がつたとするとまず自ノードのCST7がマスターとさ
れ、またシステム構成監視テーブル32内の自ノード部を
生存状態（マスターCST）にする。次に処理装置１が立
ち上がつたときは、まず、システム構成監視テーブル31
内の自ノード部を生存状態（CST）にする。さらに処理
装置２の生存報告データ21を受けた場合には該当ノード
部を生存状態（マスターCST）にする。同様に処理装置
２のノードで処理装置１のノードの生存報告23を受けた
場合にはシステム構成監視テーブル32内の該当ノード部
を生存状態（CST）にする。以下順次同様の手順にて、
処理装置３〜５の各ノードが立ち上がつていく。このよ
うにして全ノードが稼動状態になつた後、マスターCST7
を所持する処理装置２がダウンした場合は、システム監
視テーブル内で次の生存ノードである処理装置３のノー
ドのCST8がマスターCSTになり、伝送路を回復する。ま
た処理装置1,3〜５内のシステム構成監視テーブル31,33
〜35内の、処理装置２のノード部はそれぞれ死の状態に
なる。

本発明によると、仮に処理装置５が後の段階で増設され
たノードであつたとすると、各ノードのシステム構成監
視テーブル31〜34に処理装置５のノードのためのエント
リイが確保さえしてあれば、周期的にブロードキヤスト
される各ノードの生存報告データを生成・更新すること
により、伝送路内のマスターCSTバツクアツプノードの
一候補となることが容易である。

〔発明の効果〕

以上の説明から明らかなように、本発明によれば、低価
格でかつシステムの拡張が容易に行えるマスターCSTの
バツクアツプ方法を実現することができる。

【図面の簡単な説明】

第１図及び第２図は本発明のマスターCST管理方法の概
略説明図、第３図はシステム構成監視テーブルの説明
図、第４図は伝送路上の生存報告データのフオーマツト
を示す図、第５図は各ノードの生存報告処理のフローチ
ヤート、第６図は各ノードの生存報告受信処理のフロー
チヤート、第７図は各ノードの伝送路異常処理のフロー
チヤート、第８図は各ノードの伝送路回復タイマタイム
アウト処理のフローチヤート、第９図は各ノードの伝送
路回復中のメツセージ受信処理のフローチヤート、第10
図は本発明を適用した多重計算機システムを示す図、第
11図は多重計算機システムの例を示す図、第12図及び第
13図は従来のマスターCST管理方法の説明図である。１〜５……処理装置、６〜10……コントロールステーシ
ヨン、21,23,28,27,29……受信データ、22,24,26,28,30
……生存報告データ、31〜35……システム構成監視テー
ブル。

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開昭60−173953（ＪＰ，Ａ) 特開昭53−72403（ＪＰ，Ａ) 特開昭61−228750（ＪＰ，Ａ)

Claims

【特許請求の範囲】

【請求項１】複数の計算機が夫々自局のコントロールス
テーションを介して１つの伝送路に接続され、この複数
のコントロールステーションの１つがマスターとなって
該伝送路の占有制御を行う多重計算機システムのマスタ
ーコントロールステーションのバックアップ方法におい
て、各計算機は周期的に他の計算機宛に自局の生存報告
データをブロードキャストし、各計算機は他の計算機か
ら報告された生存報告データに基づき各々保有するシス
テム構成監視テーブルの内容を更新して多重計算機シス
テムを構成する各計算機の生死状態を監視し、マスター
コントロールステーションに対応する計算機に異常が発
生した場合には、該計算機から生存報告データのブロー
ドキャストの無いことを各計算機が夫々自己の保有する
システム構成監視テーブルの内容から知ると共に、各計
算機は予め定められた順番により次にマスターとなるべ
き計算機を判断して動作することを特徴とするマスター
コントロールステーションのバックアップ方法。