JPH0740690B2 - マスタ−コントロ−ルステ−シヨンのバツクアツプ方法 - Google Patents

マスタ−コントロ−ルステ−シヨンのバツクアツプ方法

Info

Publication number
JPH0740690B2
JPH0740690B2 JP60279178A JP27917885A JPH0740690B2 JP H0740690 B2 JPH0740690 B2 JP H0740690B2 JP 60279178 A JP60279178 A JP 60279178A JP 27917885 A JP27917885 A JP 27917885A JP H0740690 B2 JPH0740690 B2 JP H0740690B2
Authority
JP
Japan
Prior art keywords
master
node
cst
computer
system configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60279178A
Other languages
English (en)
Other versions
JPS62139442A (ja
Inventor
克男 鈴木
広和 笠嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60279178A priority Critical patent/JPH0740690B2/ja
Publication of JPS62139442A publication Critical patent/JPS62139442A/ja
Publication of JPH0740690B2 publication Critical patent/JPH0740690B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Small-Scale Networks (AREA)

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は多重計算機システムに於るマスターコントロー
ルステーシヨンのバツクアツプ方法に関するものであ
る。
〔発明の背景〕
多重計算機システムは、システムの処理性,信頼性及び
拡張性を向上させることを目的として構成される。第11
図はそのような多重系計算機システムの一例を示すもの
で、各処理装置1〜5には対応するコントロールステー
シヨン6〜10(以下CSTと略記する)が設けられ、処理
装置1台と対応CSTとで1つのノードを構成する。但し
各CSTは対応処理装置と伝送路11間のデータ転送制御を
行うとともに、複数の処理装置から同時にデータ送出が
行われて伝送路11上で衝突しないように、伝送路内の1
つのCSTがマスターとなつてこれがこの転送の優先制御
を行う。そしてマスターCSTのノードが異常となつた時
のバツクアツプは以下のように行われていた(「HIDIC
V90シリーズプロセスモニタシステムマルチコンピユー
タシステム編」マニユアルp51参照)。
第12図はこのような多重系計算機システムにおける正常
状態での従来のマスターCST管理方式の構成例を示すも
ので、処理装置間共有メモリ15内のシステム構成監視テ
ーブル16を使用して、処理装置1が2を、処理装置2が
3を、また処理装置3が1を相互監視している。一方、
伝送路11内のデータ転送の占有制御はCST7が行つている
ものとする。このようなシステムで正常状態が損われ、
第13図のようにマスターCST7対応の処理装置2がダウン
した場合、これを監視していた処理装置1が共有メモリ
15内のシステム構成監視テーブル16を書き換えて処理装
置2を死の状態にし、それ以降は処理装置1が3をまた
処理装置3が1を相互監視する。また同時にマスターCS
TはCST6,8のうちのいずれか一方となり、伝送路11内の
データ転送の占有制御を行う。なお、通常は早い者勝ち
でマスターCSTとなり、システム構成監視テーブル16に
自分をマスターとして登録する。
ところが、以上の従来方式によると、処理装置の相互監
視のために処理装置間の共有メモリが必要になるだけで
なく、処理装置が1対1の関係で他の処理装置の監視を
行つているから、異常発生時や処理装置の増設時の監視
テーブルの書き換えが複雑となり、これはマスターCST
のバツクアツプ実現時にも大きな障害になつているとい
う問題があつた。
〔発明の目的〕
本発明の目的は、多重系計算機システムにおいて特殊な
ハードウエアを必要としない、安価で実現容易な、マス
ターコトロールステーシヨンのバツクアツプ方法を提供
するにある。
〔発明の概要〕
本発明は、各ノードが自ノードの生存報告データを周期
的に伝送路上に送出しかつ伝送路上の全てのノードから
の生存報告データをとり込んで自ノード内に設けたシス
テム構成監視テーブルを作成・更新し、このテーブルを
参照して生状態のノードの各々が他ノードの生死の監視
を行うようにするとともに、マスターCSTがダウンした
時には当該ダウンしたノードからの報告データにより生
状態のノードがCSTダウンを検出し、予め定められた順
位を有するノードが自ノードのCSTをマスターCSTとする
ように制御することでマスターCSTのバツクアツプを実
現するようにしたことを特徴とするものである。
〔発明の実施例〕
以下、本発明を実施例により詳細に説明する。
第1図は本発明を適用したシステムに於る、正常状態を
示すもので、各処理装置1〜3とCST6〜8はそれぞれノ
ードN1〜N3を形成しており、このうちのマスターCST7が
伝送路11の占有制御を行つている。各ノードN1〜N3から
は周期的に生存報告データ22,24,26が伝送路11へ送出さ
れ、これらは受信データ21,23,25として各ノードで受信
され、各ノードのシステム構成監視テーブル31〜33に書
き込まれる。
第2図は第1図のシステムで、マスターCST7を含むノー
ドN2が異常になつた状態を示す。すなわち、マスターCS
T7対応の処理装置2がダウンすると、生存報告データ24
が処理装置2の死状態を他へ知らせるから、処理装置1,
3はそれぞれのシステム構成監視テーブル31,33を参照
し、処理装置3はシステム構成監視テーブルの配列順を
もとにCST8をマスターCSTにする。また処理装置1はシ
ステム構成監視テーブルの配列順をもとにCST6はマスタ
ーになるべきではないと判断し、伝送路の回復を待つ。
以上のような本発明の方法の細部を以下に詳述する。第
3図は各ノード内に設けられたシステム構成監視テーブ
ルのフオーマツト例を示したもので、各ノード毎の生死
状態を生は0、死は1なるフラグで、またマスターCST
か否かをマスターのとき1、そうでない時0なるフラグ
で示している。第3図のフラグの例は( )の付かない
場合が第1図に、( )のついたものが第2図の状態に
対応する。
第4図は生存報告データ22,24,26等の伝送フオーマツト
であり、データの性質、属性を表わす制御部39、発信ノ
ードを示す発信ノード番号40、及び該当ノードのCSTが
マスターか否かを示すフラグ41から構成される。
第5図は各ノードの生存報告処理のフローチヤートであ
つて、まずステツプ42にて自ノードのCSTがマスターか
否かを判断し、マスターCSTなら第4図のフラグ41にマ
スターで生存を示すフラグを立て(ステツプ43)、反対
にマスターCSTでなければ生存報告のフラグを立てる
(ステツプ44)。
第6図は各ノードの生存報受信処理のフローチヤートで
あつて、まず該当ノードのCSTがマスターか否かを判定
し(ステツプ45)、マスターCSTならシステム構成監視
テーブル内の該当ノード部をマスターでかつ生存状態の
フラグにする(ステツプ46)。反対にマスターCSTでな
ければシステム構成監視テーブル内の該当ノード部を単
なる生存状態(CST)にする(ステツプ47)。
第7図は各ノードの伝送路異常処理のフローチヤートで
あつて、マスターCSTのノードから生存報告なし(死状
態)のとき(ステツプ48,59)、またはマスターCSTにな
つていたノードがダウンしたことによる伝送路ダウン
(ステツプ48,49)であるときは、ステツプ50にて自ノ
ードのCSTがマスターになるべきか否かを判断する。こ
の判断は、予めマスターCSTになる順位を、例えばノー
ド番号1,2,……でマスター2がダウンなら次の3という
ように定めておけばよい。そして自ノードのCSTがマス
ターになるべきと決定したときには、まずシステム構成
監視テーブルの該当ノード部を死の状態にし(ステツプ
51)、次に自ノード内のデータ転送を行う送信タスクの
実行を休止状態にする(ステツプ52)。そして自ノード
のCSTをマスターにし(ステツプ53)、同時にシステム
構成監視テーブル内の自ノード部を生存状態(マスター
CST)にする(ステツプ54)。その後、送信タスクの実
行を開始する(ステツプ55)。
自ノードのCSTがマスターで伝送路異常(ギブアツプ)
となつた場合(ステツプ49)、又は伝送路ダウンでも自
ノードのCSTがマスターになるべきでないと決定したと
きには(ステツプ50)、システム構成監視テーブルの該
当ノード部を死の状態にし(ステツプ56)、次に自ノー
ド内のデータ転送を行う送信タスクの実行を休止状態に
し(ステツプ57)、そしてループ回復タイマをセツトし
一定時間休止する(ステツプ58)。
マスターでないCSTから生存報告がなかつた時(ステツ
プ48,59)は、システム構成監視テーブル内の該当ノー
ド部を死の状態にする(ステツプ60)。
第8図は第7図のステツプ58でセツトされる各ノードの
伝送路回復タイマタイムアウト処理のフローチヤートで
あつて、伝送路回復タイマがタイムアウトになつた時点
で送信タスクの実行を再開する(ステツプ61)。ここで
伝送路が回復していなければ、再度第7図に示した異常
処理を行う。
第9図は、第7図のステツプ57で休止中となつていたノ
ードに対し、他ノードによる伝送路回復が行われたとき
の処理を示すもので、このときは伝送路回復中のメツセ
ージが連絡されてくる。そうするとまず伝送路回復タイ
マをタイムアウトを持たずにすぐリセツトし(ステツプ
62)、次に送信タスクの実行を再開する(ステツプ6
3)。
以上に説明した本発明の実施例によつたときのマスター
CSTのバツクアツプ方法を第10図の多重系計算機システ
ムによつて説明する。同図に於て、各処理装置1〜5内
のシステム構成監視テーブル31〜35の初期値は全ノード
死の状態にしておく。この状態で処理装置2が最初に立
ち上がつたとするとまず自ノードのCST7がマスターとさ
れ、またシステム構成監視テーブル32内の自ノード部を
生存状態(マスターCST)にする。次に処理装置1が立
ち上がつたときは、まず、システム構成監視テーブル31
内の自ノード部を生存状態(CST)にする。さらに処理
装置2の生存報告データ21を受けた場合には該当ノード
部を生存状態(マスターCST)にする。同様に処理装置
2のノードで処理装置1のノードの生存報告23を受けた
場合にはシステム構成監視テーブル32内の該当ノード部
を生存状態(CST)にする。以下順次同様の手順にて、
処理装置3〜5の各ノードが立ち上がつていく。このよ
うにして全ノードが稼動状態になつた後、マスターCST7
を所持する処理装置2がダウンした場合は、システム監
視テーブル内で次の生存ノードである処理装置3のノー
ドのCST8がマスターCSTになり、伝送路を回復する。ま
た処理装置1,3〜5内のシステム構成監視テーブル31,33
〜35内の、処理装置2のノード部はそれぞれ死の状態に
なる。
本発明によると、仮に処理装置5が後の段階で増設され
たノードであつたとすると、各ノードのシステム構成監
視テーブル31〜34に処理装置5のノードのためのエント
リイが確保さえしてあれば、周期的にブロードキヤスト
される各ノードの生存報告データを生成・更新すること
により、伝送路内のマスターCSTバツクアツプノードの
一候補となることが容易である。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、低価
格でかつシステムの拡張が容易に行えるマスターCSTの
バツクアツプ方法を実現することができる。
【図面の簡単な説明】
第1図及び第2図は本発明のマスターCST管理方法の概
略説明図、第3図はシステム構成監視テーブルの説明
図、第4図は伝送路上の生存報告データのフオーマツト
を示す図、第5図は各ノードの生存報告処理のフローチ
ヤート、第6図は各ノードの生存報告受信処理のフロー
チヤート、第7図は各ノードの伝送路異常処理のフロー
チヤート、第8図は各ノードの伝送路回復タイマタイム
アウト処理のフローチヤート、第9図は各ノードの伝送
路回復中のメツセージ受信処理のフローチヤート、第10
図は本発明を適用した多重計算機システムを示す図、第
11図は多重計算機システムの例を示す図、第12図及び第
13図は従来のマスターCST管理方法の説明図である。 1〜5……処理装置、6〜10……コントロールステーシ
ヨン、21,23,28,27,29……受信データ、22,24,26,28,30
……生存報告データ、31〜35……システム構成監視テー
ブル。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭60−173953(JP,A) 特開 昭53−72403(JP,A) 特開 昭61−228750(JP,A)

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】複数の計算機が夫々自局のコントロールス
    テーションを介して1つの伝送路に接続され、この複数
    のコントロールステーションの1つがマスターとなって
    該伝送路の占有制御を行う多重計算機システムのマスタ
    ーコントロールステーションのバックアップ方法におい
    て、各計算機は周期的に他の計算機宛に自局の生存報告
    データをブロードキャストし、各計算機は他の計算機か
    ら報告された生存報告データに基づき各々保有するシス
    テム構成監視テーブルの内容を更新して多重計算機シス
    テムを構成する各計算機の生死状態を監視し、マスター
    コントロールステーションに対応する計算機に異常が発
    生した場合には、該計算機から生存報告データのブロー
    ドキャストの無いことを各計算機が夫々自己の保有する
    システム構成監視テーブルの内容から知ると共に、各計
    算機は予め定められた順番により次にマスターとなるべ
    き計算機を判断して動作することを特徴とするマスター
    コントロールステーションのバックアップ方法。
JP60279178A 1985-12-13 1985-12-13 マスタ−コントロ−ルステ−シヨンのバツクアツプ方法 Expired - Lifetime JPH0740690B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60279178A JPH0740690B2 (ja) 1985-12-13 1985-12-13 マスタ−コントロ−ルステ−シヨンのバツクアツプ方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60279178A JPH0740690B2 (ja) 1985-12-13 1985-12-13 マスタ−コントロ−ルステ−シヨンのバツクアツプ方法

Publications (2)

Publication Number Publication Date
JPS62139442A JPS62139442A (ja) 1987-06-23
JPH0740690B2 true JPH0740690B2 (ja) 1995-05-01

Family

ID=17607529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60279178A Expired - Lifetime JPH0740690B2 (ja) 1985-12-13 1985-12-13 マスタ−コントロ−ルステ−シヨンのバツクアツプ方法

Country Status (1)

Country Link
JP (1) JPH0740690B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007195082A (ja) * 2006-01-23 2007-08-02 Yokogawa Electric Corp 通信機能診断システムおよび通信機能診断方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2619401B2 (ja) * 1987-08-14 1997-06-11 日本電信電話株式会社 伝送系システム構成方式
JP2576999B2 (ja) * 1987-08-14 1997-01-29 日本電信電話株式会社 伝送系システム構成方式
JP2606585B2 (ja) * 1993-06-11 1997-05-07 日本電気株式会社 リングネットワークシステム及びリングネットワークシステムにおけるノード情報収集方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5372403A (en) * 1976-12-10 1978-06-27 Hitachi Ltd Loop communication system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007195082A (ja) * 2006-01-23 2007-08-02 Yokogawa Electric Corp 通信機能診断システムおよび通信機能診断方法

Also Published As

Publication number Publication date
JPS62139442A (ja) 1987-06-23

Similar Documents

Publication Publication Date Title
US7444537B2 (en) System and method for communicating a software-generated pulse waveform between two servers in a network
US20100042715A1 (en) Method and systems for redundant server automatic failover
JP2001101033A (ja) オペレーティングシステム及びアプリケーションプログラムの障害監視方法
JPH10116254A (ja) 分散型のコンピュータ・システム
JPH10105486A (ja) 分散型のコンピュータ・システム
CN109150662B (zh) 消息传输方法、分布式系统、设备、介质和无人车
US7499987B2 (en) Deterministically electing an active node
JP2679674B2 (ja) 半導体製造ライン制御装置
CN114764380A (zh) 一种基于etcd的分布式集群控制方法和装置
US7200781B2 (en) Detecting and diagnosing a malfunctioning host coupled to a communications bus
JPH0740690B2 (ja) マスタ−コントロ−ルステ−シヨンのバツクアツプ方法
US11630503B2 (en) Methods for multidrop network system
CN112527561B (zh) 基于物联网云存储的数据备份方法及装置
CN114629783B (zh) 状态监控方法、系统、设备及计算机可读存储介质
US20230229572A1 (en) Cluster system and restoration method
JP3062904B2 (ja) 分散型計算機システムのデータ伝送方式
CN117493024B (zh) 多进程异构程序的迁移方法、存储介质及电子设备
WO2024119777A1 (zh) 框式设备通信链路异常处理方法、框式设备及介质
JPH1117713A (ja) マルチキャスト通信処理方式
JP3006469B2 (ja) メッセージ重送チェックシステム
JPH11306153A (ja) 分散システムのネットワーク管理方式
JPS63138848A (ja) 網障害管理方式
JPH11143843A (ja) 複数ノード構成システムの稼働状態管理方法
JPH02310755A (ja) ヘルスチェック方式
JPH03108896A (ja) ビル管理システムの管理データ送信方式