JPH08202573A - 二重化システムにおけるras情報の保存方法 - Google Patents

二重化システムにおけるras情報の保存方法

Info

Publication number
JPH08202573A
JPH08202573A JP7031766A JP3176695A JPH08202573A JP H08202573 A JPH08202573 A JP H08202573A JP 7031766 A JP7031766 A JP 7031766A JP 3176695 A JP3176695 A JP 3176695A JP H08202573 A JPH08202573 A JP H08202573A
Authority
JP
Japan
Prior art keywords
control device
ras information
information
ras
standby
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7031766A
Other languages
English (en)
Inventor
Tetsuo Suzuki
哲雄 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Fuji Facom Corp
Original Assignee
Fuji Electric Co Ltd
Fuji Facom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd, Fuji Facom Corp filed Critical Fuji Electric Co Ltd
Priority to JP7031766A priority Critical patent/JPH08202573A/ja
Publication of JPH08202573A publication Critical patent/JPH08202573A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 稼働系から待機系への制御権の切替時間を短
縮化する。異常発生側の制御装置のCPU等に異常があ
る場合でもRAS情報を確実に保存する。制御権の切替
後も外部装置によりRAS情報を取得可能とする。 【構成】 CPU11,21、共通メモリ12,22、
通信ボード13,23等を有する稼働系及び待機系の制
御装置10,20が通信回線30を介し二重化されてい
るシステムに関するRAS情報を、何れかの制御装置に
異常が発生した際に保存する保存方法に関する。稼働系
の制御装置(例えば制御装置10)に異常が発生した際
に制御権を待機系の制御装置20に切り替えた後、それ
以後、稼働系となった当該制御装置20が旧稼働系の制
御装置10のRAS情報を補助記憶装置24に保存す
る。待機系の制御装置20に異常が発生した場合には、
稼働系の制御装置10がRAS情報を補助記憶装置14
に保存する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、稼働系及び待機系の制
御装置(プロセス監視制御装置等)が通信回線を介し二
重化されているシステムにおいて、何れかの制御装置に
異常が発生した際に当該システムに関するRAS(信頼
性、可用性、保全性)情報を保存するための方法に関す
る。
【0002】
【従来の技術】いわゆるRAS機能は、コンピュータシ
ステムにおける障害の発生を減らし、また、障害発生時
の修復時間を短縮してシステムの稼働率を高めるための
一連の機能として知られており、その内容としては、障
害の検出及び記録、障害箇所の指摘、遠隔保守、システ
ム構成の変更等がある。これらのRAS機能に関する情
報(RAS情報)は、コンピュータシステムの総合的な
信頼性を高めるために保存しておく必要があり、異常発
生時に稼働系と待機系とを切り替える二重化システムに
おいても、何らかの方法でRAS情報を保存する必要が
ある。
【0003】従来の二重化システムにおいて稼働系の制
御装置に異常が発生した場合には、予め決められたRA
S情報の保存内容を、異常発生後に当該稼働系の制御装
置側の補助記憶装置に保存し、その後、制御権を待機系
の制御装置へ切り替える方法がとられていた。
【0004】
【発明が解決しようとする課題】上記従来の方法には次
のような問題がある。 RAS情報の量が多い場合に保存処理に時間がかか
り、稼働系から待機系への切り替えに多くの時間を要す
るので、その間のデータを収集することができない。こ
のことは、時系列データ(トレンドデータ、帳票データ
等)の欠損という不都合を生じる。 RAS情報を保存する側の制御装置内のCPUや格納
先の補助記憶装置に異常がある場合、RAS情報を保存
することができない。 RAS情報は、異常が発生した制御装置(それまで稼
働系であってその後、待機系となった制御装置)側の補
助記憶装置に保存される。通常、外部機器は稼働系の制
御装置の情報しか取得できないので、制御権が切り替わ
った後は外部機器がRAS情報を取得することが不可能
になる。
【0005】本発明は上記種々の問題点を解決するため
になされたもので、その目的とするところは、稼働系か
ら待機系への切替時間の短縮化を可能にし、しかも異常
発生側の制御装置のCPU等に異常がある場合でもRA
S情報を確実に保存できると共に、制御権の切替後も外
部装置によりRAS情報を取得できるようにした二重化
システムにおけるRAS情報の保存方法を提供すること
にある。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、本発明は、稼働系及び待機系の制御装置が通信回線
を介し二重化されているシステムに関するRAS情報
を、何れかの制御装置に異常が発生したときに保存する
保存方法において、稼働系の制御装置に異常が発生した
際に制御権を待機系の制御装置に切り替えた後、それ以
後、稼働系となった当該制御装置が旧稼働系の制御装置
のRAS情報を保存し、待機系の制御装置に異常が発生
した場合には稼働系の制御装置が待機系の制御装置のR
AS情報を保存するものである。
【0007】また、本発明では、待機系の制御装置の共
通メモリ上にある内部保存用ハンドシェイク領域を通信
ボードを経由してアクセスして当該制御装置がRAS情
報を保存するようにし、更に、稼働系及び待機系の制御
装置に通信回線を介して接続されたオペレータステーシ
ョンとしての制御装置に、稼働系となった制御装置がR
AS情報を保存中であることを通知することが望まし
い。
【0008】
【作用】本発明においては、稼働系の制御装置に異常が
発生した際に制御権を待機系の制御装置に切り替え、そ
の後、稼働系となった当該制御装置がRAS情報を自己
の補助記憶装置に保存する。すなわち、RAS情報量が
多い場合でも制御権を直ちに切り替えるため、切り替え
るまでの間の時系列データの欠損が生じにくく、プロセ
ス監視機能に悪影響を与えることもない。
【0009】また、正常である側の制御装置がRAS情
報を保存するので、異常が発生した制御装置のCPUや
補助記憶装置に障害がある場合でも、常に確実にRAS
情報を保存することができる。更に、RAS情報の保存
状態をオペレータステーションとしての制御装置に通知
することで、オペレータは異常になった系の再立上げ、
RAS情報の吸い上げのタイミングを知得することが可
能である。
【0010】
【実施例】以下、図に沿って本発明の実施例を説明す
る。図1は、この実施例が適用されるプロセス監視制御
装置の二重化システムを示している。データベースステ
ーションとしての二重化されたプロセス監視制御装置1
0,20は何れも同一の構成であり、CPU11,2
1、共通メモリ12,22、通信ボード13,23を備
えている。これらのプロセス監視制御装置10,20は
通信回線30により相互に接続されており、CPU1
1,21にはRAS情報を保存するための補助記憶装置
14,24が接続されている。
【0011】一方、40は監視内容をオペレータ50に
通知するオペレータステーションとしてのプロセス監視
制御装置であり、CPU41、共通メモリ42、通信ボ
ード43及び表示ボード44を備え、表示ボード44に
は監視内容を表示するCRTディスプレイ45が接続さ
れている。このプロセス監視制御装置40は、通信回線
30を介して前記制御装置10,20に接続されてい
る。
【0012】ここで、各CPU11,21,41は、通
信ボード13,23,43及び通信回線30を介して、
互いに他の共通メモリ12,22,42についてもアク
セス可能となっている。
【0013】図2は、プロセス監視制御装置10,20
のCPU11,21が実行するプログラムの構成を示し
ている。すなわちこのプログラムは、自系制御装置が待
機系から稼働系に切り替わったことを検出する二重化監
視処理と、他系制御装置の状態を監視する異常検出処理
と、他系制御装置の異常を検出した場合に定義内容に従
ってRAS情報を自系の補助記憶装置14または24に
保存するRAS保存処理とから構成されている。これら
の三つの処理は、別々のタスクであっても同一のタスク
であっても良い。
【0014】通信ボード13,23は図3に示すような
通信ボード二重化情報を持っており、前記二重化監視処
理では、この通信ボード二重化情報を読み取って共通メ
モリ12,22に保存する。
【0015】図4は、二重化監視処理及びRAS保存処
理と同一のタスクである場合の異常検出処理のフローチ
ャートである。待機系の制御装置(例えば図1の20と
する)は、稼働系の制御装置10に異常があったことを
図5の稼働情報集約ステータスの変化(0→1のビット
の立上り)から検出し(SB1,SB2)、異常があっ
た場合には図6の稼働系異常フラグをON(=1)にす
る(SB3)。これらの処理は、待機系の制御装置が稼
働系になった時に稼働系のRAS情報を保存するための
前処理に相当する。なお、図5の稼働情報集約ステータ
スはビットにより実装ボードの状態を示すものとし、0
が正常、1が異常である。
【0016】稼働系の制御装置10に異常がある以前に
既に待機系の制御装置20に異常が発生して停止してい
た場合(後述するステップSA9〜SA11のごとき処
理が過去に実行されているような場合)、稼働系である
制御装置10は、待機系の制御装置20の稼働情報集約
ステータスの読み込み(SA1)及び前回値との比較に
よる自己の状変チェック(SA2)を行ない、自己に異
常があっても相手側が待機系の制御装置20でない場
合、制御権を切り換えてもRAS情報を保存できないの
で自己のRAS保存処理を起動する(SA3,SA
4)。
【0017】ここで、SA1はSA3及び後述のSA9
で使用するための読み込み処理である。また、SA2,
SA3は自己の制御装置の異常検出及び自己の異常時に
制御権が切り換わるかどうかの判定処理に相当し、待機
系の制御装置が既にダウンしている場合には、制御権が
切り換わらない(待機系が稼働系となってRAS情報を
保存できない)ため、自分自身のRAS情報保存処理を
動かすための処理と言うことができる。
【0018】制御装置20が待機系である場合、制御装
置10に異常が発生すると、稼働系に切り替わった制御
装置20は、稼働系異常フラグがONになっているかを
確認し(SA5)、旧稼働系(現待機系)である制御装
置10に対し通信可能かどうかをチェックする(SA
6)。通信可能であれば、RAS保存処理を起動して旧
稼働系の制御装置10のRAS情報を補助記憶装置24
に保存する(SA7)。しかる後、それまでONになっ
ていた稼働系異常フラグをOFFする(SA8)。
【0019】上記SA5は、制御権が待機系から稼働系
に移った時に、前記SB3のフラグを見て稼働系がダウ
ンしたことを検出する処理である。ここで、SB3のフ
ラグは不用意に保存処理が働かないようにするためのも
のであり、例えば、両系が正常状態で稼働系が突然リセ
ットされた場合、待機系が稼働系になったとしてもRA
S情報を保存する必要がない。このように、明らかに稼
働系が自己の異常を検出してダウンしたときにのみ、R
AS情報保存処理を起動させることが可能になってい
る。
【0020】更に、SA5において稼働系異常フラグが
ONになっていない場合には、相手側(待機系)である
制御装置10の状変チェックを行ない(SA9)、異常
があれば前記同様にRAS保存処理を起動して制御装置
10のRAS情報を補助記憶装置24に保存する(SA
10,SA11)。
【0021】以上のようにこの実施例によれば、待機系
から稼働系への切替処理後に、異常が発生した方(それ
までの稼働系)のRAS情報を保存することができる。
従って、RAS情報が多い場合でも、その保存のために
従来のごとく制御権を切り替えるまでに多くの時間を費
やすことがなく、その間の時系列収集データに欠損を生
じることもない。
【0022】図7は、共通メモリ上にあるRAS情報の
保存処理の流れを示している。この場合には、RAS情
報に関するデータを任意に指定できる定義ファイルを読
み取り、通信ボードから直接アクセスできるようにメモ
リの物理アドレスに変換し、RAS情報を補助記憶装置
に保存する。例えば、旧稼働系が制御装置10である場
合、その共通メモリ12のRAS情報は現稼働系の制御
装置20の補助記憶装置24に保存される。
【0023】図8は、共通メモリ上にないボード(CP
Uボード等)内部のRAS情報の保存処理の流れを示し
ている。この場合には、図9に示すような共通メモリ上
の内部保存用ハンドシェイク領域を使用する。
【0024】すなわち、まずどのボードのどこのデータ
をどのくらい読み込むのかを示すパラメータ(BODK
IND,ADRMOD,ADRES,LEN,REQT
IM等)を指定し(パラメータライト)、その後、要求
フラグを設定(8000H)する。該当ボードはパラメ
ータを読み取り、要求を受け付けたことを要求フラグに
設定(8001H)してからRAS情報を被保存ファイ
ルデータ格納領域に書き込み、要求フラグに終了情報
(0000H)を設定する。図8に示すように、この終
了情報は定周期にて確認される。
【0025】これにより、例えば、旧稼働系が制御装置
10である場合、CPUボード内のRAS情報は一旦、
共通メモリ12に移され、その後、現稼働系の制御装置
20の補助記憶装置24に保存される。
【0026】図10は、上述したRAS保存処理のフロ
ーチャートである。図において、RAS情報の保存要求
がある場合には、自己のブロードキャスト領域にRAS
保存処理開始情報(図12における保存処理フラグが
1)を設定し(SC1)、その後、以下の処理ループを
定義ファイル分繰返し実行する(SC2)。
【0027】すなわち、プロセス監視制御装置40に途
中経過を通知するため、RAS保存処理途中情報(図1
2における保存処理フラグが2〜99)を稼働系自身の
ブロードキャスト領域に設定する(SC3)。その後、
旧稼働系(停止系)のRAS情報が共通メモリ上にある
データか否かを判断し(SC4)、共通メモリ上にあれ
ば物理アドレスに変換(SC5)して直接読込を行ない
(SC6)、正常終了か否かの判断(SC7)の後、現
稼働系の制御装置側の補助記憶装置にRAS情報を保存
する(SC8)。
【0028】保存したいRAS情報が共通メモリ上にな
くCPUボード等にある場合、図9の旧稼働系(停止
系)のハンドシェイク領域に各種パラメータを設定し
(SD5)、要求フラグ(8000H)の設定を行な
う。その後、処理終了を確認するために要求フラグの読
み込み(SD6,SD7)を行なった後、要求フラグが
(0000H)(終了情報)となって終了したか、また
は無応答(監視時間を過ぎても要求フラグが(8000
H)のまま)かをチェックする(SD9)。
【0029】なお、RAS保存処理が正常に終了したら
(SD10)、RAS情報を現稼働系の制御装置側の補
助記憶装置に保存し(SD11)、そうでない場合には
異常情報を保存する(SD12)。また、前記ステップ
SC3以後の処理が定義ファイル分終了したら(SC
2)、RAS保存処理終了情報(図12における保存処
理フラグが0)をブロードキャスト領域に設定して終了
する(SC9)。
【0030】このように、RAS情報の保存中に、オペ
レータステーションであるプロセス監視制御装置40に
RAS情報を保存していることを通知するべく図11の
ようにブロードキャスト領域に図12のデータを書き込
むことにより、通信回線に接続されているすべての外部
機器はこのデータを取得することができる。また、オペ
レータ50が上記情報を知得することにより、異常にな
った系の再立上げやRAS情報の吸い上げの最適なタイ
ミングを知ることができ、RAS情報の保存中に、旧稼
働系の制御装置がイニシャルプログラムロードのために
リセットされるのを防止することができる。
【0031】
【発明の効果】以上のように本発明によれば、RAS情
報量が多い場合でも制御権を直ちに切り替えるため、切
り替えるまでの間の時系列データに欠損が生じにくく、
プロセス監視機能を損なう恐れもない。また、正常であ
る側の制御装置がRAS情報を保存するので、異常が発
生した制御装置のCPUや補助記憶装置に障害がある場
合でも、常に確実にRAS情報を保存することができ、
外部機器は保存されたRAS情報を何ら支障なく取得す
ることができる。
【0032】更に、RAS情報の保存状態をオペレータ
ステーションに通知するため、オペレータは異常になっ
た系の再立上げ、RAS情報の吸い上げの最適なタイミ
ングを知得することが可能である。
【図面の簡単な説明】
【図1】本発明の実施例が適用されるプロセス監視制御
装置の二重化システムを示す図である。
【図2】プロセス監視制御装置のCPUが実行するプロ
グラムの構成図である。
【図3】通信ボード二重化情報の説明図である。
【図4】異常検出処理のフローチャートである。
【図5】稼働情報集約ステータスの説明図である。
【図6】稼働系異常フラグの説明図である。
【図7】共通メモリ上にあるRAS情報の保存処理の流
れを説明する図である。
【図8】共通メモリ上にないRAS情報の保存処理の流
れを説明する図である。
【図9】共通メモリ上の内部保存用ハンドシェイク領域
の説明図である。
【図10】RAS保存処理のフローチャートである。
【図11】RAS保存処理中のデータの流れを説明する
図である。
【図12】ブロードキャスト領域に書き込まれるデータ
の説明図である。
【符号の説明】 10,20 プロセス監視制御装置(データベースステ
ーション) 40 プロセス監視制御装置(オペレータステーショ
ン) 11,21,41 CPU 12,22,42 共通メモリ 13,23,43 通信ボード 14,24 補助記憶装置 30 通信回線 44 表示ボード 45 CRTディスプレイ 50 オペレータ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 稼働系及び待機系の制御装置が通信回線
    を介し二重化されているシステムに関するRAS情報
    を、何れかの制御装置に異常が発生したときに保存する
    保存方法において、 稼働系の制御装置に異常が発生した際に制御権を待機系
    の制御装置に切り替えた後、それ以後、稼働系となった
    当該制御装置が旧稼働系の制御装置のRAS情報を保存
    し、待機系の制御装置に異常が発生した場合には稼働系
    の制御装置が待機系の制御装置のRAS情報を保存する
    ことを特徴とする二重化システムにおけるRAS情報の
    保存方法。
  2. 【請求項2】 待機系の制御装置の共通メモリ上にある
    内部保存用ハンドシェイク領域を通信ボードを経由して
    アクセスし、当該制御装置がRAS情報を保存するよう
    にした請求項1記載の二重化システムにおけるRAS情
    報の保存方法。
  3. 【請求項3】 稼働系及び待機系の制御装置に通信回線
    を介して接続されたオペレータステーションとしての制
    御装置に、稼働系となった制御装置がRAS情報を保存
    中であることを通知するようにした請求項1または2記
    載の二重化システムにおけるRAS情報の保存方法。
JP7031766A 1995-01-27 1995-01-27 二重化システムにおけるras情報の保存方法 Withdrawn JPH08202573A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7031766A JPH08202573A (ja) 1995-01-27 1995-01-27 二重化システムにおけるras情報の保存方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7031766A JPH08202573A (ja) 1995-01-27 1995-01-27 二重化システムにおけるras情報の保存方法

Publications (1)

Publication Number Publication Date
JPH08202573A true JPH08202573A (ja) 1996-08-09

Family

ID=12340173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7031766A Withdrawn JPH08202573A (ja) 1995-01-27 1995-01-27 二重化システムにおけるras情報の保存方法

Country Status (1)

Country Link
JP (1) JPH08202573A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007172334A (ja) * 2005-12-22 2007-07-05 Internatl Business Mach Corp <Ibm> 並列型演算システムの冗長性を確保するための方法、システム、およびプログラム
JP2008527547A (ja) * 2005-01-07 2008-07-24 トムソン グローバル リソーシーズ データベースの分散ロードのためのシステム、方法およびソフトウェア
WO2015033433A1 (ja) * 2013-09-06 2015-03-12 株式会社日立製作所 ストレージ装置及び障害部位特定方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008527547A (ja) * 2005-01-07 2008-07-24 トムソン グローバル リソーシーズ データベースの分散ロードのためのシステム、方法およびソフトウェア
JP4722944B2 (ja) * 2005-01-07 2011-07-13 トムソン ルーターズ グローバル リソーシーズ データベースの分散ロードのためのシステム、方法およびソフトウェア
JP2007172334A (ja) * 2005-12-22 2007-07-05 Internatl Business Mach Corp <Ibm> 並列型演算システムの冗長性を確保するための方法、システム、およびプログラム
US8713352B2 (en) 2005-12-22 2014-04-29 International Business Machines Corporation Method, system and program for securing redundancy in parallel computing system
WO2015033433A1 (ja) * 2013-09-06 2015-03-12 株式会社日立製作所 ストレージ装置及び障害部位特定方法
US9575855B2 (en) 2013-09-06 2017-02-21 Hitachi, Ltd. Storage apparatus and failure location identifying method

Similar Documents

Publication Publication Date Title
JP2007511806A (ja) 技術的装置を制御するための冗長性自動化システム及びその作動方法
JPH08320835A (ja) 外部バスの障害検出方法
JPH08202573A (ja) 二重化システムにおけるras情報の保存方法
JPH08178976A (ja) 電源遮断検出装置
NL8401557A (nl) Rekenmachinesysteem met verwijderd opgestelde werkstations en een reservebatterijvoeding.
US5533191A (en) Computer system comprising a plurality of terminal computers capable of backing up one another on occurrence of a fault
JPH11328045A (ja) バッテリバックアップ機能付きdram装置の初期化制御方式
JPH02297237A (ja) 電子計算機システムの自動再起動装置
JPH04324569A (ja) マルチプロセッサシステム
JP2879480B2 (ja) 冗長計算機システムの同期外れ時の切替方式
KR100232838B1 (ko) 컴퓨터모듈의 리셋 제어장치
JPH0756520Y2 (ja) 故障システムの応答信号発生装置
JP3298989B2 (ja) 障害検出・自動組込み装置
JPS6242252A (ja) 通信制御装置切替方式
JPH0517743U (ja) 二重化計算機システム
JPH05108588A (ja) マルチプロセツサシステム
JPH0374712A (ja) 情報処理装置
JPH07244613A (ja) 二重化メモリ制御方法
KR20000005448U (ko) 프로세서 이중화 시스템
JPH11265321A (ja) 障害復旧方法、中央処理装置及び中央処理システム
JPH0113577B2 (ja)
JPH05128011A (ja) フアームウエア制御方式
JPH054260U (ja) 二重系の情報転送装置
JPH03202943A (ja) 記憶装置の誤り検出方式
JPH04340138A (ja) 制御装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020402