JPH0469740A - 二重化システムの系切り替え方法 - Google Patents

二重化システムの系切り替え方法

Info

Publication number
JPH0469740A
JPH0469740A JP2181462A JP18146290A JPH0469740A JP H0469740 A JPH0469740 A JP H0469740A JP 2181462 A JP2181462 A JP 2181462A JP 18146290 A JP18146290 A JP 18146290A JP H0469740 A JPH0469740 A JP H0469740A
Authority
JP
Japan
Prior art keywords
standby
active
processing
checkpoint
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2181462A
Other languages
English (en)
Other versions
JP3026350B2 (ja
Inventor
Yuzuru Maya
讓 真矢
Toshiyuki Kinoshita
俊之 木下
Norio Morioka
森岡 紀夫
Yoshinori Tokunaga
督永 嘉紀
Hiroyuki Tokiyoda
常世田 博之
Isao Yoshino
吉野 勇夫
Takeshi Oga
大賀 健
Satoshi Takemura
竹村 敏
Yoshiaki Yamashita
山下 芳明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Computer Electronics Co Ltd
Hitachi Ltd
Hitachi Electronics Services Co Ltd
Original Assignee
Hitachi Computer Electronics Co Ltd
Hitachi Ltd
Hitachi Electronics Services Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Computer Electronics Co Ltd, Hitachi Ltd, Hitachi Electronics Services Co Ltd filed Critical Hitachi Computer Electronics Co Ltd
Priority to JP2181462A priority Critical patent/JP3026350B2/ja
Publication of JPH0469740A publication Critical patent/JPH0469740A/ja
Application granted granted Critical
Publication of JP3026350B2 publication Critical patent/JP3026350B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、ホラ1ヘスタンバイシステムに係わり、特に
障害時の停止時間の短縮させることオーバヘッドを削減
させることに関する。
〔従来の技術〕
第2図はホットスタンバイシステムのハードウェア構成
図である。汎用大型計算機や電子交換機では、従来から
処理の連続性を重視するため、現用系と待機系からなる
ホットスタンバイシステムで構成していた。ホラl−ス
タンバイシステムは、第2図に示すように、現用系と待
機系はそれぞれ、プロセッサ、メモリ、バスエクステン
ダ、IOP。
回線制御装置、ディスク制御装置で構成することにより
、現用系あるいは待機系は単独で処理可能である。
以下、汎用大型計算機と電子交換機のホラlヘスタンバ
イシステムのチェックポイントデータの取得方式と障害
からの回復方式を説明する。
従来の汎用大型計算機の回復方式は、オンラインシステ
ムのソフトウェア(産業図書 大野豊著1)、147〜
P 、 i、 53 )に記載されている。
第4図は汎用大型計算機のチェックポイントデータの取
得とジャーナルの取得方式を示す図である。第5図は汎
用大型計算機のチェックポイントデータの取得と回復手
順を示す図である。汎用大型計算機のチェックポイント
ータータの取得方式は、第3図、第4図、第5図に示す
ように、現用系が一定周期(チエツクポインI−)毎に
、タスク制御情報、ファイル制御情報、I/O制御情報
及び回線制御情報をチエツクポイン1−データと定義し
て、待機系のメモリに転送していた。また、障害時にフ
ァイルを回復できるように、現用系のプロセラすはディ
スクへの書込み処理毎に、ジャーナルをディスクに書き
込んでいた。
現用系で障害が発生すると、待機系は、ディスクに格納
されているジャーナルを参照して、ファイルを障害時の
状態に回復し、再開処理を行っていた。
その結果、汎用大型計算機では、ディスクに格納してい
るジャーナルを参照してファイルを回復しなければなら
ず、ファイルの回復時間が長くなり、障害時のシステム
の停止時間が長くなるという問題があった。
第6図は電子交換機の両系@:込み命令を示す図である
。従来の電子交換機の回復方式では、日経エレクトロニ
クス(1,988,2,20P、325〜P、329)
に記載されている。電子交換機の回復方式は、第3図と
第6図に示すように、現用系の書き込み命令が現用系と
待機系のメモリに同時に書き込むこと(両系書込み命令
を使用すること)により、現用系と待機系のメモリの内
容を常に同一・にしていた。
現用系で障害が発生すると、待機系は待機系のメモリを
参照して、処理を継続する。
その結果、電子交換機ではチエツクポインI−を設定す
る必要はなく、チェックポイントデータとジャーナルは
不要である。現用系の両系書込み命令は、現用系と待機
系の両方のメモリに同時に書き込む両系書込み命令とな
るため、書込み命令の実行時間が長くなり、正常運転中
のオーバヘッドが大きくなるという問題があった。
〔発明が解決しようとする課題〕
汎用大型計算機と電子交換機のホラI・スタンバイシス
テムの停止時間とオーバヘッドを定量的に評価し、課題
を明確にする。
(1)停止時間 第7図は、停止時間を示す図である。停止時間は第7図
に示すように、最新のチェックポイントから障害発生ま
での時間、障害検出時間及び障害回復時間の和である。
T=T(c〜f)+T(d)+T(r)T:停止時間 T(c〜f):最新のチエツクポインl−から障害発生
までの時間 T (d ) :障害検出時間 T(r):障害回復時間 (a) 最新のチェックポイントから障害発生までの時
間 (j)汎用大型計算機 一定周期でチェックポイントデータを転送しているので
、T(c−f)はチェックポイントデータの転送周期に
なり、5秒程度である。
(ii)電子交換機 両系のメモリの内容が同一であり、待機状態のメモリを
参照して処理を再開するためチェックポイントに戻らな
いため、 T(c”f)はほとんど0である。
(b)障害検出時間 第8図は障害検出方式を示す図である。障害検出方式は
、以下のように汎用大型計算機と電子交換機で同じ方式
である。
現用系はaliveメツセージを待機系に転送する。待
機系はalj、veメツセージを受信する。
待機系は、次のaliveメツセージが一定時間(a]
−jveメツセージ受信の確認周期:T(a c、、−
p) )以内に受信するかどうかチエツクする。現用系
で障害が発生し、aliveメツセージが待機系に転送
できない。待機系は一定時間(aljveメツセージ受
信の確認周期:T(acp))経過しても、alj−v
aメツセージを受信しない。現用系に障害が発生したと
判定する。
障害検出時間は、汎用大型計算機と電子交換機ともに、
aljveメツセージ受信の確認周期(T(a c、p
) )となり、2秒程度である。
(c)障害回復時間 (i)汎用大型計算機 ジャーナルを参照しファイルを回復するので、ファイル
の回復時間は30秒とし、T(r)は30秒程度である
(ii)電子交換機 両系のメモリの内容が同一である。待機状態のメモリを
参照して処理を再開するためチェックポイントに戻らず
、待機状態のメモリを参照して再開するので、T(r)
はほとんどOである。
(d)停止時間の合計 汎用大型計算機と電子交換機の停止時間の合計を算出す
る。
(j)汎用大型計算機 停止時間はジャーナルを参照しファイルを回復する時間
に依存し、停止時間は37秒程度となる。
(ii)電子交換機 障害の検出時間となり、2秒程度である。
(2)オーバヘッド オーバヘッドは、以下に示すように単体システム力らホ
ットスタンバイシステムに移動する場合に低下する処理
能力の割合を示す。
R(sJ R(s):単一システムの処理能力 R(h):ホットスタンバイシステムの処理能力 (a)汎用大型計算機 汎用大型計算機では、チェックポイントデータを現用系
から待機系の送る処理がオーバヘッドとなる。
オーバヘッドは以下の条件で算出する。
チェックポイントータータ量: /O0kB転送スピー
ド: IMB/秒 オーバヘッドは2%である。
(b)電子交換機 電子交換機では、両系のメモリに書き込む処理がオーバ
ヘッドとなる。両系のメモリへの書込み命令の実行時間
は、通常の書込み命令の実行時間の2倍とする。
オーバヘッドは以下の条件で算出する。
W:単体システムの書込み命令の実行時2×W:ホット
スタンバイシステムの書込み命令の実行時間 R:非書込み命令の実行時間 書込み命令の比率:30% 非書込み命令の比率=70% オーバヘッドは30%になる。
第9図は、停止時間とオーバヘッドを示す図である。第
9図より、汎用大型計算機のホットスタンバイシステム
は、オーバヘッドを小さいが、停止時間は40秒弱と長
いという問題点があった。
さらに、電子交換機のホットスタンバイシステムは、停
止時間が2秒と短いが、オーバヘッドが30%と大きい
という問題点があった。
本発明の目的は、現用系に障害が発生した場合、待機系
に切り替えるまでのシステムの停止時間を短縮させるこ
とである。
本発明の他の目的は、現用系が正常運転中にバツクアッ
プ処理に要するオーバヘッドを削減させることである。
〔課題を解決するための手段〕
現用系と待機系はそれぞれ、プロセッサ、メモリ、バス
エクステンダ、 工OP、回線制御装置。
ディスク制御装置で構成することにより、現用系あるい
は待機系は単独で処理可能とする。
現用系はディスクへの書込み処理時間をチェックポイン
トとし、処理を引き継ぐために必要な情報として、タス
ク制御情報、ファイル制御情報。
工/○制御情報及び回線制御情報をチエツクポイン1へ
データとし、現用系はディスクへの書込み処理と同期し
て、チェックポイントデータを待機系のメモリに転送す
る。
現用系で障害が発生すると、待機系は待機系のメモリに
格納されているチェックポイントデータを参照して、デ
ィスクの書込み処理から再開する。
〔作用〕
本発明によるホットスタンバイシステムは、現用系と待
機系で構成する。現用系と待機系は、それぞれ、プロセ
ッサ、メモリ、バスエクステンダ。
IOP、ディスク制御装置及び回線制御装置で構成する
ことにより、現用系あるいは待機系は単独で処理可能で
ある。
現用系で障害が発生すると、待機系は現用系の処理を引
き継ぐ。処理の引継ぎのポイントとして、チエツクポイ
ンI・を設ける。チェックポイントは、ディスクへの書
込み処理時とメツセージ送信処理時である。
チェックポイントがディスクへの書込み処理時の場合、
チエツクポイン1−データは、タスク制御情報、ファイ
ル制御情報、I/O制御情報及び回線制御情報である。
現用系がディスクの書込み処理を実行する毎に、現用系
はチェックポイントデータを待機系のメモリに転送する
そのため、チェックポイント間(ディスクへの書込み処
理時間)で、ファイル更新のないことが保証でき、ジャ
ーナルを不要とすることが可能である。また、待機系の
メモリに最新のチェックポイントディスクを格納してい
るため、両系書込み命令は不要になる。
現用系で障害が発生すると、待機系のプロセッサは、チ
ェックポイントデータが格納されている待機系のメモリ
を参照し、最新のディスクへの書込み処理から再開する
。待機系は、現用系の最新のディスクへの書込み処理を
完了しているかどうか判定できない。しかし、待機系は
、現用系と同じ内容のデータをディスクへ書き込むため
、同じ内容のデータを現用系と待機系で2回書き込んで
も、ディスクの内容に矛盾が生じさせることはない。そ
のため、待機系は、ディスクへの書込み処理から再開す
ることにより、現用系の処理を引き継ぐことが可能であ
る。
チェックポイントがメツセージ送信処理の場合、チェッ
クポイントデータは、タスク制御情報、ファイル制御情
報、I/O制御情報及び回線制御情報である。現用系は
メツセージ送信処理毎に、チェックポイントデータを待
機系のメモリに転送する。
現用系で障害が発生すると、待機系は、最新のメツセー
ジ送信処理まで戻り、待機系のメモリを参照し、現用系
の処理をメツセージ送信処理から再開する。同一メツセ
ージを2回送信する場合があるが、メツセージの二重送
信を許容すれば(すなわちメツセージの受信側の装置に
前回のメツセージと同じメツセージを受信すると、後者
のメツセージを廃棄する機能を持たせれば)、通信手順
に誤りがないことが保証できる。
また、一定時間経過しても、ディスクへの書込み処理及
びメツセージ送信処理を実行しない場合、一定時間経過
時をチェックポイントとする。チェックポイントデータ
は、タスク制御情報、ファイル制御情報、I/O制御情
報及び回線制御情報である。現用系は、チェックポイン
ト時に、チェックポイントデータを待機系のメモリに転
送する。
最新のチェックポイントから現用系で障害は発生するま
で、ディスクへの書込み処理及びメツセージ送信処理が
ないことが保証できる。
その結果、現用系で障害が発生すると、待機系は、チェ
ックポイントまで戻り、待機系のメモリを参照し、現用
系の処理を引き継ぐことが可能である。
このようにして、現用系で障害が発生しても、停止時間
を長くさせるジャーナルの参照及びファイルの回復処理
を不要とすることができ、さらに、両系書込み命令のよ
うな実行時間の長い命令を使うことなく処理を継続させ
ることができる。
この結果、システムの停止時間を短縮させること及びオ
ーバヘットを削減することが可能になる。
〔実施例〕
以下、本発明の一実施例を示す。本発明によるホラ1へ
スタンバイシステムは、現用系(30)と待機系(40
)で構成する。現用系(30)の障害発生に備えて、待
機系(40)が現用系(30)の処理を再開するポイン
I〜として、チエツクポイン1−(26)を設ける。本
発明では、チェックポイント(26)は現用系(30)
のディスクへの書込み処理(1,3,5)とメツセージ
の送信処理であるが、本実施例では、ディスクへの書込
み処理時(1,3,5)で説明する。チェックポイント
データ(70)は、現用系(30)がチェックポイント
(26)と同期して、待機系(40)に転送するデータ
を定義する。チェックポイントデータ(70)の内容は
、タスク制御情報(72)。
ファイル制御情報(73)、I/O制御情報(74)及
び回線制御情報(75)である。
待機系(40)の障害時は、現用系(30)は、待機系
(4o)をオフライン状態(82)として、実行すれば
よいため、本実施例では、現用系(30)の障害のみ説
明する。
現用系(30)の障害検出は、第8図に示すように、障
害検出時間が最も長くなるaliveメツセージの送受
信方式を前提とする。
第1図は、チェックポイントデータの取得方式と回復手
順を示す図である。本実施例の概要は、第1図に示すよ
うに、現用系(30)が、ディスクへの書込み処理と同
期して、チェックポイントデータ(70)を待機系(4
0)に送信する(ステップ 1)。待機系はチェックポ
イントデータ(70)を受信し、待機系のメモリ(42
)に書き込む(ステップ 2)。同様に、現用系(30
)が、ディスクへの書込み処理と同期して、チエツクポ
インl−データ(70)を待機系(40)に送信する(
ステップ 3)。待機系はチェックポイントデータ(7
0)を受信し、待機系のメモリ(42)に書き込む(ス
テップ 4)。さらに現用系(30)が、ディスクへの
書込み処理と同期して、チエツクポイン1−データ(7
0)を待機系(4o)に送信する(ステップ 5)。待
機系はチエツクポイン1ヘデータ(70)を受信し、待
機系のメモリ(42)に書き込む(ステップ 6)。
現用系で障害が発生する(ステップ 7)。待機系のプ
ロセッサ(41)は、待機系のメモリ(42)からチェ
ックポイントデータ(7o)を読み出しくステップ 6
)、最新のディスクへの書込み処理(ステップ 5)か
ら再開する(ステップ S)。
第/O図は、本発明によるホットスタンバイシステムの
チエツクポインl−データ(7o)の取得を示す図であ
る。チェックポイントデータの取得方式は、現用系のプ
ロセッサ(31)がディスクへの書込み処理時間(ステ
ップ i、3.5)に、チェックポイントデータ(70
)として、タスク制御情報(72)、ファイル制御情報
(73)、I/O制御情報(74)及び回線制御情報(
75)をバス(55)を介して待機系のメモリ(42)
に書き込む。
本発明では、現用系(30)が、ディスクへの書込み処
理(ステップ 1,3.5)と同期して、チェックポイ
ントデータ(70)を待機系(40)に転送する。その
ため、チェックポイント間(ステップ1とステップ3の
間、及びステップ3とステップ5の間)でディスクへの
書込み処理がなく、ファイルの更新がないことが保証で
きる。その結果、本発明によるホットスタンバイシステ
ムは、第3図に従来技術と比較して示すように、ジャー
ナル(76)を不要とすることが可能であり、かつ、待
機系のメモリ(42)に最新のチェックポイントデータ
(70)を格納しているため、両系書込み命令(13)
は不要となる。
本発明の特徴は、ジャーナル(76)による回復処理を
不要とすることにより停止時間(20)が短縮できると
ころ、及び実行時間の長い両系書込み命令(1,3)を
不要とすることによりオーバヘッド(25)が削減でき
るところである。
第11図は、系の状態と状態遷移を示す図である。系(
30,4,0)の状態は、第11図に示すように現用状
態(80)、待機状態(81)及びオフライン状態(8
2)の3状態を設ける。現用状態(80)と待機状態(
81)を合わせて、オンライン状態(87)という。現
用状態(80)の系を現用系(30)、待機状態(81
)の系を待機系(40)という。現用状態(80)は実
際に処理を実行している状態である。待機状態(81)
は現用状態(80)の系から処理を引き継ぐためのチェ
ックポイントデータ (70)を受信し、直ちに実行中
の処理が引き継げるように休止している状態である。オ
フライン状態(82)は上記以外で障害や保守によりシ
ステムから切り離されている状態である。
現用状態(80)で障害が発生すると、現用状1(80
)の系をオフライン状態(82)に遷移しく状態遷移 
83)、待機状態(81)の系を現用状態(80)に遷
移する(状態遷移 84)。
待機状態(81)で障害が発生すると、待機状態(81
)の系をオフライン状態(82)に遷移する(状態遷移
 85)。障害から回復すると、オフライン状態(82
)から待機状態(81)に遷移する(状態遷移 86)
第2図はホットスタンバイシステムのハードウェア構成
図である。本発明によるホットスタンバイシステムは、
第2図に示すように、現用系(30) 。
待機系(4,0)、バス(55)、ディスク(5]。
52)、回線切替装置(53)、及び端末(60゜61
.62.63)で構成する。
現用系(30)はプロセッサ(31)、メモリ(32)
 、IOP (33)、回線制御装置(34)、ディス
ク制御装置(35)及びバスエクステンダ(36)で構
成する。
待機系(40)はプロセッサ(41)、メモリ(42)
 、IOP (4,3)、回線制御装置(44)、ディ
スク制御装置(45)及びバスエクステンダ(46)で
構成する。
ディスク制御装置(35,45)は、ディスク(51,
52)をアクセスし、ディスク(5]。
52)への書込みデータと読み出しデータを所有する。
回線制御装置(34,44−)は、メツセージの待ち行
列を所有し、端末(60,61,62゜63)から受信
したメツセージと端末(60゜61.62.63)へ送
信するメツセージを所有する。
回線切替装置(53)は、系(30,40)で障害が発
生したとき、他の系(4,0,30)に回線を切り替え
るために使用する。
ディスク(51,52)は、ディスク(51゜52)障
害時にシステムダウンに至らないように、二重化構成に
し同一の内容を格納する。
第12図は、第1図の装置に用いるプロセッサ(31,
44)、メモリ(31,4,2)、IOP(33,43
)、バスエクステンダ(36,46)の詳細回路図であ
る。現用系(30)と待機系(40)は、同一構成であ
るため、現用系(30)を中心に記述する。
プロセッサ(31,4,1)は、68000マイクロプ
ロセツサとする。68000マイクロプロセツサの内部
レジスタは、データレジスタDRODR7(500−5
07,600−607)、アドレスレジスタARO−A
、R6(5/O−51,6゜6/O−616) 、スタ
ックポインタAR7(520,620) 、ステータス
レジスタ5R(521,621)、プログラムカウンタ
pc(522,622)で構成する。
68000マイクロプロセツサの信号線は、データ線D
o−D7 (540,640)、アドレス線A1〜A2
2 (541,641) 、アドレス線A、23 (5
42,642)、割込み線(IPLO〜2)(54−3
−545,643−64,5)で構成する。
アドレス線A23 (542,64,2)は、現用系の
メモリ(32)をアクセスするのか待機系のメモリ (
42)をアクセスするのかの判定に使用する。
W/R線(546,646)は、tL H71の時リー
ドサイクル、it L″′の時ライトサイクルである。
工○P (33,43)は、プロセッサ(570゜67
0)、バッファ(571,671) 、R,OM(57
2,672)及びRAM(573,673)で構成する
。バッファ(571,671)には、プロセッサ(31
,41,)からの転送されるディスクへの書込みデータ
を格納する。
その他、タイマ(530,630)、アドレスデコーダ
(531,631,)と割込みエンコーダ(532,6
32)を設ける。
現用系(30)と待機系(40)は同一構成である。現
用系(30)で(5**)のものは、待機系では(6*
*)と対応する。例えば、現用系(30)のタイマ(5
30)は、待機系(40)のタイマ(630)に対応す
る。
第13図は、現用系(30)と待機系(40)のメモリ
マツプを示す図である。68000マイクロプロセツサ
では、メモリ空間(580)は16Mバイトである。現
用系(30)は、前半の8Mバイト、アドレス(OOO
Oo016〜7 F F F F F16)を使用し、
待機系(4o)は、後半の8Mバイト、アドレス(80
0000工、〜F F F F F F、6)を使用す
る。
現用系のプロセッサ(31)が現用系のメモリ(32)
をアクセスするか待機系のメモリ(31)をアクセスす
るかは、現用系のプロセッサのアドレス線A23 (5
42)による。すなわち、現用系のメモリは(31)は
、前半の8Mバイト、アドレス(OOOOOO□6〜7
FFFFF□6)を使用する。現用系のプロセッサのア
ドレス線A23(542)がLならば、現用系のメモリ
(32)をアクセスする。待機系(40)は、後半の8
Mバイト、アドレス(800000□6〜FFFFFF
□、)を使用する。現用系のプロセッサのアドレス線A
23 (542)がHならば、待機系のメモリ(32)
をアクセスする。
現用系のメモリマツプ(581)は、第14図に示すよ
うに以下の通りである。
・0〜α ハードレジスタ(582) ・α〜α十β O8(583) ・α十β〜α+β+γ チエツクポイン1−データ (584,)・α+β+γ
〜α+β+γ+δ プログラム(585) ・α+β十γ+δ〜7FFFFF□6 リザーブ(586) 待機系のメモリマツプ(68]、)は、第14図に示す
ように以下の通りである。
・80000016〜800000□6+αハードレジ
スタ(682) ・800000,6+α〜800000.6+α+βO
8(683) ・8000001.+α+β 〜5ooooo、6+α+β+γ チエツクポイン1ヘデータ(684) ・5ooooo、、+α+β+γ 〜80oOoO□6+α+β+γ+δ プログラム(685) ・5ooooo□6+α+β+γ十δ 〜F F F F F Fl。
リザーブ(686) この結果、現用系メモリ(32)と待機系メモリ(42
)のアドレスの最上位ピッI・を除いて、チェックポイ
ントデータ(70)を同じアドレスに格納することがで
きる。
第14図は、バスエクステンダ(36,4,6)の詳細
図である。バスエクステンダ(36,4,6)は、現用
系のプロセッサ(31)が待機系のメモリ(42)をア
クセスできるようにし、現用系のメモリ (32)の内
容を待機系のメモリ(42)に転送できるようにする。
そのために、バスエクステンダ(36,4,6)には、
系状態レジスタ(534,634) 、alive レ
ジスタ (535゜635)、アクセスレジスタ(53
6,636)割込みレジスタ(537,637)及び双
方向ドライバ(533,633)を設ける。双方向ドラ
イバの制御信号(555,655)を設ける。
現用系(30)の双方向ドライバの制御信号(555)
は、以下のように、現用系のプロセッサ(31)のアド
レス線A23 (542)とW/R線(54,6)の値
による。
アドレス線A23 (542)がり、W/R線(54,
6)がHの時、現用系のプロセッサ(31)は待機系の
メモリ(42)から読み出す。
アドレス線A23(54,2)がり、W/R線(546
)がLの時、現用系のプロセッサ(31)は待機系のメ
モリ (42)に書き込む。
待機系(40)の双方向ドライバの制御信号(655)
は、以■のように、待機系のプロセッサ(41)のアド
レス線A23(642)とWZR線(646)の値によ
る。
A23 (642)がH,W/R線(546)がHの時
、待機系のプロセッサ(41)は現用系のメモリ(32
)から読み出す。
A23 (642)がH,W/R線(546)がLの時
、待機系のプロセッサ(41)は現用系のメモリ (3
2)に書き込む。
この機能により、現用系のプロセッサ(31)は、待機
系のメモリ(42)の読み出しと書き込みが可能になる
。同様に、待機系のプロセッサ(41)は、現用系のメ
モリ(32)の読み出しと書き込むが可能になる。
第15図は、系状態レジスタ(534,,634,)、
a ]j−v eレジスタ(535,635)、アクセ
スレジスタ(536,636)、割込みレジスタ(53
7,637)の内容を示す図である。これらのレジスタ
は、8ピツI〜構成である。
系状態レジスタ(534,634)は、第15図(a)
に示すように、現用系(30)及び待機系(40)の状
態を示すものである。
表   1 aliveレジスタ(535,635)は、第1−5図
(b)に示す。現用系(30)は待機系(40)にal
iveメツセージを転送する。現用系(30)が待機系
(40)のaHve レジスタ(635)に書込み、待
機系(4o)が一定周期毎にa]iveメツセージレジ
スタ(635)をリセットする。待機系(40)が、現
用系(30)で障害が発生したかどうか検出するために
使用する。以上を表2に示す。
表 表 アクセスレジスタ(536,636)は、第15図(C
)に示す。アクセスレジスタ(536。
636)は、現用系(30)が待機系のメモリ(42)
をアクセスしてもよいか、あるいは、待機系(40)が
、現用系のメモリ(32)をアクセスしてもよいかを示
す(表3)。
表   3 割込みレジスタ(537,637)は、第1,5図(d
)に示す。詳細を表4に示す。
第1−6図は、割込みレベルを示す図である。レベル4
の割込みは障害割込み、レベル2の割込みはタイマ割込
みとする。優先順位は、レベル7が一番高く、以下類に
低くなる。
第17図は、タイマ割込みの制御回路を示す図である。
タイマ(530,630)は、クロック(550,65
0) 、aliveメツセージカウンタ(551,65
1)とチェックポイントカウンタ(552,652)と
いうカウンタを設ける。タイマ割込み(192)は、一
定周期毎に常に割込むものと一定時間経過すると割込む
ものに分けられる。
一定時間経過すると割込むものは、クロック(550,
650)が、/Om秒毎にカウンタを(+1)する。1
秒経過して割込むものは、カウンタ値が/O0になれば
、プロセッサ(31゜41)に割込みを発生させる。
一定周期毎に常に割込むものは、一定周期毎にプロセッ
サ(31,4,1)に割込みを発生させる。
第18図は、ソフトウェアの処理概要を示す図である。
割込み(190)はタイマ割込み(192)と障害割込
み(193)がある。障害割込み(193)は、割込み
レベル4で実行する。タイマ割込み(192)は、割込
みレベル2で実行する。
障害割込み(193)で起動するプログラムは、回復処
理(1,97)である。
タイマ割込み(192)で起動するプログラムは、al
iveメツセージの送信処理(194,)、alive
メツセージの受信確認処理(]−95)及びチェックポ
イントの監視処理(196)である。
まず、現用系(30)のソフトウェアの処理概要を以下
の通りである。現用系(30)は割込み(190)を受
信する。現用系(30)は、タイマ割込みであるので、
割込みレベルを2とし、割込み種別を解析する(191
)、タイマ割込み(192)の場合、aliveメツセ
ージの送信処理(194)かチェックポイントの監視処
理(1,95)かを判定する。aliveメツセージの
送信処理(194)あるいはチェックポイントの監視処
理(195)を実行する。これらの処理が終了すると、
割込みレベルをOとする。
現用系(30)は、I・ランザクジョン処理(198)
内で、チェックポイントデータ(70)を待機系(40
)に転送する。
次に、待機系(40)のソフトウェアの処理概要を以下
に示す。まず、割込み(190)を受信する。タイマ割
込み(192)か障害割込み(193)かを解析する(
191)。
障害割込み(193)の場合、割込みレベルを4とする
。待機系(40)は、チェックポイントデータ(70)
を参照して、現用系(30)のトランザクション処理(
198)を再開する。これらの処理が終了すると、割込
みレベルを○とする。
タイマ割込み(192)の場合、割込みレベルを2とす
る。aliveメツセージの受信確認処理(195)を
実行する。この処理が終了すると、割込みレベルをOと
する。
aliveメツセージの送信処理(194−)とali
veメツセージの受信確認処理(195)は、待機系(
40)が現用系(30)で障害が発生したかどうか判定
するために使用する。
aliveメツセージの送信処理(194,)は、現用
系のプロセッサ(31)が1秒周期毎に常に待機系(4
0)にaHveメツセージ(1,00)を発行するもの
である。aliveメツセージ(/O0)の発行とは、
待機系(40)のaljve レジスタ(635)を0
0□6から0116にすることである。
al、iveメツセージの受信確認処理(195)は、
待機系のプロセッサ(41)が、aliveメツセージ
を受信した時に、aHveメツセージカウンタ(651
)を0にする。最後のaljveメツセージを受信して
、2秒経過しても次のaljveメツセージを受信しな
いと、待機系(4o)は現用系(3o)で障害発生と判
定するものである。
チェックポイントの監視処理(196)は、現用系のプ
ロセッサ(31)が、最後のディスクへの書込み処理実
行終了後、]2秒以外に最後のディスクへの書込み処理
実行を実行したかどうか判定するために使用する。
第19図は、ディスクへの書込み処理実行後、1秒以内
に次のディスクへの書込み処理が発生しく36) たかどうかを示す図である。本実施例では、ディスクへ
の書込み処理時(1,3,5)をチェックポイント(2
6)するが、一定時間以内(本実施例では、1秒以内)
にディスクへの書込み処理が発生しなければ、最新のチ
ェックポイントから障害発生までの時間が長くなり、し
いては停止時間(20)が長くなる。そのため最新の、
ディスクへの書込み処理(1,,3,5)終了後、1秒
以内に次のディスクへの書込み処理が発生しないと、最
新のディスクへの書込み処理から1秒経過時点をチエツ
クポイン1−(26)とする。
第19図より、最新のディスクへの書込み処理終了後、
1秒経過したかどうかを示す。まず、ディスクへの書込
み処理を実行する(処理 900)。
さらに、ディスクからの読み出し処理を実行し、チェッ
クポイントデータを待機系のメモリに書き込む(処理 
901)。さらに、ディスクの書込み処理を実行し、チ
ェックポイントデータ(7o)を待機系のメモリ (4
2)に書き込む(処理902)。
第20図は、チェックポイント監視処理の詳細フローチ
ャーI−図である。チェックポイント監視処理(196
)を用いて、(処理 900)と(処理 902)が1
秒以内かどうかを以下のように実現する。
第20図(a)より、現用系のプロセッサ(31)は、
ディスクへの書込み処理時に、チエツクポインl−カウ
ンタ(552)を0にする(処理9/O)。
第20図(b)より、クロック(550)が、/Om秒
毎にカウンタを(+1)する(処理911)。チェック
ポイントカウンタ(552)を参照しく処理 912)
、チェックポイントカウンタ(552)が/O0未満な
らば、1秒以内にディスクへの書込み処理が発生したと
判定しく処理 912)、チェックポイントカウンタ(
552)が1,00以上になれば、1秒以内にディスク
への書込み処理が発生しなかったと判定する(処理 9
13)。
以下、最新のディスクへの書込み処理(1,3゜5)後
、1秒以内に次のディスクへの書込み処理が発生する場
合をケース■とし、1秒経過しても次のディスクへの書
込み処理が発生しない場合をケース■とする。
第21図はケースIのチェックポイントータータの取得
処理の概要図である。第21−図を用いて、ケース■の
チェックポイントデータの取得処理を説明する。
現用系のプロセッサ(31)は、ディスクへの書込み処
理(1,3,5)と同期して、チェックポイントデータ
 (70)を待機系のメモリ(42)に書き込む。チェ
ックポイントデータ(70)は、タスク制御情報(72
)、ファイル制御情報(73)、ファイル制御情報(7
4) 、I/O制御情報(75)及び回線制御情報(7
6)である(処理 /O00゜/O01)。(処理 1
oOO)と(処理 /O01)は、同一の内容である。
第22図は、(処理 /O00)の詳細フローチャート
図である。(処理 /O00)の詳細を以下に示す。
まず、現用系のプロセッサ(31)は待機系の系状態レ
ジスタ(634)を読み出す。系状態レジスタ(634
,)が00.、ならば、オフライン状態(82)である
ので、チェックポイントデータ(70)は転送しない(
処理 /O11)。
系状態レジスタ(634,)が0116ならば、待機状
態(81)であるので、以下の処理を実行する。
アクセスレジスタ(636)を読み出し、現用系(30
)は待機系(40)のメモリ(42)がアクセス可能と
なるまで、待つ(処理 /O1.2)。
待機系(40)のメモリ (42)がアクセス可能とな
れば、68000の内容レジスタのARO(5/O)と
DRO(500)の値を現用系のメモリ(32)にセー
ブする(処理 /O13)。
ARO(5/O)にチェックポイントデータ(70)の
先頭アドレスを、DRO(500)にチェックポイント
データ(70)のデータ長を設定する(処理  /O1
4)  。
現用系のプロセッサ(31)は、チェックポイントデー
タ(70)を待機系のメモリ(42)に1、バイト書き
込む(処理 /O15)。
現用系のプロセッサ(31)は、チェックポイントデー
タ(70)をすべて待機系のメモリ(42)に書き込ん
だか判定する(処理 /O1.6)。
チェックポイントデータ(70)をすべて待機系のメモ
リ(42)に書き込めば、現用系のメモリ(32)から
68000の内部レジスタのARO(5/O)とDRO
(500)の値をリカバリする(処理 /O17)。
DRO−DR7(500−507) 、A、RO−AR
6(5/O−516) 、AR7(520)。
SR(521)、PC(522)を待機系のメモリ(4
2)に格納する(処理 /O18)。
現用系のプロセッサ(31)は、l0P(33)に対し
て、ディスクへの書込み指示を出す(処理/O19)。
現用系のプロセッサ(31)は、チェックポイントカウ
ンタ(552)を0にする。(処理/O20)。
第23図は、ディスクへの書込み処理の詳細フローチャ
ー1・図である。第24図はディスクへの書込みデータ
の内容を示す図である。ディスクへの書込みデータは、
ディスクへの書込み先の先頭アドレス(]、/O)、デ
ータ長(111)及びデータ本体(1,12)で構成す
る。
第23図と第24図を用いて、ディスクへの書込み処理
を説明する。
まず、現用系のプロセッサ(31)は、68000の内
部レジスタのARO(5/O)とARI(511)とD
RO(500)の値を現用系のメモリ(32)をセーブ
する(処理 /O30)。
現用系のプロセッサ(31)は、A RO(51,0)
にディスクへの書込みデータの先頭アドレスを、ARl
(5]。1)に■○PのバッファのアドレスをDRO(
500)にディスクへの書込みデータのデータ長を設定
する(処理 /O3]、)。
現用系のプロセッサ(31)は、ディスクへの書込みデ
ータを現用系のメモリ(32)からIO+)のバッファ
(57]、)に転送する(処理 1.032 )。
現用系のプロセッサ(31)は、■○Pに割込みを通知
する(処理 /O33)。
現用系のメモリ(32)からARO(51,0)、A、
R]、  (5]、、 1)とDRO(500)のイ直
をリカバリする(処理 /O34. )。
一方、■○P(36)は、現用系のプロセッサ(31)
からの割込みを受信し、■○Pのバッファ (571)
を参照して、ディスク(51,,52)に書き込む(処
理 /O4−0)。
第25図は、ケースIの回復処理の概要図である。ケー
スIの回復処理の概要を以下に示す。まず、現用系(3
0)で障害が発生する(7)。
第26図と第27図を用いて、待機系(40)が現用系
(30)の障害を検出する方式を説明する。
第26図は、aliveメツセージの送信処理の詳細フ
ローチャー1−図である。aliveメツセージの送信
処理は1秒毎に起動し、aljveメツセージレジスタ
をoOl、から011.Icすル(処理/O56)。
第27図は、aliveメツセージの受信確認処理の詳
細フローチャート図である。aliveメッセージの受
信確認処理は、待機系(40)は、aliveメツセー
ジの受信すると、a Hveメツセージカウンタを○と
する(処理 1−056)。aliveメツセージの受
信確認処理は、/Orn秒のタイマ割込みにより、al
iveメツセージカウンタを(+1)する(処理 /O
58) 。aliveメツセージカウンタが200以」
二ならば、現用系(30)で障害が発生したと判定する
(処理 /O59 )。
第25図に戻り、障害回復処理を説明を続ける。
待機系(40)は、(処理 /O55〜/O59)のa
l、jveメツセージの送信処理(194)とaliv
eメツセージの受信確認処理(195)により、障害を
検出する(処理 /O49)。
待機系のプロセッサ(42)は、割込みレベルを4にす
る(処理 /O50)。
待機系(40)は、現用系(30)をオフライン状態(
82)にする(処理 /O51)。そして、待機系(4
0)を現用状態(80)にする(処理 1.052 )
。さらに、待機系(40)は、ディスクへの書込み処理
から再開する(処理/O53)  。
第28図は、(処理 /O51)の詳細フローチャート
図である。(処理 /O51)は、現用系(30)の系
状態レジスタ(534,)を031゜からOO□6に遷
移することにより、現用系(30)をオフライン状態(
82)にする(処理 /O60)。
第29図は、(処理 /O52)の詳細フローチャート
図である。(処理 /O52)は、待機系(40)の系
状態レジスタ(634,)を0]−06から0316に
遷移することにより、待機系(40)を現用状態(80
)にする(処理 /O61)。
第30図は、(処理 /O53)の詳細フローチャート
図である。
(処理 /O53 )は、待機系のメモリに格納されて
いるDRO−DR7(500−507)、AR,0−A
R6(5/O−516) 、 AR7(520)、5R
(521)、PC(522)を待機系のフロセッサ(4
1)に設定する。5R(521)を設定すれば、割込み
レベルは0となる(処理 /O70) 。DRO−DR
7(500−507)、ARO−AR6(5/O−51
6)。
A、R7(520)、5R(521)、PC(522)
の値は、(処理 /O18)の値であり、ディスクへの
書込み処理実行の直前の値である。
待機系のプロセッサ(41)は、RTE命令により、デ
ィスクへの書込み処理から再開する(処理  /O71
)  。
第31図はケース■のチェックポイントデータの転送処
理の概要図である。第28図を用いて、ケース■のチェ
ックポイントデータ(70)の転送処理を説明する。ケ
ース■は、最新のディスクへの書込み処理(1,3,5
)後、1秒経過しても次のディスクへの書込み処理が発
生しない場合である。
現用系(30)は、タイマ割込み(192)によりチェ
ックポイント監視処理(196)を起動し、1秒経過し
ても次のディスクへの書込み処理が発生しないので、チ
ェックポイント監視処理(196)は、チェックポイン
トデータ (70)を待機系のメモリ(42)に転送す
る。チェックポイントデータ (70)は、ケースIと
同様にタスク制御情報(72)、ファイル制御情報(7
3)、ファイル制御情報(74)、I/○制御情報(7
5)及び回線制御情報(76)である。現用系のプロセ
ッサ(31)は、チェックポイントデータ(70)を待
機系のメモリ(42)に書き込む(処理/O80./O
81)。
第32図は、(処理 /O80)  の詳細フローチャ
ート図である。(処理 /O80)の詳細フローチャー
トを以下に示す。まず、現用系のプロセッサ(31)が
待機系の系状態レジスタ(634)を読み出す。系状態
レジスタ(634)が00□6ならば、オフライン状態
(82)であるので、チェックポイントデータ(70)
は転送しない(処理  /O91)  。
系状態レジスタ(634)が0116ならば、待機状態
(81)であるので、以下の処理を実行する。
アクセスレジスタ (636)を読み出し、現用系(3
0)はアクセス可能となるまで、待つ(処理  /O9
2)  。
送信可能となれば、68000の内部レジスタのARO
(5/O)とDRO(500)の値を現用系のメモリ(
32)をセーブする(処理 1.093 )。
ARO(5/O)にチェックポイントデータ(70)の
先頭アドレスを、DRO(500)にチェックポイント
データ(70)のデータ長を設定する(処理 /O94
)。
現用系のプロセッサ(31)は、チェックポイントデー
タ(70)を待機系のメモリ(42)に書き込む(処理
 ]、、 O95)。
現用系のプロセッサ(31)は、現用系のメモリ(32
)から68000の内部レジスタのA、RO(5/O)
とDRO(500)の値をリカバリする(処理 /O9
7)。
DRO−DR7(500−507)、AROハR,6(
5/O−516)。AR7(520)。
SR(521)、PC(522)を待機系のメモリ(4
2)に格納する(処理 /O98)。
現用系のプロセッサ(31)は、チェックボイントカウ
ンタ(552)をOにする。(処理/O99)。
第30図は、ケースHの回復処理の概要図である。ケー
ス■の回復処理の概要を以下に示す。まず、現用系(3
0)で障害が発生する(7)。待機系(4o)は、al
iveメツセージの受信確認処理(195)により、障
害を検出する(処理1、t09)。待機系のプロセッサ
(42)は、割込みレベルを4にする(処理 1 ]−
1−0)。待機系(40)は、現用系(30)をオフラ
イン状態(82)にする(処理 1111)。そして、
待機系(40)を現用状態(80)にする(処理111
2)。さらに、待機系(40)は、最新のチェックポイ
ントから再開する(処理 1.113)。
(処理 1111.)は、(処理 /O51)と同じよ
うに、現用系(30)が系状態レジスタ(534)を0
31.からOO工、に遷移することにより、現用系(3
0)をオフライン状態(82)にする。(処理 111
2)は、(処理 /O52)と同じように、待機系(4
0)の系状態レジスタ(634)を0116から03□
6に遷移することにより、待機系(40)を現用状態(
80)にする(処理 /O61)。
第34図は、(処理 1113)の詳細フローチャート
図である。(処理 111.3)は、待機系のメモリに
格納されているD RO−1) R7(500−570
)、ARO−AR6(5/O−516)、AR7(52
0)、SR(521)。
PC(522)を待機系のプロセッサ(41)に設定す
る(処理 1120)。
DRO−DR7(500−507)、ARO−AR6(
5/O−516)、AR7(520)。
SR(521)、PC(522)の値は、(処理/O1
8)の値であり、チェックポイント時の値である。
待機系のプロセッサ(41)は、R,T E命令により
、チェックポイントから再開する(処理1121)。
第9図は、停止時間(20)とオーバヘア1〜(25)
の評価結果を示す図である。本発明によるホットスタン
バイシステムの停止時間(20)とオーバヘッド(25
)を定量的に評価する。
まず、停止時間(20)を算出する。停止時間(2o)
は、最新のチエツクポインI・から障害発生までの時間
T(c−f)(21) 、障害検出時間T(d)(22
)及び障害回復時間T(r)(23)の和である。
最新のチェックポイントから障害発生までの時間T(c
”f)(22)は、ケース■の場合はI/O発行時間の
間隔であり■/○の発行頻度が/O回/秒であるので、
T(c〜f)(21)は/O0m秒となり、ケースHの
場合はチエツクポイン1一監視処理の起動周期であるT
(c”f)(21)は1秒となる。最新チエツクポイン
1へから障害発生までの時間T(c”f)(21)は、
/O0m秒から1−秒である。
障害検出方式は、汎用大型機あるいは電子交換機と同様
に、aljveメツセージ(/O0)を受信し、2秒以
内に次のaliνeメツセージ(1−00)を受信しな
い障害発生と判定するため、障害検出時間T(d)は2
秒である。
本発明では、ジャーナル(76)を参照しファイルを回
復させる処理がないため、障害回復時間T(r)(23
)は、0秒である。
次に、オーバヘッド(25)を以下条件で算出する。オ
ーバヘッド(25)は、現用系(30)がチエツクポイ
ン1へデータ(70)を待機系のメモリ(42)に転送
する処理である。
チェックポイントデータ量・・・・・・/O k、 B
I/O発行間隔・・・・・・・・・・・・・・・・・・
・・・/O0m秒バスの転送スピード・・・・・・・・
・・・・・・・20 M B / 秒とのれば、 =5(%) この結果、本発明の停止時間(20)は2〜3秒程度、
オーバヘッド(25)は5%となり、停止時間の短縮と
オーバヘッドの削減を満たすことが可能となる。
〔発明の効果〕
本発明によれば、障害時のシステムの停止時間を短縮さ
せること及びオーバヘッドを削減させることが可能にな
る。
【図面の簡単な説明】
第1図は本発明によるチェックポイントデータの取得方
式と回復手順を示す図、第2図はホラI・スタンバイシ
ステムのハードウェア構成図、第3図は汎用大型計算機
、電子交換機及び本発明によるホットスタンバイシステ
ムの回復方式とその特徴を示す図、第4図は汎用大型機
のチェックポイントデータの取得とジャーナルの取得方
式を示す図、第5図は汎用大型機のチェックポイントデ
ータの取得と回復処理手順を示す図、第6図は電子交換
機の両系書込み命令を示す図、第7図は停止時間を示す
図、第8図は障害検出方式を示す図、第9図は汎用大型
計算機、電子交換機及び本発明によるホットスタンバイ
システムの停止時間とオーバヘッドを示す図、第/O図
は本発明によるホットスタンバイシステムのチェックポ
イントデータの取得を示す図、第11図は系の状態と状
態遷移を示す図、第12図は第1図の装置に用いるプロ
セッサ、メモリ、IOP、バスエクステンダの詳細回路
図、第13図は現用系と待機系のメモリマツプを示す図
、第14図はバスエクステンダの詳細図、第15図は系
状態レジスタ、alive レジスタ、通信レジスタ、
割込みレジスタの内容を示す図、第16図は割込みレベ
ルを示す図、第17図はタイマ割込みの制御回路を示す
図、第18図はソフトウェアの処理概要を示す図、第1
9図はディスクへの書込み処理実行後、1秒以内に次の
ディスクへの書込み処理が発生したかどうかを示す図、
第20図はチェックポイント監視処理の詳細のフローチ
ャート、第21−図はケース■のチェックポイントデー
タの取得処理の概要図、第22図は処理/O00の詳細
フローチャート図、第23図はディスクの書込み処理を
示す図、第24図はディスクへの書込みデータの内容を
示す図、第25図はケースIの回復処理の概要図、第2
6図はaliveメツセージの送信処理の詳細フローチ
ャート図、第27図はaliveメツセージの受信確認
処理の詳細フローチャーI・図、第28図は処理/O5
1の詳細フローチャーI・図、第29図は処理/O52
の詳細フローチャー1−図、第30 ES)は処理1−
053の詳細フローチャート図、第31図はケースHの
チェックポイントータータの取得処理の概要図、第32
図は処理/O80の詳細フローチャート図、第33図は
ケースHの回復処理の概要図、第34図は処理1113
の詳細フローチャート図である。 1、.3.5・・・ディスクへの書込み処理、7・・障
害発生、]]−・・チェックポイントデータの転送周期
、1.2・・・チェックポイントデータの転送処理(汎
用大型機)、13・・・両系書込み命令、工4・・・チ
エツタポイントデータの転送処理(本発明)、20・・
・停止時間二T、21・・・最新のチエツクポイン1へ
から障害発生までの時間T :  (c−f) 、22
・・障害検出時間:T (d) 、23・・・障害回復
時間=T(r)、24・・・aliveメツセージの受
信確認周期: T(a c−p) 、25−=オーバヘ
ッド:○、26・・・チエツクポイン1−127・・・
現用系の障害検出時点、28・・・チェックポイント時
点に回復時点、30・・・現用系、40・・・待機系、
31.41・・・プロセッサ、32.42・・・メモリ
、33.43・・・IOP、34.4.4・・・回線制
御装置、35.45・・・ディスク制御装置、36.4
6・・・バスエクステンダ、50・・・回線、51.5
2・・・ディスク、53・・回線切替装置、55・・・
バス、60〜63・・・端末、70・・・チェックポイ
ントデータ、72・・・タスク制御情報、73・・・フ
ァイル制御情報、74・・・工/O制御情報、75・・
・回線制御情報、76・・・ジャーナル、/O0・・・
aliveメツセージ、1/O・・・ディスクへの書込
み先の先頭アドレス、11.1・・・データ長、112
・・・データ本体、1−90・・・割込み、」−91・
割込み種別の解析、192・・・タイマ割込み、193
・・障害割込み、194・・・a]iveメツセージの
送信処理、195・・・aliveメツセージの受信確
認処理、196・・・チェックポイント監視処理、19
7・・・回復処理、」−98・・・トランザクション処
理、500゜600・・・データレジスタ: DRO1
501,601データレジスタ: DRI、502,6
02・・・デ−タレジスタ: DR2,503,603
・・・データレジスタ:DR3,504,,604・・
データレジスタ: DR4,505,605・・・デー
タレジスタ:DR5,506,606・・・データレジ
スタ:DR6,507,607・・データレジスタ: 
DR7,5/O,61−○・・・アドレスレジスタ=A
R○、51]、、、611・・・アドレスレジスタ:A
Rl、5i2.6i2・・・アドレスレジスタ:AR2
,513,613・・・アドレスレジスタ: AR3,
5]、、4..614・・・アドレスレジスタ: AR
4,515,615・・アドレスレジスタ:AR5゜5
16.616・・・アドレスレジスタ:AR6,520
,620・・・スタックポインタ:AR7゜521.6
21−Xデータレジスタ:5R1522゜622・・・
プログラムカウンタ:Pc、530゜630・・タイマ
、531,631・・アドレスデコーダ、532,63
2・・割込みエンコーダ、533゜633・・・双方向
ドライバ、534,634・・・系状態レジスタ、53
5 、635−al、ive レジスタ、536.63
6・・通信レジスタ、537,637・・割込みレジス
タ、540,640・・データ線=Do−D7,541
,641・・・アドレス線:A」〜A、22.542,
642・・・アドレス線:A23.543.643・・
・割込み線:IPLO1544゜644・・・割込み線
:IPLl、545,645・割込み線:IPL2.5
4.6,64.6・・・W/R線、550.650・・
・クロック、551,651・・・alj、veカウン
タ、552,652・・・チェックポイントカウンタ、
553,653・・・データ双方向ドライバ、554,
654・・・アlくレス双方向ドライバ、555,65
5・・・双方向ドライバの制御信号、570.670・
・・工○Pのプロセッサ、571゜671・・・IOP
のバッファ、572,672・・IOPのROM、57
3,673・・・IOPのRAM。 580・・・本発明によるホットスタンバイシステムの
メモリマツプ、581.・・・現用系のメモリマツプ、
68]−・・・待機系のメモリマツプ、582,682
・・・ハードレジスタ領域、583,683・・・os
領領域584..684・・・チェックポイントデータ
の領域、585,685・・・プログラム領域、586
゜第 菊 /7 図 とr 力 2θ 図 (幻 プ゛ンλ)へq$2.へ2メξ理 \ (−1,) ○力つ

Claims (1)

  1. 【特許請求の範囲】 1、現用系と待機系からなるホットスタンバイシステム
    により構成される電子計算機の系切り替え方法であって
    、 前記現用系は、前記待機系へ処理を引き継ぐために必要
    な情報として、タスク制御情報、ファイル制御情報、I
    /O制御情報及び回線制御情報からなるチェックポイン
    トデータを、前記現用系のディスクへの書込み処理と同
    期して、前記待機系のメモリに転送し、 前記現用系に障害が発生すると、前記待機系のメモリに
    格納されている前記チェックポイントデータを参照して
    、前記待機系はディスクの書込み処理から再開すること
    を特徴とする二重化システムの系切り替え方法。 2、現用系と待機系からなるホットスタンバイシステム
    により構成される電子計算機の糸切り替え方法であって
    、 二重送信を許容する通信手順を用い、前記現用系は、前
    記待機系へ処理を引き継ぐために必要な情報として、タ
    スク制御情報、ファイル制御情報、I/O制御情報及び
    回線制御情報からなるチェックポイントデータを、前記
    現用系のメッセージ送信処理と同期して、前記待機系の
    メモリに転送し、前記現用系で障害が発生すると、前記
    待機系のメモリに格納されている前記チェックポイント
    データを参照して、前記待機系はメッセージ送信処理か
    ら再開することを特徴とする二重化システムの系切り替
    え方法。 3、特許請求の範囲第1項または第2項記載の二重化シ
    ステムの系切り替え方法において、 所定時間以内にディスクへの書込み処理およびメッセー
    ジ送信処理の少なくとも一方がなければ、最新のディス
    クへの書込み処理およびメッセージ送信処理の少なくと
    も一方の終了後、所定時間経過時をチェックポイントと
    し、 前記現用系が前記チェックポイント時に前記チェックポ
    イントデータを前記待機系のメモリに転送し、 前記現用系で障害が発生すると、前記待機系のメモリに
    格納されているチェックポイントデータを参照し、チェ
    ックポイントから再開することを特徴とする二重化シス
    テムの系切り替え方法。
JP2181462A 1990-07-11 1990-07-11 二重化システムの系切り替え方法 Expired - Fee Related JP3026350B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2181462A JP3026350B2 (ja) 1990-07-11 1990-07-11 二重化システムの系切り替え方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2181462A JP3026350B2 (ja) 1990-07-11 1990-07-11 二重化システムの系切り替え方法

Publications (2)

Publication Number Publication Date
JPH0469740A true JPH0469740A (ja) 1992-03-04
JP3026350B2 JP3026350B2 (ja) 2000-03-27

Family

ID=16101182

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2181462A Expired - Fee Related JP3026350B2 (ja) 1990-07-11 1990-07-11 二重化システムの系切り替え方法

Country Status (1)

Country Link
JP (1) JP3026350B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010533900A (ja) * 2007-04-20 2010-10-28 インターナショナル・ビジネス・マシーンズ・コーポレーション アダプタ・カードのフェイルオーバのための装置、システム、方法、およびコンピュータ・プログラム
JP2012178659A (ja) * 2011-02-25 2012-09-13 Nippon Telegr & Teleph Corp <Ntt> 呼制御システムおよび呼制御に利用する情報の冗長化方法
JP2013038582A (ja) * 2011-08-08 2013-02-21 Nippon Telegr & Teleph Corp <Ntt> 呼制御システムおよび呼制御に利用する情報の冗長化方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001213214A (ja) 2000-02-03 2001-08-07 Eidai Kako Kk 自動車用フロアーマット

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010533900A (ja) * 2007-04-20 2010-10-28 インターナショナル・ビジネス・マシーンズ・コーポレーション アダプタ・カードのフェイルオーバのための装置、システム、方法、およびコンピュータ・プログラム
JP2012178659A (ja) * 2011-02-25 2012-09-13 Nippon Telegr & Teleph Corp <Ntt> 呼制御システムおよび呼制御に利用する情報の冗長化方法
JP2013038582A (ja) * 2011-08-08 2013-02-21 Nippon Telegr & Teleph Corp <Ntt> 呼制御システムおよび呼制御に利用する情報の冗長化方法

Also Published As

Publication number Publication date
JP3026350B2 (ja) 2000-03-27

Similar Documents

Publication Publication Date Title
US5802267A (en) Method for checkpointing in computer system under distributed processing environment
US6622263B1 (en) Method and apparatus for achieving system-directed checkpointing without specialized hardware assistance
KR100238926B1 (ko) 분산 메모리형 멀티프로세서 시스템 및 고장 회복방법
US4941087A (en) System for bumpless changeover between active units and backup units by establishing rollback points and logging write and read operations
JP2505928B2 (ja) フォ―ルト・トレラント・システムのためのチェックポイント機構
KR100408047B1 (ko) 이동통신 시스템의 프로세서 보드 이중화 장치 및 방법
WO2010100757A1 (ja) 演算処理システム、再同期方法、およびファームプログラム
JPH0469740A (ja) 二重化システムの系切り替え方法
JP2953639B2 (ja) バックアップ装置及びその方法
JP3447347B2 (ja) 障害検出方法
JP3025732B2 (ja) 多重化コンピュータシステムの制御方式
JPH0879246A (ja) 分散型通信システムおよびその障害回復方法
JP3343618B2 (ja) 端末無中断オンラインシステム
JPH04360242A (ja) 二重化システムの系切替装置およびその方法
JPH04299435A (ja) データベース等価方式
JPH07219802A (ja) 2重化制御方式
US20070038849A1 (en) Computing system and method
JP3471913B2 (ja) コンピュータシステム
JPH0462081B2 (ja)
JP2879480B2 (ja) 冗長計算機システムの同期外れ時の切替方式
JPH05216855A (ja) マルチcpu制御方式
JP2002244885A (ja) コンピュータシステム監視システム
JPH0319978B2 (ja)
KR100675136B1 (ko) 엠엠유를 이용한 운영체제 기반 이중화 방법
CN117743026A (zh) 一种数据容灾的方法、系统、设备及存储介质

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees