JP3026350B2 - 二重化システムの系切り替え方法 - Google Patents

二重化システムの系切り替え方法

Info

Publication number
JP3026350B2
JP3026350B2 JP2181462A JP18146290A JP3026350B2 JP 3026350 B2 JP3026350 B2 JP 3026350B2 JP 2181462 A JP2181462 A JP 2181462A JP 18146290 A JP18146290 A JP 18146290A JP 3026350 B2 JP3026350 B2 JP 3026350B2
Authority
JP
Japan
Prior art keywords
standby
active
checkpoint
memory
standby system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2181462A
Other languages
English (en)
Other versions
JPH0469740A (ja
Inventor
讓 真矢
俊之 木下
紀夫 森岡
嘉紀 督永
博之 常世田
勇夫 吉野
健 大賀
敏 竹村
芳明 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Electronics Services Co Ltd
Original Assignee
Hitachi Ltd
Hitachi Electronics Services Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Electronics Services Co Ltd filed Critical Hitachi Ltd
Priority to JP2181462A priority Critical patent/JP3026350B2/ja
Publication of JPH0469740A publication Critical patent/JPH0469740A/ja
Application granted granted Critical
Publication of JP3026350B2 publication Critical patent/JP3026350B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、ホットスタンバイシステムに係わり、特に
障害時の停止時間を短縮するとともに、オーバヘッドを
削減したホットスタンバイシステムに関する。
〔従来の技術〕
第2図はホットスタンバイシステムのハードウェア構
成図である。汎用大型計算機や電子交換機では、従来か
ら処理の連続性を重視するため、現用系と待機系からな
るホットスタンバイシステムで構成していた。ホットス
タンバイシステムは、第2図に示すように、現用系と待
機系はそれぞれ、プロセッサ,メモリ,バスエクステン
ダ,IOP,回線制御装置,ディスク制御装置で構成するこ
とにより、現用系あるいは待機系は単独で処理可能であ
る。
以下、汎用大型計算機と電子交換機のホットスタンバ
イシステムのチェックポイントデータの取得方式と障害
からの回復方式を説明する。
従来の汎用大型計算機の回復方式は、オンラインシス
テムのソフトウェア(産業図書 大野豊著P.147〜P.15
3)に記載されている。
第4図は汎用大型計算機のチェックポイントデータの
取得とジャーナルの取得方式を示す図である。第5図は
汎用大型計算機のチェックポイントデータの取得と回復
手順を示す図である。汎用大型計算機のチェックポイン
トデータの取得方式は、第3図,第4図,第5図に示す
ように、現用系が一定周期(チェックポイント)毎に、
タスク制御情報,ファイル制御情報,I/O制御情報及び回
線制御情報をチェックポイントデータと定義して、待機
系のメモリに転送していた。また、障害時にファイルを
回復できるように、現用系のプロセッサはディスクへの
書込み処理毎に、ジャーナルをディスクを書き込んでい
た。
現用系で障害が発生すると、待機系は、ディスクに格
納されているジャーナルを参照して、ファイルを障害時
の状態に回復し、再開処理を行っていた。
その結果、汎用大型計算機では、ディスクに格納して
いるジャーナルを参照してファイルを回復しなければな
らず、ファイルの回復時間が長くなり、障害時のシステ
ムの停止時間が長くなるという問題があった。
第6図は電子交換機の両系書込み命令を示す図であ
る。従来の電子交換機の回復方式は、日経エレクトロニ
クス(1989,2.20 P.325〜P.329)に記載されている。電
子交換機の回復方式は、第3図と第6図に示すように、
現用系の書き込み命令が現用系と待機系のメモリに同時
に書き込むこと(両系書込み命令を使用すること)によ
り、現用系と待機系のメモリの内容を常に同一にしてい
た。
現用系で障害が発生すると、待機系は待機系のメモリ
を参照して、処理を継続する。
その結果、電子交換機ではチェックポイントを設定す
る必要はなく、チェックポイントデータとジャーナルは
不要である。現用系の両系書込み命令は、現用系と待機
系の両方のメモリに同時に書き込む両系書込み命令とな
るため、書込み命令の実行時間が長くなり、正常運転中
のオーバヘッドが大きくなるという問題があった。
〔発明が解決しようとする課題〕
汎用大型計算機と電子交換機のホットスタンバイシス
テムの停止時間とオーバヘッドを定量的に評価し、課題
を明確にする。
(1)停止時間 第7図は、停止時間を示す図である。停止時間は第7
図に示すように、最新のチェックポイントから障害発生
までの時間、障害検出時間及び障害回復時間の和であ
る。T=T(c〜f)+T(d)+T(r) T:停止時間 T(c〜f):最新のチェックポイントから障害発生ま
での時間 T(d):障害検出時間 T(r):障害回復時間 (a)最新のチェックポイントから障害発生までの時間 (i)汎用大型計算機 一定周期でチェックポイントデータを転送しているの
で、T(c〜f)はチェックポイントデータの転送周期
になり、5秒程度である。
(ii)電子交換機 両系のメモリの内容が同一であり、待機状態のメモリ
を参照して処理を再開するためチェックポイントに戻ら
ないため、T(c〜f)はほとんど0である。
(b)障害検出時間 第8図は障害検出方式を示す図である。障害検出方式
は、以下のように汎用大型計算機と電子交換機で同じ方
式である。
現用系はaliveメッセージを待機系に転送する。待機
系はaliveメッセージを受信する。待機系は、次のalive
メッセージが一定時間(aliveメッセージ受信の確認周
期:T(ac_p))以内に受信するかどうかチェックする。
現用系で障害が発生し、aliveメッセージが待機系に転
送できない。待機系は一定時間(aliveメッセージ受信
の確認周期:T(ac_p))経過しても、aliveメッセージ
を受信しない。現用系に障害が発生したと判定する。
障害検出時間は、汎用大型計算機と電子交換機とも
に、aliveメッセージ受信の確認周期(T(ac_p))と
なり、2秒程度である。
(c)障害回復時間 (i)汎用大型計算機 ジャーナルを参照しファイルを回復するので、ファイ
ルの回復時間は30秒とし、T(r)は30秒程度である。
(ii)電子交換機 両系のメモリの内容が同一である。待機状態のメモリ
を参照して処理を再開するためチェックポイントに戻ら
ず、待機状態のメモリを参照して再開するので、T
(r)はほとんど0である。
(d)停止時間の合計 汎用大型計算機と電子交換機の停止時間の合計を算出
する。
(i)汎用大型計算機 停止時間はジャーナルを参照しファイルを回復する時
間に依存し、停止時間は37秒程度となる。
(ii)電子交換機 障害の検出時間となり、2秒程度である。
(2)オーバヘッド オーバヘッドは、以下に示すように単体システムから
ホットスタンバイシステムに移動する場合に低下する処
理能力の割合を示す。
R(s):単一システムの処理能力 R(h):ホットスタンバイシステムの処理能力 (a)汎用大型計算機 汎用大型計算機では、チェックポイントデータを現用
系から待機系に送る処理がオーバヘッドとなる。
オーバヘッドは以下の条件で算出する。
チェックポイントデータ量:100kB 転送スピード:1MB/秒 オーバヘッドは2%である。
(b)電子交換機 電子交換機では、両系のメモリに書き込む処理がオー
バヘッドとなる。両系のメモリへの書込み命令の実行時
間は、通常の書込み命令の実行時間の2倍とする。
オーバヘツドは以下の条件で算出する。
W:単体システムの書込み命令の実行時間 2×W:ホットスタンバイシステムの書込み命令の実行時
間 R:非書込み命令の実行時間 書込み命令の比率:30% 非書込み命令の比率:70% オーバヘッドは30%になる。
第9図は、停止時間とオーバヘツドを示す図である。
第9図より、汎用大型計算機のホットスタンバイシステ
ムは、オーバヘッドは小さいが、停止時間は40秒弱と長
いという問題点があった。
さらに、電子交換機のホットスタンバイシステムは、
停止時間が2秒と短いが、オーバヘッドが30%と大きい
という問題点があった。
本発明の目的は、現用系に障害が発生した場合、待機
系に切り替えるまでのシステムの停止時間を短縮させる
ことである。
本発明の他の目的は、現用系が正常運転中にバックア
ップ処理に要するオーバヘッドを削減させることであ
る。
〔課題を解決するための手段〕
現用系と待機系はそれぞれ、プロセッサ,メモリ,バ
スエクステンダ,IOP,回線制御装置,ディスク制御装置
で構成することにより、現用系あるいは待機系は単独で
処理可能とする。
現用系はディスクへの書込み処理時間をチェックポイ
ントとし、処理を引き継ぐために必要な情報として、タ
スク制御情報,ファイル制御情報,I/O制御情報及び回線
制御情報をチェックポイントデータとし、現用系はディ
スクへの書込み処理と同期して、チェックポイントデー
タを待機系のメモリに転送する。
現用系で障害が発生すると、待機系は待機系のメモリ
に格納されているチェックポイントデータを参照して、
ディスクの書込み処理から再開する。
〔作用〕
本発明によるホットスタンバイシステムは、現用系と
待機系で構成する。現用系と待機系は、それぞれ、プロ
セッサ,メモリ,バスエクステンダ,IOP,ディスク制御
装置及び回線制御装置で構成することにより、現用系あ
るいは待機系は単独で処理可能である。
現用系で障害が発生すると、待機系は現用系の処理を
引き継ぐ。処理の引継ぎのポイントとして、チェックポ
イントを設ける。チェックポイントは、ディスクへの書
込み処理時とメッセージ送信処理時である。
チェックポイントがディスクへの書込み処理時の場
合、チェックポイントデータは、タスク制御情報,ファ
イル制御情報,I/O制御情報及び回線制御情報である。現
用系がディスクの書込み処理を実行する毎に、現用系チ
ェックポイントデータを待機系のメモリに転送する。
そのため、チェックポイント間(ディスクへの書込み
処理時間)で、ファイル更新のないことが保証でき、ジ
ャーナルを不要とすることが可能である。また、待機系
のメモリに最新のチェックポイントデータを格納してい
るため、両系書込み命令は不要になる。
現用系で障害が発生すると、待機系のプロセッサは、
チェックポイントデータが格納されている待機系のメモ
リを参照し、最新のディスクへの書込み処理から再開す
る。待機系は、現用系の最新のディスクへの書込み処理
を完了しているかどうか判定できない。しかし、待機系
は、現用系と同じ内容のデータをディスクへ書き込むた
め、同じ内容のデータを現用系と待機系で2回書き込ん
でも、ディスクの内容に矛盾が生じることはない。その
ため、待機系は、ディスクへの書込み処理から再開する
ことにより、現用系の処理を引き継ぐことが可能であ
る。
チェックポイントがメッセージ送信処理の場合、チェ
ックポイントデータは、タスク制御情報,ファイル制御
情報、I/O制御情報及び回線制御情報である。現用系は
メッセージ送信処理毎に、チェックポイントデータを待
機系のメモリに転送する。
現用系で障害が発生すると、待機系は、最新のメッセ
ージ送信処理まで戻り、待機系のメモリを参照し、現用
系の処理をメッセージ送信処理から再開する。同一メッ
セージを2回送信する場合があるが、メッセージの二重
送信を許容すれば(すなわちメッセージの受信側の装置
に前回のメッセージと同じメッセージを受信すると、後
者のメッセージを破棄する機能を持たせれば)、通信手
順に誤りがないことが保証できる。
また、一定時間経過しても、ディスクへの書込み処理
及びメッセージ送信処理を実行しない場合、一定時間経
過時をチェックポイントとする。チェックポイントデー
タは、タスク制御情報、ファイル制御情報,I/O制御情報
及び回線制御情報である。現用系は、チェックポイント
時に、チェックポイントデータを待機系のメモリに転送
する。最新のチェックポイントから現用系で障害が発生
するまで、ディスクへの書込み処理及びメッセージ送信
処理がないことが保証できる。
その結果、現用系で障害が発生すると、待機系は、チ
ェックポイントまで戻り、待機系のメモリを参照し、現
用系の処理を引き継ぐことが可能である。
このようにして、現用系で障害が発生しても、停止時
間を長くさせるジャーナルの参照及びファイルの回復処
理を不要とすることができ、さらに、両系書込み命令の
ような実行時間の長い命令を使うことなく処理を継続さ
せることができる。
この結果、システムの停止時間を短縮させること及び
オーバヘッドを削減することが可能になる。
〔実施例〕
以下、本発明の一実施例を示す。本発明によるホット
スタンバイシステムは、現用系(30)と待機系(40)で
構成する。現用系(30)の障害発生に備えて、待機系
(40)が現用系(30)の処理を再開するポイントとし
て、チェックポイント(26)を設ける。本発明では、チ
ェックポイント(26)は現用系(30)のディスクへの書
込み処理(1,3,5)とメッセージの送信処理であるが、
本実施例では、ディスクへの書込み処理時(1,3,5)で
説明する。チェックポイントデータ(70)は、現用系
(30)がチェックポイント(26)と同期して、待機系
(40)に転送するデータを定義する。チェックポイント
データ(70)の内容は、タスク制御情報(72),ファイ
ル制御情報(73),I/O制御情報(74)及び回線制御情報
(75)である。
待機系(40)の障害時は、現用系(30)は、待機系
(40)をオフライン状態(82)として、実行すればよい
ため、本実施例では、現用系(30)の障害のみ説明す
る。
現用系(30)の障害検出は、第8図に示すように、障
害検出時間が最も長くなるaliveメッセージの送受信方
式を前提とする。
第1図は、チェックポイントデータの取得方式と回復
手順を示す図である。本実施例の概要は、第1図に示す
ように、現用系(30)が、ディスクへの書込み処理と同
期して、チェックポイントデータ(70)を待機系(40)
に送信する(ステップ1)。待機系はチェックポイント
データ(70)を受信し、待機系のメモリ(42)に書き込
む(ステップ2)。同様に、現用系(30)が、ディスク
への書込み処理と同期して、チェックポイントデータ
(70)を待機系(40)に送信する(ステップ3)。待機
系はチェックポイントデータ(70)を受信し、待機系の
メモリ(42)に書き込む(ステップ4)。さらに現用系
(30)が、ディスクへの書込み処理と同期して、チェッ
クポイントデータ(70)を待機系(40)に送信する(ス
テップ5)。待機系はチェックポイントデータ(70)を
受信し、待機系のメモリ(42)に書き込む(ステップ
6)。
現用系で障害が発生する(ステップ7)。待機系のプ
ロセッサ(41)は、待機系のメモリ(42)からチェック
ポイントデータ(70)を読み出し(ステップ8)、最新
のディスクへの書き込み処理から再開する(ステップ
9)。
第10図は、本発明によるホットスタンバイシステムの
チェックポイントデータ(70)の取得を示す図である。
チェックポイントデータの取得方式は、現用系のプロセ
ッサ(31)がディスクへの書込み処理時間(ステップ1,
3,5)に、チェックポイントデータ(70)として、タス
ク制御情報(72)、ファイル制御情報(73)、I/O制御
情報(74)及び回線制御情報(75)をバス(55)を介し
て待機系のメモリ(42)に書き込む。
本発明では、現用系(30)が、ディスクへの書込み処
理(ステップ1,3,5)と同期して、チェックポイントデ
ータ(70)を待機系(40)に転送する。そのため、チェ
ックポイント間(ステップ1とステップ3の間、及びス
テップ3とステップ5の間)でディスクへの書込み処理
がなく、ファイルの更新がないことが保証できる。その
結果、本発明によるホットスタンバイシステムは、第3
図に従来技術と比較して示すように、ジャーナル(76)
を不要とすることが可能であり、かつ、待機系のメモリ
(42)に最新のチェックポイントデータ(70)を格納し
ているため、両系書込み命令(13)は不要となる。
本発明の特徴は、ジャーナル(76)による回復処理を
不要とすることにより停止時間(20)が短縮できるとこ
ろ、及び実行時間の長い両系書込み命令(13)を不要と
することによりオーバヘッド(25)が削減できるところ
である。
第11図は、系の状態と状態遷移を示す図である。系
(30,40)の状態は、第11図に示すように現用状態(8
0)、待機状態(81)及びオフライン状態(82)の3状
態を設ける。現用状態(80)と待機状態(81)を合わせ
て、オンライン状態(87)という。現用状態(80)の系
を現用系(30)、待機状態(81)の系を待機系(40)と
いう。現用状態(80)は実際に処理を実行している状態
である。待機状態(81)は現用状態(80)の系から処理
を引き継ぐためのチェックポイントデータ(70)を受信
し、直ちに実行中の処理が引き継げるように休止してい
る状態である。オフライン状態(82)は上記以外で障害
や保守によりシステムから切り離されている状態であ
る。
現用状態(80)で障害が発生すると、現用状態(80)
の系をオフライン状態(82)に遷移し(状態遷移83)、
待機状態(81)の系を現用状態(80)に遷移する(状態
遷移84)。
待機状態(81)で障害が発生すると、待機状態(81)
の系をオフライン状態(82)に遷移する(状態遷移8
5)。障害から回復すると、オフライン状態(82)から
待機状態(81)に遷移する(状態遷移86)。
第2図はホットスタンバイシステムのハードウェア構
成図である。本発明によるホットスタンバイシステム
は、第2図に示すように、現用系(30),待機系(4
0)、バス(55)、ディスク(51,52)、回線切替装置
(53)、及び端末(60,61,62,63)で構成する。
現用系(30)はプロセッサ(31)、メモリ(32)、IO
P(33)、回線制御装置(34)、ディスク制御装置(3
5)及びバスエクステンダ(36)で構成する。
待機系(40)はプロセッサ(41)、メモリ(42)、IO
P(43)、回線制御装置(44)、ディスク制御装置(4
5)及びバスエクステンダ(46)で構成する。
ディスク制御装置(35,45)は、ディスク(51,52)を
アクセスし、ディスク(51,52)への書込みデータと読
み出しデータを所有する。
回線制御装置(34,44)は、メッセージの待ち行列を
所有し、端末(60,61,62,63)から受信したメッセージ
と端末(60,61,62,63)へ送信するメッセージを所有す
る。
回線切替装置(53)は、系(30,40)で障害が発生し
たとき、他の系(40,30)に回線を切り替えるために使
用する。
ディスク(51,52)は、ディスク(51,52)障害時にシ
ステムダウンに至らないように、二重化構成にし同一の
内容を格納する。
第12図は、第1図の装置に用いるプロセッサ(31,4
1)、メモリ(32,42)、IOP(33,43)、バスエクステン
ダ(36,46)の詳細回路図である。現用系(30)と待機
系(40)は、同一構成であるため、現用系(30)を中心
に記述する。
プロセッサ(31,41)は、68000マイクロプロセッサと
する。68000マイクロプロセッサの内部レジスタは、デ
ータレジスタDR0−DR7(500−507,600−607)、アドレ
スレジスタAR0−AR6(510−516,610−616)、スタック
ポインタAR7(520,620)、ステータスレジスタSR(521,
621)、プログラムカウンタPC(522,622)で構成する。
68000マイクロプロセッサの信号線は、データ線D0〜D
7(540,640)、アドレス線A1〜A22(541,641)、アドレ
ス線A23(542,642)、割込み線(IPL0〜2)(542−54
5,643−645)で構成する。
アドレス線A23(542,642)は、現用系のメモリ(32)
をアクセスするのか待機系のメモリ(42)をアクセスす
るのかの判定に使用する。
W/R線(546,646)は、“H"の時リードサイクル、“L"
の時ライトサイクルである。
IOP(33,43)は、プロセッサ(570,670)、バッファ
(571,671)、ROM(572,672)及びRAM(573,673)で構
成する。バッファ(571,671)には、プロセッサ(31,4
1)から転送されるディスクへの書込みデータを格納す
る。
その他、タイマ(530,630)、アドレスデコーダ(53
1,631)と割込みエンコーダ(532,632)を設ける。
現用系(30)と待機系(40)は同一構成である。現用
系(30)で(5**)のものは、待機系では(6**)
と対応する。例えば、現用系(30)のタイマ(530)
は、待機系(40)のタイマ(630)に対応する。
第13図は、現用系(30)と待機系(40)のメモリマッ
プを示す図である。68000マイクロプロセッサでは、メ
モリ空間(580)は16Mバイトである。現用系(30)は、
前半の8Mバイト、アドレス(00000016〜7FFFFF16)を使
用し、待機系(40)は、後半の8Mバイト、アドレス(80
000016〜FFFFFF16)を使用する。
現用系のプロセッサ(31)が現用系のメモリ(32)を
アクセスするか待機系のメモリ(31)をアクセスするか
は、現用系のプロセッサのアドレス線A23(542)によ
る。すなわち、現用系のメモリは(31)は、前半の8Mバ
イト、アドレス(00000016〜7FFFFF16)を使用する。現
用系のプロセッサのアドレス線A23(542)がLならば、
現用系のメモリ(32)をアクセスする。待機系(40)
は、後半の8Mバイト、アドレス(80000016〜FFFFFF16
を使用する。現用系のプロセッサのアドレス線A23(54
2)がHならば、待機系のメモリ(32)をアクセスす
る。
現用系のメモリマップ(581)は、第13図に示すよう
に以下の通りである。
・0〜α ハードレジスタ(582) ・α〜α+β OS(583) ・α+β〜α+β+γ チェックポイントデータ(584) ・α+β+γ〜α+β+γ+δ プログラム(585) ・α+β+γ+δ〜7FFFFF16 リザーブ(586) 待機系のメモリマップ(681)は、第13図に示すよう
に以下の通りである。
・80000016〜80000016+α ハードレジスタ(682) ・80000016+α〜80000016+α+β OS(683) ・80000016+α+β 〜80000016+α+β+γ チェックポイントデータ(684) ・80000016+α+β+γ 〜80000016+α+β+γ+δ プログラム(685) ・80000016+α+β+γ+δ 〜FFFFFF16 リザーブ(686) この結果、現用系メモリ(32)と待機系メモリ(42)
のアドレスの最上位ビットを除いて、チェックポイント
データ(70)を同じアドレスに格納することができる。
第14図は、バスエクステンダ(36,46)の詳細図であ
る。(バスエクステンダ(36,46)は、現用系のプロセ
ッサ(31)が待機系のメモリ(42)をアクセスできるよ
うにし、現用系のメモリ(32)の内容を待機系のメモリ
(42)に転送できるようにする。そのために、バスエク
ステンダ(36,46)には、系状態レジスタ(534,634)、
aliveレジスタ(535,635)、アクセスレジスタ(536,63
6)、割込みレジスタ(537,637)及び双方向ドライバ
(533,633)を設ける。双方向ドライバの制御信号(55
5,655)を設ける。
現用系(30)の双方向ドライバの制御信号(555)
は、以下のように、現用系のプロセッサ(31)のアドレ
ス線A23(542)とW/R線(546)の値による。
アドレス線A23(542)がL、W/R線(546)がHの時、
現用系のプロセッサ(31)は待機系のメモリ(42)から
読み出す。
アドレス線A23(542)がL、W/R線(546)がLの時、
現用系のプロセッサ(31)は待機系のメモリ(42)に書
き込む。
待機系(40)の双方向ドライバの制御信号(655)
は、以下のように、待機系のプロセッサ(41)のアドレ
ス線A23(642)とW/R線(646)の値による。
A23(642)がH、W/R線(546)がHの時、待機系のプ
ロセッサ(41)は現用系のメモリ(32)から読み出す。
A23(642)がH、W/R線(546)がLの時、待機系のプ
ロセッサ(41)は現用系のメモリ(32)に書き込む。
この機能により現用系のプロセッサ(31)は、待機系
のメモリ(42)の読み出しと書き込みが可能になる。同
様に、待機系のプロセッサ(41)は、現用系のメモリ
(32)の読み出しと書き込むが可能になる。
第15図は、系状態レジスタ(534,634)、aliveレジス
タ(535,635)、アクセスレジスタ(536,636)、割込み
レジスタ(537,637の内容を示す図である。これらのレ
ジスタは、8ビツト構成である。
系状態レジスタ(534,634)は、第15図(a)に示す
ように、現用系(30)及び待機系(40)の状態を示すも
のである。
aliveレジスタ(535,635)は、第15図(b)に示す。
現用系(30)は待機系(40)にaliveメッセージを転送
する。現用系(30)が待機系(40)のaliveレジスタ(6
35)に書込み、待機系(40)が一定周期毎にaliveメッ
セージレジスタ(635)をリセットする。待機系(40)
が、現用系(30)で障害が発生したかどうか検出するた
めに使用する。以上を表2に示す。
アクセスレジスタ(536,636)は、第15図(c)に示
す。アクセスレジスタ(536,636)は、現用系(30)が
待機系のメモリ(42)をアクセスしてもよいか、あるい
は、待機系(40)が、現用系のメモリ(32)をアクセス
してもよいかを示す(表3)。
割込みレジスタ(537,637)は、第15図(d)に示
す。詳細を表4に示す。
第16図は、割込みレベルを示す図である。レベル4の
割込みは障害割込み、レベル2の割込みはタイマ割込み
とする。優先順位は、レベル7が一番高く、以下順に低
くなる。
第17図は、タイマ割込みの制御回路を示す図である。
タイマ(530,630)は、クロック(550,650)、aliveメ
ッセージカウンタ(551,651)とチェックポイントカウ
ンタ(552,652)というカウンタを設ける。タイマ割込
み(192)は、一定周期毎に常に割込むものと一定時間
経過すると割込むものに分けられる。
一定時間経過すると割込むものは、クロック(550,65
0)が、10m秒毎にカウンタを(+1)する。1秒経過し
て割込むものは、カウンタ値が100になれば、プロセッ
サ(31,41)に割込みを発生させる。
一定周期毎に常に割込むものは、一定周期毎にプロセ
ッサ(31,41)に割込みを発生させる。
第18図は、ソフトウェアの処理概要を示す図である。
割込み(190)はタイマ割込み(192)と障害割込み(19
3)がある。障害割込み(193)は、割込みレベル4で実
行する。タイマ割込み(192)は、割込みレベル2で実
行する。
障害割込み(193)で起動するプログラムは、回復処
理(197)である。
タイマ割込み(192)で起動するプログラムは、alive
メッセージの送信処理(194)、aliveメッセージの受信
確認処理(195)及びチェックポイントの監視処理(19
6)である。
まず、現用系(30)のソフトウェアの処理概要は以下
の通りである。現用系(30)は割込み(190)を受信す
る。現用系(30)は、タイマ割込みであるので、割込み
レベルを2とし、割込み種別を解析する(191)、タイ
マ割込み(192)の場合、aliveメッセージの送信処理
(194)かチェックポイントの監視処理(195)かを判定
する。aliveメッセージの送信処理(194)あるいはチェ
ックポイントの監視処理(196)を実行する。これらの
処理が終了すると、割込みレベルを0とする。
現用系(30)は、トランザクション処理(198)内
で、チェックポイントデータ(70)を待機系(40)に転
送する。
次に、待機系(40)のソフトウェアの処理概要を以下
に示す。まず、割込み(190)を受信する。タイマ割込
み(192)か障害割込み(193)かを解析する(191)。
障害割込み(193)の場合、割込みレベルを4とす
る。待機系(40)は、チェックポイントデータ(70)を
参照して、現用系(30)のトランザクション処理(19
8)を再開する。これらの処理が終了すると、割込みレ
ベルを0とする。
タイマ割込み(192)の場合、割込みレベルを2とす
る。aliveメッセージの受信確認処理(195)を実行す
る。この処理が終了すると、割込みレベルを0とする。
aliveメッセージの送信処理(194)とaliveメッセー
ジの受信確認処理(195)は、待機系(40)が現用系(3
0)で障害が発生したかどうか判定するために使用す
る。
aliveメッセージの送信処理(194)は、現用系のプロ
セッサ(31)が1秒周期毎に常に待機系(40)にalive
メッセージ(100)を発行するものである。aliveメッセ
ージ(100)の発行とは、待機系(40)のaliveレジスタ
(635)を0016から0116にすることである。
aliveメッセージの受信確認処理(195)は、待機系の
プロセッサ(41)がaliveメッセージを受信した時に、a
liveメッセージカウンタ(651)を0にする。最後のali
veメッセージを受信して、2秒経過しても次のaliveメ
ッセージを受信しないと、待機系(40)は現用系(30)
で障害発生と判定するものである。
チェックポイントの監視処理(196)は、現用系のプ
ロセッサ(31)が最後のディスクへの書込み処理実行終
了後、1秒以内に最後のディスクへの書込み処理実行を
実行したかどうか判定するために使用する。
第19図は、ディスクへの書込み処理実行後、1秒以内
に次のディスクへの書込み処理が発生したかどうかを示
す図である。本実施例では、ディスクへの書込み処理時
(1,3,5)をチェックポイント(26)とするが、一定時
間以内(本実施例では、1秒以内)にディスクへの書込
み処理が発生しなければ、最新のチェックポイントから
障害発生までの時間が長くなり、しいては停止時間(2
0)が長くなる。そのため最新の、ディスクへの書込み
処理(1,3,5)終了後、1秒以内に次のディスクへの書
込み処理が発生しないと、最新のディスクへの書込み処
理から1秒経過時点をチェックポイント(26)とする。
第19図より、最新のディスクへの書込み処理終了後、
1秒経過したかどうかを示す。まず、ディスクへの書込
み処理を実行する(処理900)。さらに、ディスクから
の読み出し処理を実行し、チェックポイントデータを待
機系のメモリに書き込む(処理901)。さらに、ディス
クの書込み処理を実行し、チェックポイントデータ(7
0)を待機系のメモリ(42)に書き込む(処理902)。
第20図は、チェックポイント監視処理の詳細フローチ
ャート図である。チェックポイント監視処理(196)を
用いて、(処理900)と(処理902)が1秒以内かどうか
を以下のように実現する。
第20図(a)より、現用系のプロセッサ(31)は、デ
ィスクへの書込み処理時に、チェックポイントカウンタ
(552)を0にする(処理910)。
第20図(b)より、クロック(550)が、10m秒毎にカ
ウンタを(+1)する(処理911)。チェックポイント
カウンタ(552)を参照し(処理912)、チェックポイン
トカウンタ(552)が100未満ならば、1秒以内にディス
クへの書込み処理が発生したと判定し(処理912)、チ
ェックポイントカウンタ(552)が100以上になれば、1
秒以内にディスクへの書込み処理が発生しなかったと判
定する(処理913)。
以下、最新のディスクへの書込み処理(1,3,5)後、
1秒以内に次のディスクへの書込み処理が発生する場合
をケースIとし、1秒経過しても次のディスクへの書込
み処理が発生しない場合をケースIIとする。
第21図はケースIのチェックポイントデータの取得処
理の概要図である。第21図を用いてケースIのチェック
ポイントデータの取得処理を説明する。
現用系のプロセッサ(31)は、ディスクへの書込み処
理(1,3,5)と同期して、チェックポイントデータ(7
0)を待機系のメモリ(42)に書き込む。チェックポイ
ントデータ(70)は、タスク制御情報(72)、ファイル
制御情報(73)、I/O制御情報(74)、及び回線制御情
報(75)である(処理1000,1001)。(処理1000)と
(処理1001)は同一の内容である。
第22図は、(処理1000)の詳細フローチャート図であ
る。(処理1000)の詳細を以下に示す。
まず、現用系のプロセッサ(31)は待機系の系状態レ
ジスタ(634)を読み出す。系状態レジスタ(634)が00
16ならば、オフライン状態(82)であるので、チェック
ポイントデータ(70)は転送しない(処理1011)。
系状態レジスタ(634)が0116ならば、待機状態(8
1)であるので、以下の処理を実行する。
アクセスレジスタ(636)を読み出し、現用系(30)
は待機系(40)のメモリ(42)がアクセス可能となるま
で、待つ(処理1012)。
待機系(40)のメモリ(42)がアクセス可能となれ
ば、68000の内容レジスタのARO(510)とDRO(500)の
値を現用系のメモリ(32)にセーブする(処理1013)。
ARO(510)にチェックポイントデータ(70)の先頭ア
ドレスを、DRO(500)にチェックポイントデータ(70)
のデータ長を設定する(処理1014)。
現用系のプロセッサ(31)は、チェックポイントデー
タ(70)を待機系のメモリ(42)に1バイト書き込む
(処理1015)。
現用系のプロセッサ(31)は、チェックポイントデー
タ(70)をすべて待機系のメモリ(42)に書き込んだか
判定する(処理1016)。
チェックポイントデータ(70)をすべて待機系のメモ
リ(42)に書き込めば、現用系のメモリ(32)から6800
0の内部レジスタのARO(510)とDRO(500)の値をリカ
バリする(処理1017)。
DR0−DR7(500−507)、AR0−AR6(510−516)、AR7
(520),SR(521),PC(522)を待機系のメモリ(42)
に格納する(処理1018)。
現用系のプロセッサ(31)は、IOP(33)に対して、
ディスクへの書込み指示を出す(処理1019)。
現用系のプロセッサ(31)は、チェックポイントカウ
ンタ(552)を0にする。(処理1020)。
第23図は、ディスクへの書込み処理の詳細フローチャ
ート図である。第24図はディスクへの書込みデータの内
容を示す図である。ディスクへの書込みデータは、ディ
スクへの書込み先の先頭アドレス(110)、データ長(1
11)及びデータ本体(112)で構成する。
第23図と第24図を用いて、ディスクへの書込み処理を
説明する。
まず、現用系のプロセッサ(31)は、68000の内部レ
ジスタのAR0(510)とAR1(511)とDRO(500)の値を現
用系のメモリ(32)にセーブする(処理1030)。
現用系のプロセッサ(31)は、AR0(510)にディスク
への書込みデータの先頭アドレスを、AR1(511)にIOP
のバッファのアドレスをDRO(500)にディスクへの書込
みデータのデータ長を設定する(処理1031)。
現用系のプロセッサ(31)は、ディスクへの書込みデ
ータを現用系のメモリ(32)からIOPのバッファ(571)
に転送する(処理1032)。
現用系のプロセッサ(31)は、IOPに割込みを通知す
る(処理1033)。
現用系のメモリ(32)からAR0(510)、AR1(511)と
DRO(500)の値をリカバリする(処理1034)。
一方、IOP(36)は、現用系のプロセッサ(31)から
の割込みを受信し、IOPのバッファ(571)を参照して、
ディスク(51,52)に書き込む(処理1040)。
第25図は、ケースIの回復処理の概要図である。ケー
スIの回復処理の概要を以下を示す。まず、現用系(3
0)で障害が発生する(7)。
第26図と第27図を用いて、待機系(40)が現用系(3
0)の障害を検出する方式を説明する。
第26図は、aliveメッセージの送信処理の詳細フロー
チャート図である。aliveメッセージの送信処理は1秒
毎にに起動し、aliveメッセージレジスタを0016から01
16にする(処理1055)。
第27図は、aliveメッセージの受信確認処理の詳細フ
ローチャート図である。aliveメッセージの受信確認処
理は、待機系(40)は、aliveメッセージの受信する
と、aliveメッセージカウンタを0とする(処理105
6)。aliveメッセージの受信確認処理は、10m秒のタイ
マ割込みにより、aliveメッセージカウンタを(+1)
する(処理1057)。aliveメッセージカウンタが200以上
ならば、現用系(30)で障害が発生したと判定する(処
理1059)。
第25図に戻り、障害回復処理を説明を続ける。
待機系(40)は、(処理1055〜1059)のaliveメッセ
ージの送信処理(194)とaliveメッセージの受信確認処
理(195)により、障害を検出する(処理1049)。
待機系のプロセッサ(42)は、割込みレベルを4にす
る(処理1050)。
待機系(40)は、現用系(30)をオフライン状態(8
2)にする(処理1051)。そして、待機系(40)を現用
状態(80)にする(処理1052)。さらに、待機系(40)
は、ディスクへの書込み処理から再開する(処理105
3)。
第28図は、(処理1051)の詳細フローチャート図であ
る。(処理1051)は、現用系(30)の系状態レジスタ
(534)を0316から0016に遷移することにより、現用系
(30)をオフライン状態(82)にする(処理1060)。
第29図は、(処理1052)の詳細フローチャート図であ
る。(処理1052)は、待機系(40)の系状態レジスタ
(634)を0116から0316に遷移することにより、待機系
(40)を現用状態(80)にする(処理1061)。
第30図は、(処理1053)の詳細フローチャート図であ
る。
(処理1053)は、待機系のメモリに格納されているDR
0−DR7(500−507)、AR0−AR6(510−516)、AR7(52
0),SR(521),PC(522)を待機系のフロセッサ(41)
に設定する。SR(521)を設定すれば、割込みレベルは
0となる(処理1070)。DR0−DR7(500−507),AR0−AR
6(510−516),AR7(520),SR(521),PC(522)の値
は、(処理1018)の値であり、ディスクへの書込み処理
実行の直前の値である。
待機系のプロセッサ(41)は、RTE命令により、ディ
スクへの書込み処理から再開する(処理1071)。
第31図はケースIIのチェックポイントデータの転送処
理の概要図である。第28図を用いて、ケースIIのチェッ
クポイントデータ(70)の転送処理を説明する。ケース
IIは、最新のディスクへの書込み処理(1,3,5)後、1
秒経過しても次のディスクへの書込み処理が発生しない
場合である。
現用系(30)は、タイマ割込み(192)によりチェッ
クポイント監視処理(196)を起動し、1秒経過しても
次のディスクへの書込み処理が発生しないので、チェッ
クポイント監視処理(196)は、チェックポイントデー
タ(70)を待機系のメモリ(42)に転送する。チェック
ポイントデータ(70)は、ケースIと同様にタスク制御
情報(72)、ファイル制御情報(73)、I/O制御情報(7
4)、及び回線制御情報(75)である。現用系のプロセ
ッサ(31)は、チェックポイントデータ(70)を待機系
のメモリ(42)に書き込む(処理1080,1081)。
第32図は、(処理1080)の詳細フローチャート図であ
る。(処理1080)の詳細フローチャートを以下に示す。
まず、現用系のプロセッサ(31)が待機系の系状態レジ
スタ(634)を読み出す。系状態レジスタ(634)が0016
ならば、オフライン状態(82)であるので、チェックポ
イントデータ(70)は転送しない(処理1091)。
系状態レジスタ(634)が0116ならば、待機状態(8
1)であるので、以下の処理を実行する。
アクセスレジスタ(636)を読み出し、現用系(30)
はアクセス可能となるまで、待つ(処理1092)。
送信可能となれば、68000の内部レジスタのARO(51
0)とDRO(500)の値を現用系のメモリ(32)をセーブ
する(処理1093)。
ARO(510)にチェックポイントデータ(70)の先頭ア
ドレスを、DRO(500)にチェックポイントデータ(70)
のデータ長を設定する(処理1094)。
現用系のプロセッサ(31)は、チェックポイントデー
タ(70)を待機系のメモリ(42)に書き込む(処理109
5)。
現用系のプロセッサ(31)は、現用系のメモリ(32)
から68000の内部レジスタのARO(510)とDRO(500)の
値をリカバリする(処理1097)。
DR0−DR7(500−507),AR0−AR6(510−516)。AR7
(520),SR(521),PC(522)を待機系のメモリ(42)
に格納する(処理1098)。
現用系のプロセッサ(31)は、チェックポイントカウ
ンタ(552)を0にする。(処理1099)。
第33図は、ケースIIの回復処理の概要図である。ケー
スIIの回復処理の概要を以下に示す。まず、現用系(3
0)で障害が発生する(7)。待機系(40)は、aliveメ
ッセージの受信確認処理(195)により、障害を検出す
る(処理1109)。待機系のプロセッサ(42)は、割込み
レベルを4にする(処理1110)。待機系(40)は、現用
系(30)をオフライン状態(82)にする(処理1111)。
そして、待機系(40)を現用状態(80)にする(処理11
12)。さらに、待機系(40)は、最新のチェックポイン
トから再開する(処理1113)。(処理1111)は、(処理
1051)と同じように、現用系(30)が系状態レジスタ
(534)を0316から0016に遷移することにより、現用系
(30)をオフライン状態(82)にする。(処理1112)
は、(処理1052)と同じように、待機系(40)の系状態
レジスタ(634)を0116から0316に遷移することによ
り、待機系(40)を現用状態(80)にする(処理106
1)。
第34図は、(処理1113)の詳細フローチャート図であ
る。(処理1113)は、待機系のメモリに格納されている
DR0−DR7(500−570),AR0−AR6(510−516),AR7(52
0),SR(521),PC(522)を待機系のプロセッサ(41)
に設定する(処理1120)。
DR0−DR7(500−507),AR0−AR6(510−516),AR7(5
20),SR(521),PC(522)の値は、(処理1018)の値で
あり、チェックポイント時の値である。
待機系のプロセッサ(41)は、RTE命令により、チェ
ックポイントから再開する(処理1121)。
第9図は、停止時間(20)とオーバヘッド(25)の評
価結果を示す図である。本発明によるホットスタンバイ
システムの停止時間(20)とオーバヘッド(25)を定量
的に評価する。
まず、停止時間(20)を算出する。停止時間(20)
は、最新のチェックポイントから障害発生までの時間T
(c〜f)(21)、障害検出時間T(d)(22)及び障
害回復時間T(r)(23)の和である。
最新のチェックポイントから障害発生までの時間T
(c〜f)(21)は、ケースIの場合はI/O発行時間の
間隔でありI/Oの発行頻度が10回/秒であるので、T
(c〜f)(21)は100m秒となり、ケースIIの場合はチ
ェックポイント監視処理の起動周期であるT(c〜f)
(21)は1秒となる。最新チェックポイントから障害発
生までの時間T(c〜f)(21)は、100m秒から1秒で
ある。
障害検出方式は、汎用大型機あるいは電子交換機と同
様に、aliveメッセージ(100)を受信し、2秒以内に次
のaliveメッセージ(100)を受信しない障害発生と判定
するため、障害検出時間T(d)は2秒である。
本発明では、ジャーナル(76)を参照しファイルを回
復させる処理がないため、障害回復時間T(r)(23)
は、0秒である。
次に、オーバヘッド(25)を以下条件で算出する。オ
ーバヘッド(25)は、現用系(30)がチェックポイント
データ(70)を待機系のメモリ(42)に転送する処理で
ある。
チェックポイントデータ量 …10kB I/O発行間隔 …100m秒 バスの転送スピード …20MB/秒 とすれば、 この結果、本発明の停止時間(20)は2〜3秒程度、
オーバヘッド(25)は5%となり、停止時間の短縮とオ
ーバヘッドの削減を満たすことが可能となる。
〔発明の効果〕
本発明によれば、障害時のシステムの停止時間を短縮
させること及びオーバヘッドを削減させることが可能に
なる。
【図面の簡単な説明】
第1図は本発明によるチェックポイントデータの取得方
式と回復手順を示す図、第2図はホットスタンバイシス
テムのハードウェア構成図、第3図は汎用大型計算機、
電子交換機及び本発明によるホットスタンバイシステム
の回復方式とその特徴を示す図、第4図は汎用大型機の
チェックポイントデータの取得とジャーナルの取得方式
を示す図、第5図は汎用大型機のチェックポイントデー
タの取得と回復処理手順を示す図、第6図は電子交換機
の両系書込み命令を示す図、第7図は停止時間を示す
図、第8図は障害検出方式を示す図、第9図は汎用大型
計算機、電子交換機及び本発明によるホットスタンバイ
システムの停止時間とオーバヘッドを示す図、第10図は
本発明によるホットスタンバイシステムのチェックポイ
ントデータの取得を示す図、第11図は系の状態と状態遷
移を示す図、第12図は第1図は装置に用いるプロセッ
サ,メモリ,IOP,バスエクステンダの詳細回路図、第13
図は現用系と待機系のメモリマップを示す図、第14図は
バスエクステンダの詳細図、第15図は系状態レジスタ、
aliveレジスタ,通信レジスタ,割込みレジスタの内容
を示す図、第16図は割込みレベルを示す図、第17図はタ
イマ割込みの制御回路を示す図、第18図はソフトウェア
の処理概要を示す図、第19図はディスクへの書込み処理
実行後、1秒以内に次のディスクへの書込み処理が発生
したかどうかを示す図、第20図はチェックポイント監視
処理の詳細のフローチャート、第21図はケースIのチェ
ックポイントデータの取得処理の概要図、第22図は処理
1000の詳細フローチャート図、第23図はディスクの書込
み処理を示す図、第24図はディスクへの書込みデータの
内容を示す図、第25図はケースIの回復処理の概要図、
第26図はaliveメッセージの送信処理の詳細フローチャ
ート図、第27図はaliveメッセージの受信確認処理の詳
細フローチャート図、第28図は処理1051の詳細フローチ
ャート図、第29図は処理1052の詳細フローチャート図、
第30図は処理1053の詳細フローチャート図、第31図はケ
ースIIのチェックポイントデータの取得処理の概要図、
第32図は処理1080の詳細フローチャート図、第33図はケ
ースIIの回復処理の概要図、第34図は処理1113の詳細フ
ローチャート図である。 1,3,5……ディスクの書込み処理、7……障害発生、11
……チェックポイントデータの転送周期、12……チェッ
クポイントデータの転送処理(汎用大型機)、13……両
系書込み命令、14……チェックポイントデータの転送処
理(本発明)、20……停止時間:T、21……最新のチェッ
クポイントから障害発生までの時間T:(c−f)、22…
…障害検出時間:T(d)、23……障害回復時間:T
(r)、24……aliveメッセージの受信確認周期:T(ac_
p)、25……オーバヘッド:O、26……チェックポイン
ト、27……現用系の障害検出時点、28……チェックポイ
ント時点に回復時点、30……現用系、40……待機系、3
1,41……プロセッサ、32,42……メモリ、33,43……IO
P、34,44……回線制御装置、35,45……ディスク制御装
置、36,46……バスエクステンダ、50……回線、51,52…
…ディスク、53……回線切替装置、55……バス、60〜63
……端末、70……チェックポイントデータ、72……タス
ク制御情報、73……ファイル制御情報、74……I/O制御
情報、75……回線制御情報、76……ジャーナル、100…
…aliveメッセージ、110……ディスクへの書込み先の先
頭アドレス、111……データ長、112……データ本体、19
0……割込み、191……割込み種別の解析、192……タイ
マ割込み、193……障害割込み、194……aliveメッセー
ジの送信処理、195……aliveメッセージの受信確認処
理、196……チェックポイント監視処理、197……回復処
理、198……トランザクション処理、500,600……データ
レジスタ:DR0、501,601……データレジスタ:DR1、502,6
02……データレジスタ:DR2、503,603……データレジス
タ:DR3、504,604……データレジスタ:DR4、505,605……
データレジスタ:DR5、506,606……データレジスタ:DR
6、507,607……データレジスタ:DR7、510,610……アド
レスレジスタ:AR0、511,611……アドレスレジスタ:AR
1、512,612……アドレスレジスタ:AR2、513,613……ア
ドレスレジスタ:AR3、514,614……アドレスレジスタ:AR
4、515,615……アドレスレジスタ:AR5、516,616……ア
ドレスレジスタ:AR6、520,620……スタックポインタ:AR
7、521,621……ステータレジスタ:SR、522,622……プロ
グラムカウンタ:PC、530,630……タイマ、531,631……
アドレスデコーダ、532,632……割込みエンコーダ、53
3,633……双方向ドライバ、534,634……系状態レジス
タ、535,635……aliveレジスタ、536,636……通信レジ
スタ、537,637……割込みレジスタ、540,640……データ
線:D0〜D7、541,641……アドレス線:A1〜A22、542,642
……アドレス線:A23、543,643……割込み線:IPL0、544,
644……割込み線:IPL1、545,645……割込み線:IPL2、54
6,646……W/R線、550,650……クロツク、551,651……al
iveカウンタ、552,652……チェックポイントカウンタ、
553,653……データ双方向ドライバ、554,654……アドレ
ス双方向ドライバ、555,655……双方向ドライバの制御
信号、570,670……IOPのプロセッサ、571,671……IOPの
バッフア、572,672……IOPのROM、573,673……IOPのRA
M、580……本発明によるホットスタンバイシステムのメ
モリアップ、581……現用系のメモリマップ、681……待
機系のメモリマップ、582,682……ハードレジスタ領域,
583,683……OS領域、584,684……チェックポイントデー
タの領域、585,685……プログラム領域、586,686……リ
ザーブ領域。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 真矢 讓 神奈川県川崎市麻生区王禅寺1099番地 株式会社日立製作所システム開発研究所 内 (72)発明者 木下 俊之 神奈川県川崎市麻生区王禅寺1099番地 株式会社日立製作所システム開発研究所 内 (72)発明者 森岡 紀夫 東京都千代田区内神田2丁目14番6号 日立電子サービス株式会社内 (72)発明者 督永 嘉紀 東京都千代田区内神田2丁目14番6号 日立電子サービス株式会社内 (72)発明者 常世田 博之 東京都千代田区内神田2丁目14番6号 日立電子サービス株式会社内 (72)発明者 吉野 勇夫 神奈川県秦野市堀山下1番地 株式会社 日立製作所神奈川工場内 (72)発明者 大賀 健 神奈川県秦野市堀山下1番地 株式会社 日立製作所神奈川工場内 (72)発明者 竹村 敏 神奈川県秦野市名古木1469番地 株式会 社日立コンピユータエレクトロニクス内 (72)発明者 山下 芳明 神奈川県秦野市堀山下1番地 株式会社 日立製作所神奈川工場内 (56)参考文献 特開 平2−165344(JP,A) 特開 平4−167028(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 11/20 G06F 11/14 G06F 15/177

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】現用系と待機系からなるホットスタンバイ
    システムにより構成される電子計算機の系切り替え方法
    であって、 前記現用系は、前記待機系へ処理を引き継ぐために必要
    な情報として、タスク制御情報、ファイル制御情報、I/
    O制御情報及び回線制御情報を含むチェックポイントデ
    ータを、前記現用系のディスクへの書き込み処理と同期
    して、前記待機系のメモリに転送し、 前記現用系に障害が発生すると、前記待機系は、前記待
    機系のメモリに格納されている前記チェックポイントデ
    ータを参照して、前記現用系による前記現用系のディス
    クへの最新の書き込み処理から前記現用系により行われ
    ていた処理を再開することを特徴とする二重化システム
    の系切り替え方法。
  2. 【請求項2】現用系と待機系からなるホットスタンバイ
    システムにより構成される電子計算機の系切り替え方法
    であって、 二重送信を許容する通信手段を用い、前記現用系は、前
    記待機系へ処理を引き継ぐために必要な情報として、タ
    スク制御情報、ファイル制御情報、I/O制御情報及び回
    線制御情報を含むチェックポイントデータを、前記現用
    系のメッセージ送信処理と同期して、前記待機系のメモ
    リに転送し、 前記現用系で障害が発生すると、前記待機系は、前記待
    機系のメモリに格納されている前記チェックポイントデ
    ータを参照して、前記現用系による最新のメッセージ送
    信処理から前記現用系により行われていた処理を再開す
    ることを特徴とする二重化システムの系切り替え方法。
  3. 【請求項3】特許請求の範囲第1項または第2項記載の
    二重化システムの系切り替え方法において、 所定時間内にディスクへの書き込み処理及びメッセージ
    送信処理の少なくとも一方がなければ、最新のディスク
    への書き込み処理及びメッセージの送信処理の少なくと
    も一方の終了後、所定時間経過時をチェックポイントと
    し、 前記現用系が前記チェックポイント時に前記チェックポ
    イントデータを前記待機系のメモリに転送し、 前記現用系で障害が発生すると、前記待機系は、前記待
    機系のメモリに格納されている前記チェックポイントデ
    ータを参照し、最新のチェックポイントから前記現用系
    により行われていた処理を再開することを特徴とする二
    重化システムの系切り替え方法。
JP2181462A 1990-07-11 1990-07-11 二重化システムの系切り替え方法 Expired - Fee Related JP3026350B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2181462A JP3026350B2 (ja) 1990-07-11 1990-07-11 二重化システムの系切り替え方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2181462A JP3026350B2 (ja) 1990-07-11 1990-07-11 二重化システムの系切り替え方法

Publications (2)

Publication Number Publication Date
JPH0469740A JPH0469740A (ja) 1992-03-04
JP3026350B2 true JP3026350B2 (ja) 2000-03-27

Family

ID=16101182

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2181462A Expired - Fee Related JP3026350B2 (ja) 1990-07-11 1990-07-11 二重化システムの系切り替え方法

Country Status (1)

Country Link
JP (1) JP3026350B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6475593B1 (en) 2000-02-03 2002-11-05 Eidai Kako Co., Ltd. Floor mat

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101143684B1 (ko) * 2007-04-20 2012-05-09 인터내셔널 비지네스 머신즈 코포레이션 어댑터 카드 장애극복 장치, 시스템 및 방법
JP5342578B2 (ja) * 2011-02-25 2013-11-13 日本電信電話株式会社 呼制御システムおよび呼制御に利用する情報の冗長化方法
JP5342612B2 (ja) * 2011-08-08 2013-11-13 日本電信電話株式会社 呼制御システムおよび呼制御に利用する情報の冗長化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6475593B1 (en) 2000-02-03 2002-11-05 Eidai Kako Co., Ltd. Floor mat

Also Published As

Publication number Publication date
JPH0469740A (ja) 1992-03-04

Similar Documents

Publication Publication Date Title
JP3120033B2 (ja) 分散メモリ型マルチプロセッサシステム及び故障回復方法
KR100247875B1 (ko) 멀티프로세서시스템
JP2916420B2 (ja) チェックポイント処理加速装置およびデータ処理方法
US5121486A (en) Network control system for dynamically switching a logical connection between an identified terminal device and an indicated processing unit
CA2335709C (en) Synchronization of processors in a fault tolerant multi-processor system
EP0750259B1 (en) Computer system with two phase checkpoints
US20060150010A1 (en) Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
JPS638835A (ja) 障害回復方法
CN109582502A (zh) 存储系统故障处理方法、装置、设备及可读存储介质
DE3735828A1 (de) Verfahren und vorrichtung fuer eine anweisungs-wiederanlaufverarbeitung in einer mikroprogramm-gesteuerten datenverarbeitungsvorrichtung
US5146569A (en) System for storing restart address of microprogram, determining the validity, and using valid restart address to resume execution upon removal of suspension
JP3026350B2 (ja) 二重化システムの系切り替え方法
JP2953639B2 (ja) バックアップ装置及びその方法
JP3447347B2 (ja) 障害検出方法
US5829030A (en) System for performing cache flush transactions from interconnected processor modules to paired memory modules
JP2772052B2 (ja) 資源情報引き継ぎ処理方法
US20050097208A1 (en) Node removal using remote back-up system memory
JP2002108640A (ja) デュープレックスシステム、シングルプロセッサシステム、及びサブボード
JPH10187616A (ja) 状態記録再現方法、ならびに同方法を実現する計算機システム、及び同方法がプログラムされ記憶されるメモリ装置
JP2879480B2 (ja) 冗長計算機システムの同期外れ時の切替方式
JPH04360242A (ja) 二重化システムの系切替装置およびその方法
JPH05225135A (ja) 端末無中断オンラインシステム
JP3185446B2 (ja) 計算機システム
JP2002244885A (ja) コンピュータシステム監視システム
JP3340284B2 (ja) 冗長システム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees