JPH0469740A

JPH0469740A - 二重化システムの系切り替え方法

Info

Publication number: JPH0469740A
Application number: JP2181462A
Authority: JP
Inventors: Yuzuru Maya; 讓真矢; Toshiyuki Kinoshita; 俊之木下; Norio Morioka; 森岡　紀夫; Yoshinori Tokunaga; 督永　嘉紀; Hiroyuki Tokiyoda; 常世田　博之; Isao Yoshino; 吉野　勇夫; Takeshi Oga; 大賀　健; Satoshi Takemura; 竹村　敏; Yoshiaki Yamashita; 山下　芳明
Original assignee: Hitachi Computer Electronics Co Ltd; Hitachi Ltd; Hitachi Electronics Services Co Ltd
Current assignee: Hitachi Computer Electronics Co Ltd; Hitachi Ltd; Hitachi Electronics Services Co Ltd
Priority date: 1990-07-11
Filing date: 1990-07-11
Publication date: 1992-03-04
Anticipated expiration: 2015-03-27
Also published as: JP3026350B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、ホラ１ヘスタンバイシステムに係わり、特に
障害時の停止時間の短縮させることオーバヘッドを削減
させることに関する。

〔従来の技術〕

第２図はホットスタンバイシステムのハードウェア構成
図である。汎用大型計算機や電子交換機では、従来から
処理の連続性を重視するため、現用系と待機系からなる
ホットスタンバイシステムで構成していた。ホラｌ−ス
タンバイシステムは、第２図に示すように、現用系と待
機系はそれぞれ、プロセッサ、メモリ、バスエクステン
ダ、ＩＯＰ。

回線制御装置、ディスク制御装置で構成することにより
、現用系あるいは待機系は単独で処理可能である。

以下、汎用大型計算機と電子交換機のホラｌヘスタンバ
イシステムのチェックポイントデータの取得方式と障害
からの回復方式を説明する。

従来の汎用大型計算機の回復方式は、オンラインシステ
ムのソフトウェア（産業図書　大野豊著１）、１４７〜
Ｐ　、　ｉ、　５３　）に記載されている。

第４図は汎用大型計算機のチェックポイントデータの取
得とジャーナルの取得方式を示す図である。第５図は汎
用大型計算機のチェックポイントデータの取得と回復手
順を示す図である。汎用大型計算機のチェックポイント
ータータの取得方式は、第３図、第４図、第５図に示す
ように、現用系が一定周期（チエツクポインＩ−）毎に
、タスク制御情報、ファイル制御情報、Ｉ／Ｏ制御情報
及び回線制御情報をチエツクポイン１−データと定義し
て、待機系のメモリに転送していた。また、障害時にフ
ァイルを回復できるように、現用系のプロセラすはディ
スクへの書込み処理毎に、ジャーナルをディスクに書き
込んでいた。

現用系で障害が発生すると、待機系は、ディスクに格納
されているジャーナルを参照して、ファイルを障害時の
状態に回復し、再開処理を行っていた。

その結果、汎用大型計算機では、ディスクに格納してい
るジャーナルを参照してファイルを回復しなければなら
ず、ファイルの回復時間が長くなり、障害時のシステム
の停止時間が長くなるという問題があった。

第６図は電子交換機の両系＠：込み命令を示す図である
。従来の電子交換機の回復方式では、日経エレクトロニ
クス（１，９８８，２，２０Ｐ、３２５〜Ｐ、３２９）
に記載されている。電子交換機の回復方式は、第３図と
第６図に示すように、現用系の書き込み命令が現用系と
待機系のメモリに同時に書き込むこと（両系書込み命令
を使用すること）により、現用系と待機系のメモリの内
容を常に同一・にしていた。

現用系で障害が発生すると、待機系は待機系のメモリを
参照して、処理を継続する。

その結果、電子交換機ではチエツクポインＩ−を設定す
る必要はなく、チェックポイントデータとジャーナルは
不要である。現用系の両系書込み命令は、現用系と待機
系の両方のメモリに同時に書き込む両系書込み命令とな
るため、書込み命令の実行時間が長くなり、正常運転中
のオーバヘッドが大きくなるという問題があった。

〔発明が解決しようとする課題〕

汎用大型計算機と電子交換機のホラＩ・スタンバイシス
テムの停止時間とオーバヘッドを定量的に評価し、課題
を明確にする。

（１）停止時間第７図は、停止時間を示す図である。停止時間は第７図
に示すように、最新のチェックポイントから障害発生ま
での時間、障害検出時間及び障害回復時間の和である。

Ｔ＝Ｔ（ｃ〜ｆ）＋Ｔ（ｄ）＋Ｔ（ｒ）Ｔ：停止時間Ｔ（ｃ〜ｆ）：最新のチエツクポインｌ−から障害発生
までの時間Ｔ　（ｄ　）　：障害検出時間Ｔ（ｒ）：障害回復時間（ａ）　最新のチェックポイントから障害発生までの時
間（ｊ）汎用大型計算機一定周期でチェックポイントデータを転送しているので
、Ｔ（ｃ−ｆ）はチェックポイントデータの転送周期に
なり、５秒程度である。

（ｉｉ）電子交換機両系のメモリの内容が同一であり、待機状態のメモリを
参照して処理を再開するためチェックポイントに戻らな
いため、Ｔ（ｃ”ｆ）はほとんど０である。

（ｂ）障害検出時間第８図は障害検出方式を示す図である。障害検出方式は
、以下のように汎用大型計算機と電子交換機で同じ方式
である。

現用系はａｌｉｖｅメツセージを待機系に転送する。待
機系はａｌｊ、ｖｅメツセージを受信する。

待機系は、次のａｌｉｖｅメツセージが一定時間（ａ］
−ｊｖｅメツセージ受信の確認周期：Ｔ（ａ　ｃ、、−
ｐ）　）以内に受信するかどうかチエツクする。現用系
で障害が発生し、ａｌｉｖｅメツセージが待機系に転送
できない。待機系は一定時間（ａｌｊｖｅメツセージ受
信の確認周期：Ｔ（ａｃｐ））経過しても、ａｌｊ−ｖ
ａメツセージを受信しない。現用系に障害が発生したと
判定する。

障害検出時間は、汎用大型計算機と電子交換機ともに、
ａｌｊｖｅメツセージ受信の確認周期（Ｔ（ａ　ｃ、ｐ
）　）となり、２秒程度である。

（ｃ）障害回復時間（ｉ）汎用大型計算機ジャーナルを参照しファイルを回復するので、ファイル
の回復時間は３０秒とし、Ｔ（ｒ）は３０秒程度である
。

（ｉｉ）電子交換機両系のメモリの内容が同一である。待機状態のメモリを
参照して処理を再開するためチェックポイントに戻らず
、待機状態のメモリを参照して再開するので、Ｔ（ｒ）
はほとんどＯである。

（ｄ）停止時間の合計汎用大型計算機と電子交換機の停止時間の合計を算出す
る。

（ｊ）汎用大型計算機停止時間はジャーナルを参照しファイルを回復する時間
に依存し、停止時間は３７秒程度となる。

（ｉｉ）電子交換機障害の検出時間となり、２秒程度である。

（２）オーバヘッドオーバヘッドは、以下に示すように単体システム力らホ
ットスタンバイシステムに移動する場合に低下する処理
能力の割合を示す。

Ｒ（ｓＪＲ（ｓ）：単一システムの処理能力Ｒ（ｈ）：ホットスタンバイシステムの処理能力（ａ）汎用大型計算機汎用大型計算機では、チェックポイントデータを現用系
から待機系の送る処理がオーバヘッドとなる。

オーバヘッドは以下の条件で算出する。

チェックポイントータータ量：　／Ｏ０ｋＢ転送スピー
ド：　ＩＭＢ／秒オーバヘッドは２％である。

（ｂ）電子交換機電子交換機では、両系のメモリに書き込む処理がオーバ
ヘッドとなる。両系のメモリへの書込み命令の実行時間
は、通常の書込み命令の実行時間の２倍とする。

オーバヘッドは以下の条件で算出する。

Ｗ：単体システムの書込み命令の実行時２×Ｗ：ホット
スタンバイシステムの書込み命令の実行時間Ｒ：非書込み命令の実行時間書込み命令の比率：３０％非書込み命令の比率＝７０％オーバヘッドは３０％になる。

第９図は、停止時間とオーバヘッドを示す図である。第
９図より、汎用大型計算機のホットスタンバイシステム
は、オーバヘッドを小さいが、停止時間は４０秒弱と長
いという問題点があった。

さらに、電子交換機のホットスタンバイシステムは、停
止時間が２秒と短いが、オーバヘッドが３０％と大きい
という問題点があった。

本発明の目的は、現用系に障害が発生した場合、待機系
に切り替えるまでのシステムの停止時間を短縮させるこ
とである。

本発明の他の目的は、現用系が正常運転中にバツクアッ
プ処理に要するオーバヘッドを削減させることである。

〔課題を解決するための手段〕

現用系と待機系はそれぞれ、プロセッサ、メモリ、バス
エクステンダ、　工ＯＰ、回線制御装置。

ディスク制御装置で構成することにより、現用系あるい
は待機系は単独で処理可能とする。

現用系はディスクへの書込み処理時間をチェックポイン
トとし、処理を引き継ぐために必要な情報として、タス
ク制御情報、ファイル制御情報。

工／○制御情報及び回線制御情報をチエツクポイン１へ
データとし、現用系はディスクへの書込み処理と同期し
て、チェックポイントデータを待機系のメモリに転送す
る。

現用系で障害が発生すると、待機系は待機系のメモリに
格納されているチェックポイントデータを参照して、デ
ィスクの書込み処理から再開する。

〔作用〕

本発明によるホットスタンバイシステムは、現用系と待
機系で構成する。現用系と待機系は、それぞれ、プロセ
ッサ、メモリ、バスエクステンダ。

ＩＯＰ、ディスク制御装置及び回線制御装置で構成する
ことにより、現用系あるいは待機系は単独で処理可能で
ある。

現用系で障害が発生すると、待機系は現用系の処理を引
き継ぐ。処理の引継ぎのポイントとして、チエツクポイ
ンＩ・を設ける。チェックポイントは、ディスクへの書
込み処理時とメツセージ送信処理時である。

チェックポイントがディスクへの書込み処理時の場合、
チエツクポイン１−データは、タスク制御情報、ファイ
ル制御情報、Ｉ／Ｏ制御情報及び回線制御情報である。

現用系がディスクの書込み処理を実行する毎に、現用系
はチェックポイントデータを待機系のメモリに転送する
。

そのため、チェックポイント間（ディスクへの書込み処
理時間）で、ファイル更新のないことが保証でき、ジャ
ーナルを不要とすることが可能である。また、待機系の
メモリに最新のチェックポイントディスクを格納してい
るため、両系書込み命令は不要になる。

現用系で障害が発生すると、待機系のプロセッサは、チ
ェックポイントデータが格納されている待機系のメモリ
を参照し、最新のディスクへの書込み処理から再開する
。待機系は、現用系の最新のディスクへの書込み処理を
完了しているかどうか判定できない。しかし、待機系は
、現用系と同じ内容のデータをディスクへ書き込むため
、同じ内容のデータを現用系と待機系で２回書き込んで
も、ディスクの内容に矛盾が生じさせることはない。そ
のため、待機系は、ディスクへの書込み処理から再開す
ることにより、現用系の処理を引き継ぐことが可能であ
る。

チェックポイントがメツセージ送信処理の場合、チェッ
クポイントデータは、タスク制御情報、ファイル制御情
報、Ｉ／Ｏ制御情報及び回線制御情報である。現用系は
メツセージ送信処理毎に、チェックポイントデータを待
機系のメモリに転送する。

現用系で障害が発生すると、待機系は、最新のメツセー
ジ送信処理まで戻り、待機系のメモリを参照し、現用系
の処理をメツセージ送信処理から再開する。同一メツセ
ージを２回送信する場合があるが、メツセージの二重送
信を許容すれば（すなわちメツセージの受信側の装置に
前回のメツセージと同じメツセージを受信すると、後者
のメツセージを廃棄する機能を持たせれば）、通信手順
に誤りがないことが保証できる。

また、一定時間経過しても、ディスクへの書込み処理及
びメツセージ送信処理を実行しない場合、一定時間経過
時をチェックポイントとする。チェックポイントデータ
は、タスク制御情報、ファイル制御情報、Ｉ／Ｏ制御情
報及び回線制御情報である。現用系は、チェックポイン
ト時に、チェックポイントデータを待機系のメモリに転
送する。

最新のチェックポイントから現用系で障害は発生するま
で、ディスクへの書込み処理及びメツセージ送信処理が
ないことが保証できる。

その結果、現用系で障害が発生すると、待機系は、チェ
ックポイントまで戻り、待機系のメモリを参照し、現用
系の処理を引き継ぐことが可能である。

このようにして、現用系で障害が発生しても、停止時間
を長くさせるジャーナルの参照及びファイルの回復処理
を不要とすることができ、さらに、両系書込み命令のよ
うな実行時間の長い命令を使うことなく処理を継続させ
ることができる。

この結果、システムの停止時間を短縮させること及びオ
ーバヘットを削減することが可能になる。

〔実施例〕

以下、本発明の一実施例を示す。本発明によるホラ１へ
スタンバイシステムは、現用系（３０）と待機系（４０
）で構成する。現用系（３０）の障害発生に備えて、待
機系（４０）が現用系（３０）の処理を再開するポイン
Ｉ〜として、チエツクポイン１−（２６）を設ける。本
発明では、チェックポイント（２６）は現用系（３０）
のディスクへの書込み処理（１，３，５）とメツセージ
の送信処理であるが、本実施例では、ディスクへの書込
み処理時（１，３，５）で説明する。チェックポイント
データ（７０）は、現用系（３０）がチェックポイント
（２６）と同期して、待機系（４０）に転送するデータ
を定義する。チェックポイントデータ（７０）の内容は
、タスク制御情報（７２）。

ファイル制御情報（７３）、Ｉ／Ｏ制御情報（７４）及
び回線制御情報（７５）である。

待機系（４０）の障害時は、現用系（３０）は、待機系
（４ｏ）をオフライン状態（８２）として、実行すれば
よいため、本実施例では、現用系（３０）の障害のみ説
明する。

現用系（３０）の障害検出は、第８図に示すように、障
害検出時間が最も長くなるａｌｉｖｅメツセージの送受
信方式を前提とする。

第１図は、チェックポイントデータの取得方式と回復手
順を示す図である。本実施例の概要は、第１図に示すよ
うに、現用系（３０）が、ディスクへの書込み処理と同
期して、チェックポイントデータ（７０）を待機系（４
０）に送信する（ステップ　１）。待機系はチェックポ
イントデータ（７０）を受信し、待機系のメモリ（４２
）に書き込む（ステップ　２）。同様に、現用系（３０
）が、ディスクへの書込み処理と同期して、チエツクポ
インｌ−データ（７０）を待機系（４０）に送信する（
ステップ　３）。待機系はチェックポイントデータ（７
０）を受信し、待機系のメモリ（４２）に書き込む（ス
テップ　４）。さらに現用系（３０）が、ディスクへの
書込み処理と同期して、チエツクポイン１−データ（７
０）を待機系（４ｏ）に送信する（ステップ　５）。待
機系はチエツクポイン１ヘデータ（７０）を受信し、待
機系のメモリ（４２）に書き込む（ステップ　６）。

現用系で障害が発生する（ステップ　７）。待機系のプ
ロセッサ（４１）は、待機系のメモリ（４２）からチェ
ックポイントデータ（７ｏ）を読み出しくステップ　６
）、最新のディスクへの書込み処理（ステップ　５）か
ら再開する（ステップ　Ｓ）。

第／Ｏ図は、本発明によるホットスタンバイシステムの
チエツクポインｌ−データ（７ｏ）の取得を示す図であ
る。チェックポイントデータの取得方式は、現用系のプ
ロセッサ（３１）がディスクへの書込み処理時間（ステ
ップ　ｉ、３．５）に、チェックポイントデータ（７０
）として、タスク制御情報（７２）、ファイル制御情報
（７３）、Ｉ／Ｏ制御情報（７４）及び回線制御情報（
７５）をバス（５５）を介して待機系のメモリ（４２）
に書き込む。

本発明では、現用系（３０）が、ディスクへの書込み処
理（ステップ　１，３．５）と同期して、チェックポイ
ントデータ（７０）を待機系（４０）に転送する。その
ため、チェックポイント間（ステップ１とステップ３の
間、及びステップ３とステップ５の間）でディスクへの
書込み処理がなく、ファイルの更新がないことが保証で
きる。その結果、本発明によるホットスタンバイシステ
ムは、第３図に従来技術と比較して示すように、ジャー
ナル（７６）を不要とすることが可能であり、かつ、待
機系のメモリ（４２）に最新のチェックポイントデータ
（７０）を格納しているため、両系書込み命令（１３）
は不要となる。

本発明の特徴は、ジャーナル（７６）による回復処理を
不要とすることにより停止時間（２０）が短縮できると
ころ、及び実行時間の長い両系書込み命令（１，３）を
不要とすることによりオーバヘッド（２５）が削減でき
るところである。

第１１図は、系の状態と状態遷移を示す図である。系（
３０，４，０）の状態は、第１１図に示すように現用状
態（８０）、待機状態（８１）及びオフライン状態（８
２）の３状態を設ける。現用状態（８０）と待機状態（
８１）を合わせて、オンライン状態（８７）という。現
用状態（８０）の系を現用系（３０）、待機状態（８１
）の系を待機系（４０）という。現用状態（８０）は実
際に処理を実行している状態である。待機状態（８１）
は現用状態（８０）の系から処理を引き継ぐためのチェ
ックポイントデータ　（７０）を受信し、直ちに実行中
の処理が引き継げるように休止している状態である。オ
フライン状態（８２）は上記以外で障害や保守によりシ
ステムから切り離されている状態である。

現用状態（８０）で障害が発生すると、現用状１（８０
）の系をオフライン状態（８２）に遷移しく状態遷移　
８３）、待機状態（８１）の系を現用状態（８０）に遷
移する（状態遷移　８４）。

待機状態（８１）で障害が発生すると、待機状態（８１
）の系をオフライン状態（８２）に遷移する（状態遷移
　８５）。障害から回復すると、オフライン状態（８２
）から待機状態（８１）に遷移する（状態遷移　８６）
。

第２図はホットスタンバイシステムのハードウェア構成
図である。本発明によるホットスタンバイシステムは、
第２図に示すように、現用系（３０）　。

待機系（４，０）、バス（５５）、ディスク（５］。

５２）、回線切替装置（５３）、及び端末（６０゜６１
．６２．６３）で構成する。

現用系（３０）はプロセッサ（３１）、メモリ（３２）
　、ＩＯＰ　（３３）、回線制御装置（３４）、ディス
ク制御装置（３５）及びバスエクステンダ（３６）で構
成する。

待機系（４０）はプロセッサ（４１）、メモリ（４２）
　、ＩＯＰ　（４，３）、回線制御装置（４４）、ディ
スク制御装置（４５）及びバスエクステンダ（４６）で
構成する。

ディスク制御装置（３５，４５）は、ディスク（５１，
５２）をアクセスし、ディスク（５］。

５２）への書込みデータと読み出しデータを所有する。

回線制御装置（３４，４４−）は、メツセージの待ち行
列を所有し、端末（６０，６１，６２゜６３）から受信
したメツセージと端末（６０゜６１．６２．６３）へ送
信するメツセージを所有する。

回線切替装置（５３）は、系（３０，４０）で障害が発
生したとき、他の系（４，０，３０）に回線を切り替え
るために使用する。

ディスク（５１，５２）は、ディスク（５１゜５２）障
害時にシステムダウンに至らないように、二重化構成に
し同一の内容を格納する。

第１２図は、第１図の装置に用いるプロセッサ（３１，
４４）、メモリ（３１，４，２）、ＩＯＰ（３３，４３
）、バスエクステンダ（３６，４６）の詳細回路図であ
る。現用系（３０）と待機系（４０）は、同一構成であ
るため、現用系（３０）を中心に記述する。

プロセッサ（３１，４，１）は、６８０００マイクロプ
ロセツサとする。６８０００マイクロプロセツサの内部
レジスタは、データレジスタＤＲＯＤＲ７（５００−５
０７，６００−６０７）、アドレスレジスタＡＲＯ−Ａ
、Ｒ６（５／Ｏ−５１，６゜６／Ｏ−６１６）　、スタ
ックポインタＡＲ７（５２０，６２０）　、ステータス
レジスタ５Ｒ（５２１，６２１）、プログラムカウンタ
ｐｃ（５２２，６２２）で構成する。

６８０００マイクロプロセツサの信号線は、データ線Ｄ
ｏ−Ｄ７　（５４０，６４０）、アドレス線Ａ１〜Ａ２
２　（５４１，６４１）　、アドレス線Ａ、２３　（５
４２，６４２）、割込み線（ＩＰＬＯ〜２）（５４−３
−５４５，６４３−６４，５）で構成する。

アドレス線Ａ２３　（５４２，６４，２）は、現用系の
メモリ（３２）をアクセスするのか待機系のメモリ　（
４２）をアクセスするのかの判定に使用する。

Ｗ／Ｒ線（５４６，６４６）は、ｔＬ　Ｈ７１の時リー
ドサイクル、ｉｔ　Ｌ″′の時ライトサイクルである。

工○Ｐ　（３３，４３）は、プロセッサ（５７０゜６７
０）、バッファ（５７１，６７１）　、Ｒ，ＯＭ（５７
２，６７２）及びＲＡＭ（５７３，６７３）で構成する
。バッファ（５７１，６７１）には、プロセッサ（３１
，４１，）からの転送されるディスクへの書込みデータ
を格納する。

その他、タイマ（５３０，６３０）、アドレスデコーダ
（５３１，６３１，）と割込みエンコーダ（５３２，６
３２）を設ける。

現用系（３０）と待機系（４０）は同一構成である。現
用系（３０）で（５＊＊）のものは、待機系では（６＊
＊）と対応する。例えば、現用系（３０）のタイマ（５
３０）は、待機系（４０）のタイマ（６３０）に対応す
る。

第１３図は、現用系（３０）と待機系（４０）のメモリ
マツプを示す図である。６８０００マイクロプロセツサ
では、メモリ空間（５８０）は１６Ｍバイトである。現
用系（３０）は、前半の８Ｍバイト、アドレス（ＯＯＯ
Ｏｏ０１６〜７　Ｆ　Ｆ　Ｆ　Ｆ　Ｆ１６）を使用し、
待機系（４ｏ）は、後半の８Ｍバイト、アドレス（８０
００００工、〜Ｆ　Ｆ　Ｆ　Ｆ　Ｆ　Ｆ、６）を使用す
る。

現用系のプロセッサ（３１）が現用系のメモリ（３２）
をアクセスするか待機系のメモリ（３１）をアクセスす
るかは、現用系のプロセッサのアドレス線Ａ２３　（５
４２）による。すなわち、現用系のメモリは（３１）は
、前半の８Ｍバイト、アドレス（ＯＯＯＯＯＯ□６〜７
ＦＦＦＦＦ□６）を使用する。現用系のプロセッサのア
ドレス線Ａ２３（５４２）がＬならば、現用系のメモリ
（３２）をアクセスする。待機系（４０）は、後半の８
Ｍバイト、アドレス（８０００００□６〜ＦＦＦＦＦＦ
□、）を使用する。現用系のプロセッサのアドレス線Ａ
２３　（５４２）がＨならば、待機系のメモリ（３２）
をアクセスする。

現用系のメモリマツプ（５８１）は、第１４図に示すよ
うに以下の通りである。

・０〜α ハードレジスタ（５８２）・α〜α十β Ｏ８（５８３）・α十β〜α＋β＋γ チエツクポイン１−データ　（５８４，）・α＋β＋γ
〜α＋β＋γ＋δ プログラム（５８５）・α＋β十γ＋δ〜７ＦＦＦＦＦ□６リザーブ（５８６）待機系のメモリマツプ（６８］、）は、第１４図に示す
ように以下の通りである。

・８０００００１６〜８０００００□６＋αハードレジ
スタ（６８２）・８０００００，６＋α〜８０００００．６＋α＋βＯ
８（６８３）・８０００００１．＋α＋β 〜５ｏｏｏｏｏ、６＋α＋β＋γ チエツクポイン１ヘデータ（６８４）・５ｏｏｏｏｏ、、＋α＋β＋γ 〜８０ｏＯｏＯ□６＋α＋β＋γ＋δ プログラム（６８５）・５ｏｏｏｏｏ□６＋α＋β＋γ十δ 〜Ｆ　Ｆ　Ｆ　Ｆ　Ｆ　Ｆｌ。

リザーブ（６８６）この結果、現用系メモリ（３２）と待機系メモリ（４２
）のアドレスの最上位ピッＩ・を除いて、チェックポイ
ントデータ（７０）を同じアドレスに格納することがで
きる。

第１４図は、バスエクステンダ（３６，４，６）の詳細
図である。バスエクステンダ（３６，４，６）は、現用
系のプロセッサ（３１）が待機系のメモリ（４２）をア
クセスできるようにし、現用系のメモリ　（３２）の内
容を待機系のメモリ（４２）に転送できるようにする。

そのために、バスエクステンダ（３６，４，６）には、
系状態レジスタ（５３４，６３４）　、ａｌｉｖｅ　レ
ジスタ　（５３５゜６３５）、アクセスレジスタ（５３
６，６３６）割込みレジスタ（５３７，６３７）及び双
方向ドライバ（５３３，６３３）を設ける。双方向ドラ
イバの制御信号（５５５，６５５）を設ける。

現用系（３０）の双方向ドライバの制御信号（５５５）
は、以下のように、現用系のプロセッサ（３１）のアド
レス線Ａ２３　（５４２）とＷ／Ｒ線（５４，６）の値
による。

アドレス線Ａ２３　（５４２）がり、Ｗ／Ｒ線（５４，
６）がＨの時、現用系のプロセッサ（３１）は待機系の
メモリ（４２）から読み出す。

アドレス線Ａ２３（５４，２）がり、Ｗ／Ｒ線（５４６
）がＬの時、現用系のプロセッサ（３１）は待機系のメ
モリ　（４２）に書き込む。

待機系（４０）の双方向ドライバの制御信号（６５５）
は、以■のように、待機系のプロセッサ（４１）のアド
レス線Ａ２３（６４２）とＷＺＲ線（６４６）の値によ
る。

Ａ２３　（６４２）がＨ，Ｗ／Ｒ線（５４６）がＨの時
、待機系のプロセッサ（４１）は現用系のメモリ（３２
）から読み出す。

Ａ２３　（６４２）がＨ，Ｗ／Ｒ線（５４６）がＬの時
、待機系のプロセッサ（４１）は現用系のメモリ　（３
２）に書き込む。

この機能により、現用系のプロセッサ（３１）は、待機
系のメモリ（４２）の読み出しと書き込みが可能になる
。同様に、待機系のプロセッサ（４１）は、現用系のメ
モリ（３２）の読み出しと書き込むが可能になる。

第１５図は、系状態レジスタ（５３４，，６３４，）、
ａ　］ｊ−ｖ　ｅレジスタ（５３５，６３５）、アクセ
スレジスタ（５３６，６３６）、割込みレジスタ（５３
７，６３７）の内容を示す図である。これらのレジスタ
は、８ピツＩ〜構成である。

系状態レジスタ（５３４，６３４）は、第１５図（ａ）
に示すように、現用系（３０）及び待機系（４０）の状
態を示すものである。

表　　　１ａｌｉｖｅレジスタ（５３５，６３５）は、第１−５図
（ｂ）に示す。現用系（３０）は待機系（４０）にａｌ
ｉｖｅメツセージを転送する。現用系（３０）が待機系
（４０）のａＨｖｅ　レジスタ（６３５）に書込み、待
機系（４ｏ）が一定周期毎にａ］ｉｖｅメツセージレジ
スタ（６３５）をリセットする。待機系（４０）が、現
用系（３０）で障害が発生したかどうか検出するために
使用する。以上を表２に示す。

表表アクセスレジスタ（５３６，６３６）は、第１５図（Ｃ
）に示す。アクセスレジスタ（５３６。

６３６）は、現用系（３０）が待機系のメモリ（４２）
をアクセスしてもよいか、あるいは、待機系（４０）が
、現用系のメモリ（３２）をアクセスしてもよいかを示
す（表３）。

表　　　３割込みレジスタ（５３７，６３７）は、第１，５図（ｄ
）に示す。詳細を表４に示す。

第１−６図は、割込みレベルを示す図である。レベル４
の割込みは障害割込み、レベル２の割込みはタイマ割込
みとする。優先順位は、レベル７が一番高く、以下類に
低くなる。

第１７図は、タイマ割込みの制御回路を示す図である。

タイマ（５３０，６３０）は、クロック（５５０，６５
０）　、ａｌｉｖｅメツセージカウンタ（５５１，６５
１）とチェックポイントカウンタ（５５２，６５２）と
いうカウンタを設ける。タイマ割込み（１９２）は、一
定周期毎に常に割込むものと一定時間経過すると割込む
ものに分けられる。

一定時間経過すると割込むものは、クロック（５５０，
６５０）が、／Ｏｍ秒毎にカウンタを（＋１）する。１
秒経過して割込むものは、カウンタ値が／Ｏ０になれば
、プロセッサ（３１゜４１）に割込みを発生させる。

一定周期毎に常に割込むものは、一定周期毎にプロセッ
サ（３１，４，１）に割込みを発生させる。

第１８図は、ソフトウェアの処理概要を示す図である。

割込み（１９０）はタイマ割込み（１９２）と障害割込
み（１９３）がある。障害割込み（１９３）は、割込み
レベル４で実行する。タイマ割込み（１９２）は、割込
みレベル２で実行する。

障害割込み（１９３）で起動するプログラムは、回復処
理（１，９７）である。

タイマ割込み（１９２）で起動するプログラムは、ａｌ
ｉｖｅメツセージの送信処理（１９４，）、ａｌｉｖｅ
メツセージの受信確認処理（］−９５）及びチェックポ
イントの監視処理（１９６）である。

まず、現用系（３０）のソフトウェアの処理概要を以下
の通りである。現用系（３０）は割込み（１９０）を受
信する。現用系（３０）は、タイマ割込みであるので、
割込みレベルを２とし、割込み種別を解析する（１９１
）、タイマ割込み（１９２）の場合、ａｌｉｖｅメツセ
ージの送信処理（１９４）かチェックポイントの監視処
理（１，９５）かを判定する。ａｌｉｖｅメツセージの
送信処理（１９４）あるいはチェックポイントの監視処
理（１９５）を実行する。これらの処理が終了すると、
割込みレベルをＯとする。

現用系（３０）は、Ｉ・ランザクジョン処理（１９８）
内で、チェックポイントデータ（７０）を待機系（４０
）に転送する。

次に、待機系（４０）のソフトウェアの処理概要を以下
に示す。まず、割込み（１９０）を受信する。タイマ割
込み（１９２）か障害割込み（１９３）かを解析する（
１９１）。

障害割込み（１９３）の場合、割込みレベルを４とする
。待機系（４０）は、チェックポイントデータ（７０）
を参照して、現用系（３０）のトランザクション処理（
１９８）を再開する。これらの処理が終了すると、割込
みレベルを○とする。

タイマ割込み（１９２）の場合、割込みレベルを２とす
る。ａｌｉｖｅメツセージの受信確認処理（１９５）を
実行する。この処理が終了すると、割込みレベルをＯと
する。

ａｌｉｖｅメツセージの送信処理（１９４−）とａｌｉ
ｖｅメツセージの受信確認処理（１９５）は、待機系（
４０）が現用系（３０）で障害が発生したかどうか判定
するために使用する。

ａｌｉｖｅメツセージの送信処理（１９４，）は、現用
系のプロセッサ（３１）が１秒周期毎に常に待機系（４
０）にａＨｖｅメツセージ（１，００）を発行するもの
である。ａｌｉｖｅメツセージ（／Ｏ０）の発行とは、
待機系（４０）のａｌｊｖｅ　レジスタ（６３５）を０
０□６から０１１６にすることである。

ａｌ、ｉｖｅメツセージの受信確認処理（１９５）は、
待機系のプロセッサ（４１）が、ａｌｉｖｅメツセージ
を受信した時に、ａＨｖｅメツセージカウンタ（６５１
）を０にする。最後のａｌｊｖｅメツセージを受信して
、２秒経過しても次のａｌｊｖｅメツセージを受信しな
いと、待機系（４ｏ）は現用系（３ｏ）で障害発生と判
定するものである。

チェックポイントの監視処理（１９６）は、現用系のプ
ロセッサ（３１）が、最後のディスクへの書込み処理実
行終了後、］２秒以外に最後のディスクへの書込み処理
実行を実行したかどうか判定するために使用する。

第１９図は、ディスクへの書込み処理実行後、１秒以内
に次のディスクへの書込み処理が発生しく３６）たかどうかを示す図である。本実施例では、ディスクへ
の書込み処理時（１，３，５）をチェックポイント（２
６）するが、一定時間以内（本実施例では、１秒以内）
にディスクへの書込み処理が発生しなければ、最新のチ
ェックポイントから障害発生までの時間が長くなり、し
いては停止時間（２０）が長くなる。そのため最新の、
ディスクへの書込み処理（１，，３，５）終了後、１秒
以内に次のディスクへの書込み処理が発生しないと、最
新のディスクへの書込み処理から１秒経過時点をチエツ
クポイン１−（２６）とする。

第１９図より、最新のディスクへの書込み処理終了後、
１秒経過したかどうかを示す。まず、ディスクへの書込
み処理を実行する（処理　９００）。

さらに、ディスクからの読み出し処理を実行し、チェッ
クポイントデータを待機系のメモリに書き込む（処理　
９０１）。さらに、ディスクの書込み処理を実行し、チ
ェックポイントデータ（７ｏ）を待機系のメモリ　（４
２）に書き込む（処理９０２）。

第２０図は、チェックポイント監視処理の詳細フローチ
ャーＩ−図である。チェックポイント監視処理（１９６
）を用いて、（処理　９００）と（処理　９０２）が１
秒以内かどうかを以下のように実現する。

第２０図（ａ）より、現用系のプロセッサ（３１）は、
ディスクへの書込み処理時に、チエツクポインｌ−カウ
ンタ（５５２）を０にする（処理９／Ｏ）。

第２０図（ｂ）より、クロック（５５０）が、／Ｏｍ秒
毎にカウンタを（＋１）する（処理９１１）。チェック
ポイントカウンタ（５５２）を参照しく処理　９１２）
、チェックポイントカウンタ（５５２）が／Ｏ０未満な
らば、１秒以内にディスクへの書込み処理が発生したと
判定しく処理　９１２）、チェックポイントカウンタ（
５５２）が１，００以上になれば、１秒以内にディスク
への書込み処理が発生しなかったと判定する（処理　９
１３）。

以下、最新のディスクへの書込み処理（１，３゜５）後
、１秒以内に次のディスクへの書込み処理が発生する場
合をケース■とし、１秒経過しても次のディスクへの書
込み処理が発生しない場合をケース■とする。

第２１図はケースＩのチェックポイントータータの取得
処理の概要図である。第２１−図を用いて、ケース■の
チェックポイントデータの取得処理を説明する。

現用系のプロセッサ（３１）は、ディスクへの書込み処
理（１，３，５）と同期して、チェックポイントデータ
　（７０）を待機系のメモリ（４２）に書き込む。チェ
ックポイントデータ（７０）は、タスク制御情報（７２
）、ファイル制御情報（７３）、ファイル制御情報（７
４）　、Ｉ／Ｏ制御情報（７５）及び回線制御情報（７
６）である（処理　／Ｏ００゜／Ｏ０１）。（処理　１
ｏＯＯ）と（処理　／Ｏ０１）は、同一の内容である。

第２２図は、（処理　／Ｏ００）の詳細フローチャート
図である。（処理　／Ｏ００）の詳細を以下に示す。

まず、現用系のプロセッサ（３１）は待機系の系状態レ
ジスタ（６３４）を読み出す。系状態レジスタ（６３４
，）が００．、ならば、オフライン状態（８２）である
ので、チェックポイントデータ（７０）は転送しない（
処理　／Ｏ１１）。

系状態レジスタ（６３４，）が０１１６ならば、待機状
態（８１）であるので、以下の処理を実行する。

アクセスレジスタ（６３６）を読み出し、現用系（３０
）は待機系（４０）のメモリ（４２）がアクセス可能と
なるまで、待つ（処理　／Ｏ１．２）。

待機系（４０）のメモリ　（４２）がアクセス可能とな
れば、６８０００の内容レジスタのＡＲＯ（５／Ｏ）と
ＤＲＯ（５００）の値を現用系のメモリ（３２）にセー
ブする（処理　／Ｏ１３）。

ＡＲＯ（５／Ｏ）にチェックポイントデータ（７０）の
先頭アドレスを、ＤＲＯ（５００）にチェックポイント
データ（７０）のデータ長を設定する（処理　　／Ｏ１
４）　　。

現用系のプロセッサ（３１）は、チェックポイントデー
タ（７０）を待機系のメモリ（４２）に１、バイト書き
込む（処理　／Ｏ１５）。

現用系のプロセッサ（３１）は、チェックポイントデー
タ（７０）をすべて待機系のメモリ（４２）に書き込ん
だか判定する（処理　／Ｏ１．６）。

チェックポイントデータ（７０）をすべて待機系のメモ
リ（４２）に書き込めば、現用系のメモリ（３２）から
６８０００の内部レジスタのＡＲＯ（５／Ｏ）とＤＲＯ
（５００）の値をリカバリする（処理　／Ｏ１７）。

ＤＲＯ−ＤＲ７（５００−５０７）　、Ａ、ＲＯ−ＡＲ
６（５／Ｏ−５１６）　、ＡＲ７（５２０）。

ＳＲ（５２１）、ＰＣ（５２２）を待機系のメモリ（４
２）に格納する（処理　／Ｏ１８）。

現用系のプロセッサ（３１）は、ｌ０Ｐ（３３）に対し
て、ディスクへの書込み指示を出す（処理／Ｏ１９）。

現用系のプロセッサ（３１）は、チェックポイントカウ
ンタ（５５２）を０にする。（処理／Ｏ２０）。

第２３図は、ディスクへの書込み処理の詳細フローチャ
ー１・図である。第２４図はディスクへの書込みデータ
の内容を示す図である。ディスクへの書込みデータは、
ディスクへの書込み先の先頭アドレス（］、／Ｏ）、デ
ータ長（１１１）及びデータ本体（１，１２）で構成す
る。

第２３図と第２４図を用いて、ディスクへの書込み処理
を説明する。

まず、現用系のプロセッサ（３１）は、６８０００の内
部レジスタのＡＲＯ（５／Ｏ）とＡＲＩ（５１１）とＤ
ＲＯ（５００）の値を現用系のメモリ（３２）をセーブ
する（処理　／Ｏ３０）。

現用系のプロセッサ（３１）は、Ａ　ＲＯ（５１，０）
にディスクへの書込みデータの先頭アドレスを、ＡＲｌ
（５］。１）に■○ＰのバッファのアドレスをＤＲＯ（
５００）にディスクへの書込みデータのデータ長を設定
する（処理　／Ｏ３］、）。

現用系のプロセッサ（３１）は、ディスクへの書込みデ
ータを現用系のメモリ（３２）からＩＯ＋）のバッファ
（５７］、）に転送する（処理　１．０３２　）。

現用系のプロセッサ（３１）は、■○Ｐに割込みを通知
する（処理　／Ｏ３３）。

現用系のメモリ（３２）からＡＲＯ（５１，０）、Ａ、
Ｒ］、　　（５］、、　１）とＤＲＯ（５００）のイ直
をリカバリする（処理　／Ｏ３４．　）。

一方、■○Ｐ（３６）は、現用系のプロセッサ（３１）
からの割込みを受信し、■○Ｐのバッファ　（５７１）
を参照して、ディスク（５１，，５２）に書き込む（処
理　／Ｏ４−０）。

第２５図は、ケースＩの回復処理の概要図である。ケー
スＩの回復処理の概要を以下に示す。まず、現用系（３
０）で障害が発生する（７）。

第２６図と第２７図を用いて、待機系（４０）が現用系
（３０）の障害を検出する方式を説明する。

第２６図は、ａｌｉｖｅメツセージの送信処理の詳細フ
ローチャー１−図である。ａｌｉｖｅメツセージの送信
処理は１秒毎に起動し、ａｌｊｖｅメツセージレジスタ
をｏＯｌ、から０１１．Ｉｃすル（処理／Ｏ５６）。

第２７図は、ａｌｉｖｅメツセージの受信確認処理の詳
細フローチャート図である。ａｌｉｖｅメッセージの受
信確認処理は、待機系（４０）は、ａｌｉｖｅメツセー
ジの受信すると、ａ　Ｈｖｅメツセージカウンタを○と
する（処理　１−０５６）。ａｌｉｖｅメツセージの受
信確認処理は、／Ｏｒｎ秒のタイマ割込みにより、ａｌ
ｉｖｅメツセージカウンタを（＋１）する（処理　／Ｏ
５８）　。ａｌｉｖｅメツセージカウンタが２００以」
二ならば、現用系（３０）で障害が発生したと判定する
（処理　／Ｏ５９　）。

第２５図に戻り、障害回復処理を説明を続ける。

待機系（４０）は、（処理　／Ｏ５５〜／Ｏ５９）のａ
ｌ、ｊｖｅメツセージの送信処理（１９４）とａｌｉｖ
ｅメツセージの受信確認処理（１９５）により、障害を
検出する（処理　／Ｏ４９）。

待機系のプロセッサ（４２）は、割込みレベルを４にす
る（処理　／Ｏ５０）。

待機系（４０）は、現用系（３０）をオフライン状態（
８２）にする（処理　／Ｏ５１）。そして、待機系（４
０）を現用状態（８０）にする（処理　１．０５２　）
。さらに、待機系（４０）は、ディスクへの書込み処理
から再開する（処理／Ｏ５３）　　。

第２８図は、（処理　／Ｏ５１）の詳細フローチャート
図である。（処理　／Ｏ５１）は、現用系（３０）の系
状態レジスタ（５３４，）を０３１゜からＯＯ□６に遷
移することにより、現用系（３０）をオフライン状態（
８２）にする（処理　／Ｏ６０）。

第２９図は、（処理　／Ｏ５２）の詳細フローチャート
図である。（処理　／Ｏ５２）は、待機系（４０）の系
状態レジスタ（６３４，）を０］−０６から０３１６に
遷移することにより、待機系（４０）を現用状態（８０
）にする（処理　／Ｏ６１）。

第３０図は、（処理　／Ｏ５３）の詳細フローチャート
図である。

（処理　／Ｏ５３　）は、待機系のメモリに格納されて
いるＤＲＯ−ＤＲ７（５００−５０７）、ＡＲ，０−Ａ
Ｒ６（５／Ｏ−５１６）　、　ＡＲ７（５２０）、５Ｒ
（５２１）、ＰＣ（５２２）を待機系のフロセッサ（４
１）に設定する。５Ｒ（５２１）を設定すれば、割込み
レベルは０となる（処理　／Ｏ７０）　。ＤＲＯ−ＤＲ
７（５００−５０７）、ＡＲＯ−ＡＲ６（５／Ｏ−５１
６）。

Ａ、Ｒ７（５２０）、５Ｒ（５２１）、ＰＣ（５２２）
の値は、（処理　／Ｏ１８）の値であり、ディスクへの
書込み処理実行の直前の値である。

待機系のプロセッサ（４１）は、ＲＴＥ命令により、デ
ィスクへの書込み処理から再開する（処理　　／Ｏ７１
）　　。

第３１図はケース■のチェックポイントデータの転送処
理の概要図である。第２８図を用いて、ケース■のチェ
ックポイントデータ（７０）の転送処理を説明する。ケ
ース■は、最新のディスクへの書込み処理（１，３，５
）後、１秒経過しても次のディスクへの書込み処理が発
生しない場合である。

現用系（３０）は、タイマ割込み（１９２）によりチェ
ックポイント監視処理（１９６）を起動し、１秒経過し
ても次のディスクへの書込み処理が発生しないので、チ
ェックポイント監視処理（１９６）は、チェックポイン
トデータ　（７０）を待機系のメモリ（４２）に転送す
る。チェックポイントデータ　（７０）は、ケースＩと
同様にタスク制御情報（７２）、ファイル制御情報（７
３）、ファイル制御情報（７４）、Ｉ／○制御情報（７
５）及び回線制御情報（７６）である。現用系のプロセ
ッサ（３１）は、チェックポイントデータ（７０）を待
機系のメモリ（４２）に書き込む（処理／Ｏ８０．／Ｏ
８１）。

第３２図は、（処理　／Ｏ８０）　　の詳細フローチャ
ート図である。（処理　／Ｏ８０）の詳細フローチャー
トを以下に示す。まず、現用系のプロセッサ（３１）が
待機系の系状態レジスタ（６３４）を読み出す。系状態
レジスタ（６３４）が００□６ならば、オフライン状態
（８２）であるので、チェックポイントデータ（７０）
は転送しない（処理　　／Ｏ９１）　　。

系状態レジスタ（６３４）が０１１６ならば、待機状態
（８１）であるので、以下の処理を実行する。

アクセスレジスタ　（６３６）を読み出し、現用系（３
０）はアクセス可能となるまで、待つ（処理　　／Ｏ９
２）　　。

送信可能となれば、６８０００の内部レジスタのＡＲＯ
（５／Ｏ）とＤＲＯ（５００）の値を現用系のメモリ（
３２）をセーブする（処理　１．０９３　）。

ＡＲＯ（５／Ｏ）にチェックポイントデータ（７０）の
先頭アドレスを、ＤＲＯ（５００）にチェックポイント
データ（７０）のデータ長を設定する（処理　／Ｏ９４
）。

現用系のプロセッサ（３１）は、チェックポイントデー
タ（７０）を待機系のメモリ（４２）に書き込む（処理
　］、、　Ｏ９５）。

現用系のプロセッサ（３１）は、現用系のメモリ（３２
）から６８０００の内部レジスタのＡ、ＲＯ（５／Ｏ）
とＤＲＯ（５００）の値をリカバリする（処理　／Ｏ９
７）。

ＤＲＯ−ＤＲ７（５００−５０７）、ＡＲＯハＲ，６（
５／Ｏ−５１６）。ＡＲ７（５２０）。

ＳＲ（５２１）、ＰＣ（５２２）を待機系のメモリ（４
２）に格納する（処理　／Ｏ９８）。

現用系のプロセッサ（３１）は、チェックボイントカウ
ンタ（５５２）をＯにする。（処理／Ｏ９９）。

第３０図は、ケースＨの回復処理の概要図である。ケー
ス■の回復処理の概要を以下に示す。まず、現用系（３
０）で障害が発生する（７）。待機系（４ｏ）は、ａｌ
ｉｖｅメツセージの受信確認処理（１９５）により、障
害を検出する（処理１、ｔ０９）。待機系のプロセッサ
（４２）は、割込みレベルを４にする（処理　１　］−
１−０）。待機系（４０）は、現用系（３０）をオフラ
イン状態（８２）にする（処理　１１１１）。そして、
待機系（４０）を現用状態（８０）にする（処理１１１
２）。さらに、待機系（４０）は、最新のチェックポイ
ントから再開する（処理　１．１１３）。

（処理　１１１１．）は、（処理　／Ｏ５１）と同じよ
うに、現用系（３０）が系状態レジスタ（５３４）を０
３１．からＯＯ工、に遷移することにより、現用系（３
０）をオフライン状態（８２）にする。（処理　１１１
２）は、（処理　／Ｏ５２）と同じように、待機系（４
０）の系状態レジスタ（６３４）を０１１６から０３□
６に遷移することにより、待機系（４０）を現用状態（
８０）にする（処理　／Ｏ６１）。

第３４図は、（処理　１１１３）の詳細フローチャート
図である。（処理　１１１．３）は、待機系のメモリに
格納されているＤ　ＲＯ−１）　Ｒ７（５００−５７０
）、ＡＲＯ−ＡＲ６（５／Ｏ−５１６）、ＡＲ７（５２
０）、ＳＲ（５２１）。

ＰＣ（５２２）を待機系のプロセッサ（４１）に設定す
る（処理　１１２０）。

ＤＲＯ−ＤＲ７（５００−５０７）、ＡＲＯ−ＡＲ６（
５／Ｏ−５１６）、ＡＲ７（５２０）。

ＳＲ（５２１）、ＰＣ（５２２）の値は、（処理／Ｏ１
８）の値であり、チェックポイント時の値である。

待機系のプロセッサ（４１）は、Ｒ，Ｔ　Ｅ命令により
、チェックポイントから再開する（処理１１２１）。

第９図は、停止時間（２０）とオーバヘア１〜（２５）
の評価結果を示す図である。本発明によるホットスタン
バイシステムの停止時間（２０）とオーバヘッド（２５
）を定量的に評価する。

まず、停止時間（２０）を算出する。停止時間（２ｏ）
は、最新のチエツクポインＩ・から障害発生までの時間
Ｔ（ｃ−ｆ）（２１）　、障害検出時間Ｔ（ｄ）（２２
）及び障害回復時間Ｔ（ｒ）（２３）の和である。

最新のチェックポイントから障害発生までの時間Ｔ（ｃ
”ｆ）（２２）は、ケース■の場合はＩ／Ｏ発行時間の
間隔であり■／○の発行頻度が／Ｏ回／秒であるので、
Ｔ（ｃ〜ｆ）（２１）は／Ｏ０ｍ秒となり、ケースＨの
場合はチエツクポイン１一監視処理の起動周期であるＴ
（ｃ”ｆ）（２１）は１秒となる。最新チエツクポイン
１へから障害発生までの時間Ｔ（ｃ”ｆ）（２１）は、
／Ｏ０ｍ秒から１−秒である。

障害検出方式は、汎用大型機あるいは電子交換機と同様
に、ａｌｊｖｅメツセージ（／Ｏ０）を受信し、２秒以
内に次のａｌｉνｅメツセージ（１−００）を受信しな
い障害発生と判定するため、障害検出時間Ｔ（ｄ）は２
秒である。

本発明では、ジャーナル（７６）を参照しファイルを回
復させる処理がないため、障害回復時間Ｔ（ｒ）（２３
）は、０秒である。

次に、オーバヘッド（２５）を以下条件で算出する。オ
ーバヘッド（２５）は、現用系（３０）がチエツクポイ
ン１へデータ（７０）を待機系のメモリ（４２）に転送
する処理である。

チェックポイントデータ量・・・・・・／Ｏ　ｋ、　Ｂ
Ｉ／Ｏ発行間隔・・・・・・・・・・・・・・・・・・
・・・／Ｏ０ｍ秒バスの転送スピード・・・・・・・・
・・・・・・・２０　Ｍ　Ｂ　／　秒とのれば、＝５（％）この結果、本発明の停止時間（２０）は２〜３秒程度、
オーバヘッド（２５）は５％となり、停止時間の短縮と
オーバヘッドの削減を満たすことが可能となる。

〔発明の効果〕

本発明によれば、障害時のシステムの停止時間を短縮さ
せること及びオーバヘッドを削減させることが可能にな
る。

【図面の簡単な説明】

第１図は本発明によるチェックポイントデータの取得方
式と回復手順を示す図、第２図はホラＩ・スタンバイシ
ステムのハードウェア構成図、第３図は汎用大型計算機
、電子交換機及び本発明によるホットスタンバイシステ
ムの回復方式とその特徴を示す図、第４図は汎用大型機
のチェックポイントデータの取得とジャーナルの取得方
式を示す図、第５図は汎用大型機のチェックポイントデ
ータの取得と回復処理手順を示す図、第６図は電子交換
機の両系書込み命令を示す図、第７図は停止時間を示す
図、第８図は障害検出方式を示す図、第９図は汎用大型
計算機、電子交換機及び本発明によるホットスタンバイ
システムの停止時間とオーバヘッドを示す図、第／Ｏ図
は本発明によるホットスタンバイシステムのチェックポ
イントデータの取得を示す図、第１１図は系の状態と状
態遷移を示す図、第１２図は第１図の装置に用いるプロ
セッサ、メモリ、ＩＯＰ、バスエクステンダの詳細回路
図、第１３図は現用系と待機系のメモリマツプを示す図
、第１４図はバスエクステンダの詳細図、第１５図は系
状態レジスタ、ａｌｉｖｅ　レジスタ、通信レジスタ、
割込みレジスタの内容を示す図、第１６図は割込みレベ
ルを示す図、第１７図はタイマ割込みの制御回路を示す
図、第１８図はソフトウェアの処理概要を示す図、第１
９図はディスクへの書込み処理実行後、１秒以内に次の
ディスクへの書込み処理が発生したかどうかを示す図、
第２０図はチェックポイント監視処理の詳細のフローチ
ャート、第２１−図はケース■のチェックポイントデー
タの取得処理の概要図、第２２図は処理／Ｏ００の詳細
フローチャート図、第２３図はディスクの書込み処理を
示す図、第２４図はディスクへの書込みデータの内容を
示す図、第２５図はケースＩの回復処理の概要図、第２
６図はａｌｉｖｅメツセージの送信処理の詳細フローチ
ャート図、第２７図はａｌｉｖｅメツセージの受信確認
処理の詳細フローチャーＩ・図、第２８図は処理／Ｏ５
１の詳細フローチャーＩ・図、第２９図は処理／Ｏ５２
の詳細フローチャー１−図、第３０　ＥＳ）は処理１−
０５３の詳細フローチャート図、第３１図はケースＨの
チェックポイントータータの取得処理の概要図、第３２
図は処理／Ｏ８０の詳細フローチャート図、第３３図は
ケースＨの回復処理の概要図、第３４図は処理１１１３
の詳細フローチャート図である。１、．３．５・・・ディスクへの書込み処理、７・・障
害発生、］］−・・チェックポイントデータの転送周期
、１．２・・・チェックポイントデータの転送処理（汎
用大型機）、１３・・・両系書込み命令、工４・・・チ
エツタポイントデータの転送処理（本発明）、２０・・
・停止時間二Ｔ、２１・・・最新のチエツクポイン１へ
から障害発生までの時間Ｔ　：　　（ｃ−ｆ）　、２２
・・障害検出時間：Ｔ　（ｄ）　、２３・・・障害回復
時間＝Ｔ（ｒ）、２４・・・ａｌｉｖｅメツセージの受
信確認周期：　Ｔ（ａ　ｃ−ｐ）　、２５−＝オーバヘ
ッド：○、２６・・・チエツクポイン１−１２７・・・
現用系の障害検出時点、２８・・・チェックポイント時
点に回復時点、３０・・・現用系、４０・・・待機系、
３１．４１・・・プロセッサ、３２．４２・・・メモリ
、３３．４３・・・ＩＯＰ、３４．４．４・・・回線制
御装置、３５．４５・・・ディスク制御装置、３６．４
６・・・バスエクステンダ、５０・・・回線、５１．５
２・・・ディスク、５３・・回線切替装置、５５・・・
バス、６０〜６３・・・端末、７０・・・チェックポイ
ントデータ、７２・・・タスク制御情報、７３・・・フ
ァイル制御情報、７４・・・工／Ｏ制御情報、７５・・
・回線制御情報、７６・・・ジャーナル、／Ｏ０・・・
ａｌｉｖｅメツセージ、１／Ｏ・・・ディスクへの書込
み先の先頭アドレス、１１．１・・・データ長、１１２
・・・データ本体、１−９０・・・割込み、」−９１・
割込み種別の解析、１９２・・・タイマ割込み、１９３
・・障害割込み、１９４・・・ａ］ｉｖｅメツセージの
送信処理、１９５・・・ａｌｉｖｅメツセージの受信確
認処理、１９６・・・チェックポイント監視処理、１９
７・・・回復処理、」−９８・・・トランザクション処
理、５００゜６００・・・データレジスタ：　ＤＲＯ１
５０１，６０１データレジスタ：　ＤＲＩ、５０２，６
０２・・・デ−タレジスタ：　ＤＲ２，５０３，６０３
・・・データレジスタ：ＤＲ３，５０４，，６０４・・
データレジスタ：　ＤＲ４，５０５，６０５・・・デー
タレジスタ：ＤＲ５，５０６，６０６・・・データレジ
スタ：ＤＲ６，５０７，６０７・・データレジスタ：　
ＤＲ７，５／Ｏ，６１−○・・・アドレスレジスタ＝Ａ
Ｒ○、５１］、、、６１１・・・アドレスレジスタ：Ａ
Ｒｌ、５ｉ２．６ｉ２・・・アドレスレジスタ：ＡＲ２
，５１３，６１３・・・アドレスレジスタ：　ＡＲ３，
５］、、４．．６１４・・・アドレスレジスタ：　ＡＲ
４，５１５，６１５・・アドレスレジスタ：ＡＲ５゜５
１６．６１６・・・アドレスレジスタ：ＡＲ６，５２０
，６２０・・・スタックポインタ：ＡＲ７゜５２１．６
２１−Ｘデータレジスタ：５Ｒ１５２２゜６２２・・・
プログラムカウンタ：Ｐｃ、５３０゜６３０・・タイマ
、５３１，６３１・・アドレスデコーダ、５３２，６３
２・・割込みエンコーダ、５３３゜６３３・・・双方向
ドライバ、５３４，６３４・・・系状態レジスタ、５３
５　、６３５−ａｌ、ｉｖｅ　レジスタ、５３６．６３
６・・通信レジスタ、５３７，６３７・・割込みレジス
タ、５４０，６４０・・データ線＝Ｄｏ−Ｄ７，５４１
，６４１・・・アドレス線：Ａ」〜Ａ、２２．５４２，
６４２・・・アドレス線：Ａ２３．５４３．６４３・・
・割込み線：ＩＰＬＯ１５４４゜６４４・・・割込み線
：ＩＰＬｌ、５４５，６４５・割込み線：ＩＰＬ２．５
４．６，６４．６・・・Ｗ／Ｒ線、５５０．６５０・・
・クロック、５５１，６５１・・・ａｌｊ、ｖｅカウン
タ、５５２，６５２・・・チェックポイントカウンタ、
５５３，６５３・・・データ双方向ドライバ、５５４，
６５４・・・アｌくレス双方向ドライバ、５５５，６５
５・・・双方向ドライバの制御信号、５７０．６７０・
・・工○Ｐのプロセッサ、５７１゜６７１・・・ＩＯＰ
のバッファ、５７２，６７２・・ＩＯＰのＲＯＭ、５７
３，６７３・・・ＩＯＰのＲＡＭ。５８０・・・本発明によるホットスタンバイシステムの
メモリマツプ、５８１．・・・現用系のメモリマツプ、
６８］−・・・待機系のメモリマツプ、５８２，６８２
・・・ハードレジスタ領域、５８３，６８３・・・ｏｓ
領領域５８４．．６８４・・・チェックポイントデータ
の領域、５８５，６８５・・・プログラム領域、５８６
゜第菊／７図とｒ力２θ 図（幻プ゛ンλ）へｑ＄２．へ２メξ理＼（−１，） ○力つ

Claims

【特許請求の範囲】１、現用系と待機系からなるホットスタンバイシステム
により構成される電子計算機の系切り替え方法であって
、前記現用系は、前記待機系へ処理を引き継ぐために必要
な情報として、タスク制御情報、ファイル制御情報、Ｉ
／Ｏ制御情報及び回線制御情報からなるチェックポイン
トデータを、前記現用系のディスクへの書込み処理と同
期して、前記待機系のメモリに転送し、前記現用系に障害が発生すると、前記待機系のメモリに
格納されている前記チェックポイントデータを参照して
、前記待機系はディスクの書込み処理から再開すること
を特徴とする二重化システムの系切り替え方法。２、現用系と待機系からなるホットスタンバイシステム
により構成される電子計算機の糸切り替え方法であって
、二重送信を許容する通信手順を用い、前記現用系は、前
記待機系へ処理を引き継ぐために必要な情報として、タ
スク制御情報、ファイル制御情報、Ｉ／Ｏ制御情報及び
回線制御情報からなるチェックポイントデータを、前記
現用系のメッセージ送信処理と同期して、前記待機系の
メモリに転送し、前記現用系で障害が発生すると、前記
待機系のメモリに格納されている前記チェックポイント
データを参照して、前記待機系はメッセージ送信処理か
ら再開することを特徴とする二重化システムの系切り替
え方法。３、特許請求の範囲第１項または第２項記載の二重化シ
ステムの系切り替え方法において、所定時間以内にディスクへの書込み処理およびメッセー
ジ送信処理の少なくとも一方がなければ、最新のディス
クへの書込み処理およびメッセージ送信処理の少なくと
も一方の終了後、所定時間経過時をチェックポイントと
し、前記現用系が前記チェックポイント時に前記チェックポ
イントデータを前記待機系のメモリに転送し、前記現用系で障害が発生すると、前記待機系のメモリに
格納されているチェックポイントデータを参照し、チェ
ックポイントから再開することを特徴とする二重化シス
テムの系切り替え方法。