JPS63261437A

JPS63261437A - 複合サブシステム形オンラインシステム

Info

Publication number: JPS63261437A
Application number: JP62095103A
Authority: JP
Inventors: Kazuo Masai; 一夫正井; Satoru Wakayama; 和歌山　哲; Akiji Yamamoto; 山本　章治
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1987-04-20
Filing date: 1987-04-20
Publication date: 1988-10-28
Anticipated expiration: 2011-03-29
Also published as: JPH0833859B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、複合サブシステム形オンラインシステムの障
害回復に係り、特に各サブシステムが同期して立上がる
ことが期待できないオンラインシステムに好適なリラン
方式に関する。

〔従来の技術〕

従来の単独オンラインシステムの障害回復方式は特開昭
５４−１１４１４５号に記載のように、オージットファ
イル（ジャーナルファイル）トチニックポイントファイ
ル（及び、場合によっては、ビフォアルックファイル）
を持ち、障害時に備えて、ジャーナル及びチェックポイ
ント情報を採取しておき、障害発生時点では、障害に応
じてジャーナルとチェックポイント情報を用いて回復を
行っていた。ここで対象とするオンラインシステムは、
１個のデータコミエニケーシ層ン部と１個のデータベー
ス部を持つものに限られていた。

〔発明が解決しようとする問題点〕

上記従来技術は、複合サブシステム形オンラインシステ
ムの障害回復については配慮されておらず、複合サブシ
ステム構成をとると、それぞれのサブシステムが独立に
ジャーナルをとり、相互に無関係に回復することＫなる
。これでは、複数のサブシステム忙またがる業務処理（
トランザクシーン）が発生すると、複数のサブシステム
の情報を同期して回復する必要があるにもかかわらず、
同期しての回復ができないことになる。障害発生サブシ
ステムが立上がってから同期をとってトランザクシーン
の回復を行うことにすれば良いが、障害発生後なかなか
立上がらないサブシステムがあった場合、他のサブシス
テムはいつまでも障害回復の完了しないトランザクシー
ンを残すことＫ　ｆＫる。このため、該トランザクシ會
ンの回復に必要となるジャーナル情報がいつまでも必要
となる。

このまま、オンラインを再開すると、回復できないトラ
ンザクシーンの回復に必要なジャーナルは後から発生す
るジャーナルに埋もれてしまい、障害発生サブシステム
が回復した後、膨大なジャーナルの中に埋もれたジャー
ナル情報を挿すことになる。従って、一部サブシステム
障害発生時にも、全サブシステムの運転を停止させ、全
サブシステム立上げ後、全トランザクシ嘴ンを回復して
からオンラインを開始する必要があるという問題があっ
た。

一部サブシステムが立上がらな（ても、情報更新の同期
情報がわかる様に全サブシステムのジャーナルを一本に
まとめた場合、障害発生サブシステム以外の情報は回復
できるが、今度は、障害発生サブシステムが必要とする
ジャーナルが一本にまとめられたジャーナルの中に埋も
れることになりやはり膨大なジャーナルの中から必要な
ジャーナルを挿すことになってしまうという問題が発生
する。

本発明の目的は、複合サブシステム形のオンラインにお
いて、一部サブシステムに障害が発生した場合、障害発
生サブシステム以外のサブシステムの運転を続行させ、
その後障害サブシステムが立上がってからの回復が容易
にできる様にすることにある。

〔問題点を解決するための手段〕

上記目的は、複合サブシステム形オンラインシステムに
回復時に必要とするジャーナルをトランザクシーンごと
に退避するジャーナル退避ファイルを設け、チェックポ
イント時点ごとＫ、該時点で動作中のトランプクシ１ン
が出力したジャーナルをジャーナル退避ファイルに退避
することにより達成する。

〔作用〕

各々のサブシステムが出力するジャーナルは。

−ケ所のジャーナルファイルにまとめて取得するｄまた
、各ジャーナルは、チェックポイント時点で動作中のト
ランプクシ１ンのために出力したジャーナルであれば、
ジャーナル退避ファイルへ格納する。ジャーナル退避フ
ァイルは、トランザクシ璽ン単位に区割りされており、
トランザクシーンごとのジャーナルに整理して格納され
る。

一部サブシステムが障害となった時には、該サブシステ
ムを使用した全トランザクシーンを回復する必要がある
。障害となったサブシステムを使用したトランザクシ層
ンが必要とするジャーｆ）ｖを得るため、複合サブシス
テム形オンラインシステムのコントローラはチェックポ
イント時点以降のジャーナルを全て読み出し、ジャーナ
ル退避ファイルに必要なジャーナルを追加書きして行く
。

この動作が終了した時点で、回復を必要とする各トラン
ザクシ璽ンが必要とするジャーナルは、全てジャーナル
退避ファイルに集められたことになる。このジャーナル
退避ファイル中の情報を用いて、各トランザクシ膳ンの
回復が行われるが、使用したサブシステムのうち動作中
のサブシステムに関する情報はすぐ回復できるが、立上
がっていないサブシステムの情報は遅れて回復されるこ
とになる。しかし、必要なジャーナルはすべてジャーナ
ル退避ファイルに集められているので、障害サブシステ
ムが遅れて立ち上がっても、その時点ですぐにトランザ
クシーンの回復ができる。

〔実施例〕

以下、本発明の一実施例を第１図から第１８図により説
明する。

第１図は、本発明を実現する複合サブシステム形オンラ
インシステムの全体構成図を示す。

第１図において、複合サブシステム形オンラインシステ
ムは、複数のサブシステムを制御する複合サブシステム
コントローラ１（以下単にコントローラと呼ぶ）と、そ
の配下にある２種類のサブシステム（フロントエンド形
サブシステム２及びバックエンド形サブシステム３）と
、各サブシステムごと及びコントローラ用のりカバリフ
ァイル４（以下単にＲＦと呼ぶ）と、全サブシステムの
ジャーナルを格納するジャーナルファイル５（以下、Ｊ
ＮＬＦと呼ぶ）と、全サブシステムの資源状態を管理す
る資鍾管理テーブル６と、トランザクションを管理する
トランザクション管理テーブル７と、システムの状態を
管理するシステムステータステーブル８と、システムス
テータステーブルの外部記憶装置上の複写として存在す
るシステムステータスファイル９（以下、５ＹＳＳＦと
呼ぶ）から成る。

フロントエンド形サブシステム（以下ＦＥと呼ぶ）は、
オンライン端末１０を有し、業務処理の単位であるトラ
ンザクションを発生させる。パックエンド形サブシステ
ム３（以下、ＢＥと呼ぶ）は、・データベース１１を有
し、ＦＥ２０発生させたトランザクションによる要求に
従ってデータベース１１をアクセスする。

分散データベースシステムは、他プロセツサからのデー
タベースアクセス要求を受け、自プロセッサ内にトラン
ザクションを発生させて行うＦＥの役割（以下分散サー
バと呼ぶ）と、トランザクションからの他プロセツサの
データベースアクセス要１求を受付けるＢＥの役割（以
下分散クライアントと呼ぶ）を合わせて持つサブシステ
ムとして位置づけられる。従って、複合サブシステム形
オンラインシステムの一部に分散データベースＹ考える
ことも可能である。

第２図に、リカバリファイル４の構成を示す。

ＲＦ４は、サブシステム毎とコントローラ１用が存在し
サブシステム又はシステム全体が障害となった際の回復
用情報を格納する外部記憶の総称であり、チェックポイ
ントダンプな格納するチェックポイントファイル４１０
と、テーブル回復に使用するテーブルリカバリファイル
４２０と、トランザクション単位のジャーナルを退避す
るためのトランザクションリカバリファイル４３０から
成る。以下、チェックポイントファイルなＣＫＰＴＦと
呼び、テーブルリカバリファイルをＴＢＬＲＦと呼び、
トランザクシｌンリカバリファイルをＴＲＲＦと呼ぶ。

第３図に資源管理テーブル６の構成を示す。資源管理テ
ーブル６は、各ＦＥ２ごとにキューイングされたトラン
ザクションノード６１０と、各ＢＥ３ごとにキューイン
グされた資源ノード６２０と、トランザクションと資源
の排他保持または待ち状態を示す資源排他ノード６３０
から成る。

トランザクションノード６１０は、トランザクションＩ
Ｄを格納しであるトランザクションＩＤ部６１１と次の
トランザクシランノードへのリンク６１２と資源排他ノ
ードへのリンク６１３から成る。資源ノード６２０は、
資源名の格納しである資源名部６２１と。

資源排他ノードへのリンク６２２と次の資源ノードへの
リンク６２３から成る。資源排他ノード６３０は、資源
名部６３１と同一資源に対して待ちをなしている次の資
源排他ノードへのリンク６３２と同一トランザクション
が保持又は、待っている次の資源に対する資源排他ノー
ドへのリンク６３３とトランザクションＩＤ部６３４と
、該資源排他ノード情報がジャーナルとして取得されて
いるか否かを示すフラグ６３５と、該資源排他ノード情
報は、資源を保持しているのか待っているのかを示すフ
ラグ６３６から成る。

あるトランプクシ１ンＴＲ，が資源Ｒ８Ｉを保持してい
る場合、ＴＲ１とＲ２Ｈに対応するトランサクシ１ンノ
ード６１０と資源ノード６２０からリンク６１３とリン
ク６２２　Ｋて結合される資源排他ノード６３０が存在
し、排他保持か待ちかを示すフラグ６３６がオンになる
。さらに、該資源Ｒ８，を待つトランザクションＴＲ２
が存在する場合、ＴＲ，とＲ８１とリンクされている資
源排他ノードから次の資源排他ノードへのリンク６３２
が作成され、ＴＲ２との間にもリンク６１３が作成され
る。ＴＲ２からリンクされる資源排他ノードでは、排他
保持か待ちを示すフラグ６３６がオフとなる。該資源管
理テーブル６を用いると、リンク６３２　、６３３９ｔ
たどることにより特定のトランザクシーンの保持する資
源一覧、又は特定の資源を保持しているトランサクシ１
フ名が得られる。各排他ノード中には、ジャーナル上に
排他ノード情報が退避されたか否かを示すフラグ６３５
を持つ。

資源管理テーブル６が、サブシステムを通してコントロ
ーラ１上に一本化されているので、サブ１システムダウ
ン時は、排他情報が保持できるだけでなく、サブシステ
ムをまたがったデッドロックの検出が容易となっている
。

第４図にトランザクション管理テーブル７の構成を示す
。トランザクション管理テーブルには、各ＦＥ２がある
時点で発生している全トランザクシ曹ンが登録される。

該テーブルには、トランザクシーンＩ　Ｄ　７０１（該
テーブルのエントリ番号７０１１と同一エントリを使用
するたびにカウントアツプする通番７０１２から成る）
と、発生ＦＥ領領域０２と、使用ＢＥ領領域０３と、ト
ランザクシ曹ンステータス領域７１０ト、゛トランザク
ションの回復に必要となるジャーナルへのジャーナルポ
インタ７２０と、ジャーナルを格納するＴＲＲＦ４３０
の最終ポインタ７３０と、資源管理テーブルの排他ノー
ド６３０へのポインタ７４０から成るエントリがトラン
ザクション単位に存在する。トランザクシ■ンステータ
ス領域７１０には、チェックポイントダンプ取得時の同
期用ピットすなわち影響ピット７１１と実行監視ピット
７１２及び、。

トランザクションの凍結制御用のトランザクシ曹ン凍結
要フラグ７１３とロールバック回復を行う必要があるこ
とを示すロールバック要フラグ７１４とトランザクショ
ンが同期点を通過したか否かを示す同期点フラグ７１５
とトランザクションが凍結中であることを示す凍結フラ
グ７１６とトランザクションが同期点準備を通過しかつ
同期点通過前であることを示す同期点準備通過フラグ７
１７とからなる。。

第５図にシステムステータステーブル８の構成を示す。

システムステータステーブルには、コントローラ１の状
態８１０と各サブシステムの状態８２０と、システムの
チェックポイント時点のジャーナル通番記録領域８１５
から成る。

該システムステータステーブルは更新の都度５ＹＳＳＦ
へ対応エントリを書き出しておき、５ＹＳＳＦに複写を
作ってお（。

本実施例で示す複合サブシステム形オンラインシステム
では、障害発生時の回復のために１種々の情報を外部記
憶装置に出力しながら業務処理を進めて行く。回復すべ
き資源（データ、情報の総称）は、大きく分けて、次の
２種類がある。

（１）仮想記憶装置上のテーブルの様に、障害発生時に
は消失してしまうタイプの揮発性資源（２）外部記憶装
置上のデータベースの様に、障害発生時にも、一般には
障害発生時点の状、態を保持したままとなるタイプの不
揮発性資源障害発生時点で消失する揮発性資源を回復す
るためには、定期的に該資源の複写を不揮発性の外部記
憶装置に作成しておく（該複写をチェックポイントダン
プと呼ぶ）。チェックポイントダンプ１得以降変更の都
度変更の差分情報をジャーナルとして取得しておき、チ
ェックポイントダンプに該ジャーナル情報を重畳するこ
とで回復が行える。・このタイプのジャーナルを履歴形
ジャーナルと呼ぶ。

障害発生時点の状態が保持される不揮発性資源を回復す
るＫは、変更の都度ジャーナルを取得する。回復時には
、業務処理単位であるトランザクション毎に更新を完結
させるか、更新を無効にするかを判断し、変更都度取得
したジャーナルの変更後情報を重畳するか、変更前情報
を重畳するかで回復を行う。このタイプのジャーナルを
トランザクシ冒ン形ジャーナルと呼ぶ。

本実施例のシステムでは、障害回復に備えて。

データベース更新、テーブル更新に先立ってジャーナル
出力を行う。ジャーナル出力は、コントローラ配下の機
能を用いて、各サブシステムを統合して一つのＪＮＬＦ
５に行う。ＪＮＬＦ５を統合することは、複合サブシス
テムを運転する際の操作性向上に大きく寄与する。ジャ
ーナル取得の方式を以下に説明する。

ジャーナルは、データベース更新、テーブル更新前に必
ず取得する。ジャーナル取得前に変更を行うと、変更後
、ジャーナル取得前に障害が発生した場合に回復できな
くなる。

トランザクションの終了に際して、該トランザクション
の全ジャーナルを出力した後に、全ジャーナルが出力源
すなわち同期点を示すジャーナル（以下同期点ジャーナ
ルと呼ぶ）を出力する。

該同期点ジャーナルがジャーナルとして存在するトラン
ザクションでは、不揮発性費源の回復に必要となるすべ
てのトランザクシーン形ジャーナルが存在するため、該
トランザクションの処理を完結させる方向の回復が行え
る。それに対し、同期点ジャーナルが存在しないトラン
ザクションでは、全ジャーナルが出力されている保証は
ないが、変更前には必ずジャーナルを出力しているため
、存在するジャーナルの変更前情報を用いて、該トラン
サクシ１ンを無効とする方向の回復が行える。

トランザクションが完結した後に、トランザクション終
了を示すジャーナルを取得する。該終了を示すジャーナ
ルを終了ジャーナルと呼ぶ。該ジャーナルが出力された
後は、トランザクシーン形ジャーナルによる回復は不要
となる。

分散データベースの場合には、一つのトランザクション
が自システム内のデータベースと他プロセツサ内のデー
タベースを更新するため、プロセッサ間にまたがってデ
ータベース更新の同期が必要となる。分散データベース
の場合のジャーナル取得の方式を以下に説明する。

トランザクションの終了に際して、まず分散クライアン
ト側の全ジャーナルが出力される。この時点で分散クラ
イアント側から分散サーバ側に全ジャーナルの出力指示
（以下、これを同期点孕備指示と呼ぶ）を行う。分散サ
ーバ側では該指示を受は全ジャーナルの出力後に同期点
準備が完了したことを示すジャーナル（以下、これを同
期点準備ジャーナルと呼ぶ）を出力する。該ジャーナル
の出力完了後、分散サーバは分散クライアントに同期点
準備の完了を報告する。分散クライアント側では、該ト
ランザクションの自システム内の全ジャーナルの出力、
及び要求を出した全ての他プロセツサの分散サーバから
同期点準備完了報告を受けた後、同期点ジャーナルを出
力する。同期点ジャーナルの出力が完了した後、分散ク
ライアントは自システム内のデータベースの更新を行い
、分散サーバに対し該トランザクションがＦＩ期点に達
した旨の指示（以下、これを同期点指示と呼ぶ）を行う
。分散サーバは、同期点指示を受けると、まず同期点ジ
ャーナルを出力した後、バッファ上に残る該トランザク
シーンのデータベース更新ヲ完了さる。その後終了ジャ
ーナルを出力し、出力が完了後、分散クライアントにト
ランザクシーン完了を報告する。分散クライアント側で
は、自システム内のデータベースの更新、及び指示を出
した全ての分散サーバから完了報告を受けた後、終了ジ
ャーナルを出力する。

分散クライアント側では、同期点ジャーナルが存在すれ
ば、該トランザクションを有効とする方向の回復を行い
、なければ無効とする方向の回復を行うことができる。

分散サーバ側では、同期点準備ジャーナルと同期点ジャ
ーナルが存在すれば、該トランザクシーンを有効とする
方向の回復を行い、同期点ジャーナル及び同期点準備ジ
ャーナルのいずれも存在しない場合には、該トランザク
シーンを無効とする方向の回復を行う。同期点準備ジャ
ーナルだけが存在する場合には、会期クライアント側の
同期点ジャーナルの有無を調べ、それに従えば回復を行
うことができる。

なお、該プロセッサ内で独自のジャーナルファイルを持
ちジャーナルを取得する従来形オンラインシステムを複
合サブシステム形オンラインシステムに接続し、該オン
ラインシステム下で実行するトランザクションから、複
合サブシステム形オンラインのＢＥのデータベースを更
新する場合、該オンラインシステムを分散サーバと同様
の一つのＦＥとして扱い、前述のジャーナル取得方式を
用いることにより該オンラインシステム内のデータベー
ス更新と複合サブシステム形オンラインシステムのＢＨ
のデータベース更新の同期をとった回復ができる。

本実施例では、回復すべきテーブルを定期的にチェック
ポイントダンプとしてサブシステム毎に取得し、同時点
にてトランサクシ１ン形ジャーナルなＴＲＲＦに退避す
る。各情報取得の方式を以下に説明する。

第６図、第７図、第８図にチェックポイントダンプ取得
の概念と取得の流れ図を示す。

第６図に示すように、各サブシステム２．３は。

定期的に仮想記憶装置上のチェックポイント対象テーブ
ル４１１の内容なＣＫ　Ｐ　Ｔ　Ｆ　４１０へ格納する
。

チェックポイントダンプ格納中にＣＫ　Ｐ　Ｔ　Ｆ　４
１０に障害が発生しても回復が行える様ＫＣＫＰＴＦ４
１０は世代管理な行う。システムの障害発生後の回復時
には、最新世代のＣＫ　Ｐ　Ｔ　Ｆ　４１０上の情報と
、ＪＮＬＦ５に格納されているチェックポイント時点以
降の更新情報を重畳して行くことにより、テーブルが回
復できる。チェックポイントダンプな定期的に取得する
ことは、障害発生後の回復時に必要となるジャーナル情
報を限定することになり、回復時に入力するジャーナル
量の削減と回復時間の短縮化の効果がある。

チェックポイントダンプ取得は、各サブシステムで行う
が、この際、当該サブシステムを使用する業務処理を停
止させない。このため、更新中のテーブルをチェックポ
イントダンプとして取得する可能性がある。更新中のテ
ーブル情報をチェックポイントダンプに取得しても、該
更新に対応するジャーナルがチェックポイント時点以降
に取得されていれば、チェックポイントダンプ取得完了
後は、チェックポイント時点以前の履歴形ジャーナル情
報を必要としない。

テーブルの更新と対応するジャーナル取得が完了するタ
イミング４１（Ｍは、トランザクシランごとにまちまち
であり同期していない。またチェックポイントダンプ取
得にも有限の時間がかかる。このため、チェックポイン
トダンプは、第７図に示すようにチェックポイント時点
４１０αとチェックポイントダンプ取得開始時点４１０
ｈ　、取得終了時点４１０Ｃ１及びチェックポイントダ
ンプ有効時点４１０ｄの４つの時点を分けて取得する。

チェックポイントダンプを取得する必要が発生すると、
まずチェックポイント時点４１０αの宣言を行う。該時
点で更新中のテーブル情報に対応するジャーナルは、チ
ェックポイント時点４１０α以前に取得されている可能
性があるのでまだチェックポイントダンプ取得を開始で
きない。そこで、チェックポイント時点４１０αで更新
中の処理がすべて更新処理を完了した時点まで待ち、完
了後チェックポイントダンプ取得開始を行う。チェック
ポイントダンプ取得が完了しても、まだ更新に対応する
ジャーナルが出力されていない可能性があるので、チェ
ックポイントダンプ取得終了時点４１０Ｃに更新中の処
理に対応するジャーナルがすべて出力された時点まで待
ち、出力完了後、チェックポイントダンプ有効時点４１
０ｄとする。チェックポイントダンプ有効時点４１０ｄ
を経過する以前に障害が発生した場合には、当該チェッ
クポイントダンプは使用せず、−世代前のチェックポイ
ントダンプによる回復を行う。

本実施例では、第８図に示す流れに従ってチェックポイ
ントダンプを取得する。まず、コントローラ１は、一定
のジャーナル出力件数に到達するとチェックポイントダ
ンプ取得タスク４１２を起動する。起動されたタスク４
１２は、チェックポイント時点の宣言を行い、この時点
でのジャーナル通番をコントローラの管理する仮想記憶
上にチェックポイント時点ジャーナル通番８１５として
記憶しチェックポイント取得開始待ちとなる。チェック
ポイント取得開始が可能となると、各サブシステムにチ
ェックポイントダンプ取得指示を行う。各サブシステム
は、チェックポイントダンプ取得指示に従い、チェック
ポイントダンプな各サブシステムのＣＫ　Ｐ　Ｔ　Ｆ　
４１０に取得する。取得が完了するとコントローラに取
得完了報告を行う。コントローラは、各サブシステムの
取得完了報告を確認した後、チェックポイントダンプ有
効化待ちとなる。

チェックポイントダンプ有効化か可能となると、当該Ｃ
Ｋ　Ｐ　Ｔ　Ｆ　４１０と５ＹＳＳＦ９に有効ビットを
記録して、チェックポイントダンプ取得を終了し、次の
取得タイミングまで待ちとなる。

ここで、チェックポイントダンプ取得開始待ちと、チェ
ックポイントダンプ有効化待ちは、同一の方式を用いる
。本方式を第９図を用いて説明する。

第８α図において、各トランザクションは、チェックポ
イント対象となっているテーブル更新を含む機能を使用
する際には、トランザクション管理たプル７上の影響フ
ラグ７１１をオンにし、機能使用終了時に影響フラグ７
１１及び実行監視フラグ７１２をオフにする。本フラグ
操作は、処理ルーチンへ渡る際の共通ルーチンにて行う
。なお共通ルーチンを経由しない場合、各サブシステム
の処理で開始、終了を宣言する方式をとればよい。

第１０図においてコントローラ内のチェックポイントダ
ンプ取得タスク４１２でチェックポイントダンプ開始待
ち又は、有効化待ちを開始するには、トランザクシ冨ン
管理テーブル７上の全トランザクシ１ンについて影響フ
ラグ７１１がオンであれば実行監視フラグ７１２をオン
にする。その後タイマで待ち、起動されるたびにすべて
の実行監視フラグ７１２がオフになっているかどうかを
チェックする。すべての実行監視フラグ７１２がオフに
なればζ待ちを開始する時点にテーブル更新を含む処理
がすべて終了した事になる。

チェックポイントダンプ出力時には、後述するジャーナ
ルポインタ情報の退避や、資源管理テーブルの論理情報
の退避を行い、チェックポイント時点以前のジャーナル
情報や資源管理情報がな（ても、回復ができるようにす
る。また、トランプクシ１ン管理テーブルは、チェック
ポイントダンプ対象テーブルとなっており１回復ができ
る。資源管理テーブルの論理情報の退避は、第１１図に
示す資源管理論理情報テーブル７５０という形式にして
行う。該論理情報テーブルは資源管理テーブル中の全資
源に対し、該資源を保持しているトランザクションのト
ランザクシーンＩＤ７０１＆第３図に示す資源管理テー
ブル６の資源ノード６２０から資源排他ノードへのリン
ク６２２をたどることにより資源排他ノード６３０　？
：求め資源名７５１とトランザクションＩ　Ｄ　７５２
をペアにして格納することで一作成する。この時出力す
べきペアは、チェックポイント時点以前に資源保持情報
をジャーナルに出力したものであり、チェックポイント
時点以降の資源保持情報は、後述する様にジャーナルか
ら回復する。

ジャーナルを外部記憶装置上のＪＮＬＦ５に出力する除
、出力するバッファ上に存在する全てのトランザクシ置
ン形ジャーナルについて、第１２図に示す形式のジャー
ナルポインタ７２０を作成しトランザクシーン管理テー
ブルの該当トランザクシ曹ンエントリに退避する。該ポ
インタ７２０は、ジャーナルの通番７２１とＪＮＬＦ５
のファイル名７２２及びファイルの先頭からの相対ブロ
ック番号７２３から成り、該ポインタを用いるととによ
り、必要な時点に当該トランザク１．シーンで出力した
ジャーナルを得ることができる。障害発生時、コントロ
ーラ１がダウンしていなければ、トランザクシ薗ン回復
時には、該ジャーナルポインタでダイレクトにジャーナ
ルを得ることができる。

チェックポイントダンプ出力時には、チェツク１インド
ダンプ有効時点４１０ｄの時点で存在するトランザクシ
ョンに関して、有効化に先だち、ジャーナルポインタ７
２０を用いてジャーナルをＪＮＬＦ５から読み出し、ト
ランザクションリカバリファイル４３０へ退避しておく
。退避すべきか否かは、トランザクシ■ンテーブル７中
のジャーナルポインタ７２０にあるジャーナル通番７２
１を参照し、チェックポイント時点４１０αのジャール
通番８１５より以前の番号であれば、退避を行い、以降
であればチェックポイント時点以降のＪＮＬＦＳ中に存
在するジ１ヤーナルなので退避しない。

本実施例では、トランザクションの開始に先立ち、各ト
ランザクションＫ　Ｔ　ＲＲＦ　４３０の一定領域を割
り当てる。

退避を行つ場合、−世代前のチェックポイント時点に退
避したＴ　ＲＲＦ　４３０中の情報を失うことのないよ
うに、トランザクシ總ンテーブル７中のＴＲＲＦ最終ポ
インタ７３０から追加書きを行う。

ここでＴＲＲＦ最終ポインタ７３０は、トランザクショ
ン発生時に該トランザクションに割り当てたＴＲＲＦ中
の領域の先頭を指し、以降ジャーナル退避を行う都度更
新して、常にＴＲＲＦ中の該トランザクシーンに割り当
てた領域の最終を指すポインタである。

ジャーナル情報をＴＲＲＦ４３０に退避することにより
、チェックポイントダンプ取得以降は、チェックポイン
ト時点以前から長期化しているトランザクシ習ンの回復
にもチェックポイント時点以前のジャーナルは不要とな
る。Ｔ　ＲＲＦ　４３０は、トランザクション単位のエ
ントリに整理されているので、トランザクション単位の
回復時にも該Ｔ　ＲＲＦ　４３０とチェックポイント時
点以降のジャーナルで回復に必要なデータが容易にそろ
う。

さらに、トランザクシ曽ン形ジャーナル出力時には、資
源保持情報も同時に出力する。これは、トランザクシ璽
ン形ジャーナルを出力する際に、当該トランザクシ側ン
の保有している資源を、資源管理テーブル６のトランザ
クシーンノード６１０から資源排他ノード６３０をたど
ることにより求め、該資源保持情報を第１１図に示す資
源管理論理情報のエントリと同様の形式でトランザクシ
璽ン形ジャーナルに付加して出力することで行う。

障害発生後の回復時には、ＣＫ　Ｐ　Ｔ　Ｆ　４１０中
のチェックポイントダンプとして保持されていた資源管
理論理情報テーブルとトランザクシーン形ジャーナルと
共にＪＮＬＦ　５に出力した資源保持情報から資源確保
処理をくり返すことにより資源管理テーブルが回復でき
る。このため、データベースを全面閉塞すなわち、デー
タベースに対するアクセスを全面禁止するのではなく限
定した範囲（使用していた部分だけ）を閉塞すれば済み
、一部サブシステムがダウンしていたり、一部トランザ
クシ菖ンの決着がつかない場合にも、オンラインシステ
ムを立上げることができる。

複合サブシステム形オンラインシステム全体が障害とな
った時の回復を全面回復と呼び、特定のサブシステムだ
けが障害となった際の回復をサブシステム回復と呼ぶ。

以下、複合サブシステム形オンラインシステムの全面回
復、サブシステム回復について説明する。

第１に、複合サブシステム形オンラインシステムの全面
回復の流れを第１３図から第１７図を用いて説明する。

全面回復では、まずコントローラ１の機能を回復する。

その後各サブシステムの回復を行うが一部のサブシステ
ム機能が回復できなくても当該機能を縮退したままシス
テムを再開できる。

コントローラ１の機能回復は、まず５ＹＳＳＦ９からコ
ントローラ用ＣＫ　Ｐ　Ｔ　Ｆ　４１０を決め、該ＣＫ
　Ｐ　Ｔ　Ｆ　４１０からコントローラ内のトランザク
シーン管理テーブル７を回復する。又、資源管理論理情
報テーブル７５０も回復する。なお、コントローラ用Ｃ
Ｋ　Ｐ　Ｔ　Ｆ　４１０を読むことにより、現在の最新
チェックポイント時点のジャーナル通番及び該ジャーナ
ル通番のジャーナルに対するジャーナルポインタ８１５
が決まる。

次に、第１４図に示すように最新チェックポイント時点
のジャーナルポインタ８１５で指す位置からＪＮＬＦ５
を順に読む。読み出されたジャーナルは、コントローラ
の出力した履歴形ジャーナルであれば、第１５図の流れ
に従いトランザクシ璽ン管１テーブル７や、資源管理論
理情報テーブル７５０更新情報として使用し、各テーブ
ルを障害発生時点の状態に回復して行（。コントローラ
以外が出力した履歴形ジャーナルは、出力サブシステム
のＴ　Ｂ　Ｌ　ＲＦ　４２０へ出力する。トランザクシ
ーン形ジャーナルの場合は、トランザクシ書ン管理テー
ブル７の該当するトランザクシロンエントリのジャーナ
ルポインタ７２０の領域にジャーナルポインタ形式で格
納して行く。トランザクシ目ン管理シブルアの各トラン
ザクシロンのエントリは、同期１点ジャーナルが見つか
れば同期点通過ステータスを同期点通過フラグ７１５を
オンにすることで記録し終了ジャーナルが見つかれば、
該エントリを削除する。

分散データベースの分散サーバ側のよ５に同期点準備ジ
ャーナルが存在する場合、同期点準備ジャーナルが見つ
かれば、まず同期点準備通過フラグ７１７をオンにする
ことで同期点準備状態であることを記録する。同期点ジ
ャーナルが見つかれば、同期点準備通過フラグ７１７を
オフにし、同期点通過フラグ７１５をオンにする。終了
ジャーナルが見つかれば、該エントリを削除する。

ジャーナル読み込みが完了した時点では、各サブシステ
ムの履歴形ジャーナルは、サブシステムごとのＴ　Ｂ　
Ｌ　ＲＦ　４２０に分類されて出力されである。トラン
ザクション管理テーブル７は、障害発生時点まで回復さ
れており、障害発生時点で存在したトランザクシーンだ
けが登録されである。この時点でトランザクション管理
テーブル７中の全トランザクシランの凍結要フラグをオ
ンにしておく各トランザクションごとのエントリは、ジ
ャーナルポインタ７２０領域を含めて回復されである。

資源管理論理情報についても、最新のチェックポイント
時点の状態と、それ以降の更新情報がすべてそろってい
る。ジャーナルの読み込みが完了すると、資源管理論理
情報をもとに、資源確保。

解放操作をくり返すことによって資源管理テーブル６を
回復する。さらに回復された資源管理テーブルの全排他
ノード６３０について凍結状態にする。

凍結状態になった資源に対して新たに資源確保な行うと
、凍結状態のため、排他ノード６３０を作ることなせず
に、資源確保要求が失敗する。従って資源管理テーブル
を凍結状態にすることで、障害発生時に使用していた資
源を一時的に使用禁止状態にすることができ、新たなト
ランザクシーンが発生しても、使用可能な資源だけで動
作できるならば、実行ができ使用不可の資源を必要とす
るならばエラーとして扱われ長時間待つことがない。

すなわち、資源管理テーブル６の回復と凍結が済んだ時
点でコントローラ１としての回復は終了する。この時点
で、システムレディのメツセージを出力するがまだサブ
システムが回復されていないので、複合サブシステム型
オンラインシステム全体としては、動作を開始しない。

なお、資源の凍結は、後で述べる決着で失敗した時点で
始めて行う方法もある。この場合、同一資源にアクセス
するトランサクシ１ンは待ちになるが、決着が終るまで
待つだけなので障害の影響を小さくできる。

次に、サブシステムの回復を始める。各サブシステムは
、コントローラ１の指示で並行して回復処理を行う。各
サブシステムの回復は、ＴＢＬＲＦ　４２０に格納され
ている履歴形ジャーナルをもとに、サブシステム内の回
復対象テーブルを回復することで終る。この時点で、複
合サブシステム形オンラインシステムは動作を開始する
。なお、一部のサブシステムが回復に失敗した場合には
該サブシステムだけが縮退した状態となる。この時点で
も、障害発生時点で動作中のトランザクシーンは回復さ
れていないが、これらのトランザクシーンはすべて凍結
要となっており、後で述べるトランザクシーンの凍結決
着処理にて回復する。新しく発生したトランザクシーン
は、そのまま実行される。

各サブシステムへの回復指示を出した後、サブシステム
における回復と並行してコントローラ１では、トランザ
クション管理テーブル７に存在する凍結要フラグがオン
となっている全トランザクシーンがアクセスしていた資
源（一般にはデータベース）をすべて回復する。そこで
、コントローラｌは、トランザクションの回復のための
処理を開始する。これを凍結決着処理と呼ぶ。凍結決着
処理の流れを第１６図に示す。

凍結決着処理では、まず、凍結要となっているトランザ
クションの凍結処理を行う。ここで、トランザクシーン
を凍結状態にするとは、該トランザクシーンを終了させ
ずに一時的に停止させることであり、このために回復に
必要な情報を保存する。

トランザクシーンの凍結処理では、第１６図に示すよう
にトランザクション管理テーブル７のジャーナルポイン
タ７２０をもとに、該トランザクションのもとで出力し
たジャーナルなＪＮＬＦ５から読み出す。読み出したジ
ャーナルは、チェックポイントダンプ出力時と同様に、
トランザクシ■ン管理テーブル７のＴＲＲＦ最終ポイン
タ７３０の位置から追加書きでＴ　ＲＲＦ　４３０に書
き込んで行く。

該トランザクシーンのジャーナルポインタ７２０に関し
て、すべてのジャーナルをＴ　ＲＲＦ　４３０へ退避し
た時点で、該トランザクシーンの凍結処理が完了し、凍
結要フラグをオフとし、凍結フラグをオンとする。トラ
ンザクションが凍結されると、該トランザクションの回
復に必要となるすべてのジャーナルがＴ　ＲＲＦ　４３
０中に格納されたことくなる。これは、最新のチェック
ポイント時点以前に出力された該トランザクションのジ
ャーナルは、チェックポイント時点にＴＲＲＦ４３０に
退避済であり、チェックポイント時点以降のジャーナル
は、ジャーナルポインタ７２０を用いて凍結処理でＴＲ
ＲＦ４３０に退避したためである。

凍結状態になったトランザクションすなわち、凍結フラ
グがオンとなっているトランザクションは、コントロー
ラ１が定期的にトランザクション管理テーブル７から選
択し、該トランザクションの保持する資源を回復する。

資源の回復は、同期点ジャーナルの有無により決める。

同期点ジャーナルが存在すれば、すなわち同期点通過フ
ラグ７１５がオンであれば、ジャーナルをもとく更新を
完結させる。これをロールフォワードと呼ぶ。同期点ジ
ャーナルが存在しなければ、すなわち同期点通過フラグ
７１５がオフであれば、トランザクションでの更新を無
効とし、更新源の部分はジャーナルをもとに以前の状態
に戻す。これをロールバックト呼ぶ。ロールフォワード
とロールバック処３１を合わせて資源の決着、またはト
ランザクシーンの決着と呼ぶ。

決着処理は、第１６図に示す様に、まず、トランザクシ
ョン管理テーブル７中の凍結フラグ７１６がオンとなっ
ているトランザクションを一つ選択し、該トランザクシ
ョンの状態をトランザクション管理テーブル７中の同期
点通過フラグ７１５でチェックする。同期点を通過して
いれば、ロールフォワード処理を行い、同期点通過以前
であれば、ロールバッｐ処理ｐｔ行う。ロールフォワー
ド、ロールバックは、該トランザクションの使用ＢＥ３
をトランザクション管理テーブル７の使用Ｂ　Ｅ　７０
３から決め、全便用ＢＥに対してロールフォワード、ロ
ールバックを指示することで行う。指示を行うには、事
前にＴ　ＲＲＦ　４３０を読み、該トランザクションの
該ＢＥに関連するジャーナルをテーブルとじて仮想記憶
上九作成し、該ＢＥに引き渡す、ＢＥ３は、ＢＥ自身の
回復が済みＢＥ機能が回復していれば、渡されたジャー
ナルをもとに資源の決着を行う。回復が済めば、凍結さ
れていた該資源の排他ノードを解放し、資源を解放し、
凍結フラグ７１６をオフにする。ＢＥ自身の回復が完了
していない、若しくは回復できない場合は、該トランザ
クシーンを凍結したままとする。従って、障害回復ので
きないＢＥによって回復処理が終了しない場合でも、回
復できない範囲を該ＢＥのデータベースを更新したトラ
ンザクシーン群だけに限定することができる。

一つのトランザクションで複数ＢＨのデータベースを更
新した場合の決着処理を図１７に示す。複数ＢＨのデー
タベースを更新した場合、Ｔ　ＲＲＦ　４３０から入力
したジャーナルを渡すべきＢＥ３が障害中であれば、該
ジャーナルとばしＴＲＲＦ４３０中の残りのジャーナル
について処理を続ける。ＴＲＲＦ４３０中のジャーナル
終了後、ＢＥ３が障害中のためとばしたジャーナルがあ
れば、該ＢＥ３を除き処理済となったＢＥ３についての
部分的終了ジャーナルを出力し、決着源ＢＥに対応する
資源を解放し、該トランザクションは凍結状態のまま托
しておく。処理済となったＢＥ３については、トランザ
クシ鍔ン管理テーブル中の使用ＢＥエントリーに処理済
であることを記録しておく。次に決着処理が実行される
場合には、Ｔ　ＲＲＦ　４３０から入力されたジャーナ
ルが既に処理済ＢＥ３のジャーナルであれば読みとばす
。従って、一つのトランザクシーンが複数ＢＥのデータ
ベースを更新した場合の一部ＢＥが障害中の回復処理で
は、該トランプクシ１ン全体ではなく、該トランザクシ
ーンの障害中ＢＥについての回復が保留されるだけであ
り、回復可能なりＥについての回復処理を完了すること
Ｋよって１回復できない範囲を最小限にすることができ
る。

分散データベースの分散サーバ側の場合、該サブシステ
ムはＦＥ２に相当し、同期点通過以前の状態が更に、同
期点準備状態と同期点準備以前の状態に分けられる。同
期点準備以前の状態であれば、ロールバック処理を行い
、同期点通過後の状態であれば、ロールフォワード処理
を行う。同期点準備状態の場合、分散データベースの分
散サーバから当該トランザクシランを発生させた分散ク
ライアントに問い合わせを行い、分散クライアント側の
対応するトランザクシランが同期点通過後であればロー
ルフォワード処理を行い、同期点通過以前であればロー
ルバック処理を行う。分散サーバから問い合わすべき相
手の分散クライアントとトランザクシ茜ンの識別情報は
、分散サーバ側でのトランサクシ１ン発生時点にトラン
ザクシ習ン管理テーブルの発生ＦＥエントリ７０２に記
録してお（。

自システム内の分散データベースサブシステムが障害中
、又は他プロセツサ側が障害中の場合、同期点準備状態
のトランサクシ１ンのみが決着できずに残されるが、他
のトランザクシランは、図１６、図１７の流れに従い決
着する。

一方分散データベースの分散クライアント側の場合該サ
ブシステムはＢＥ３に相当する。図１７０流れにおいて
、コントローラ１は、トランザクシ曹ン管理テーブル中
の使用ＢＥエントリ７０３に、分散クライアントが記録
されていたならば、各ＢＥ３へのジャーナル渡し処理時
に分散クライアントに対し、ロールバック、又はロール
フォワードの指示を出す。分散クライアントは、該指示
を分散サーバ側に送る。分散サーバ側では、指示を受け
たトランザクシランが同期点準備状態であれば、ロール
フォワード指示の場合は同期点通過状態圧する。ロール
バック指示の場合は同期点準備状態状懇にし、各々該当
する決着処理を行う。

なお、分散サーバ側のトランザクシランから。

更に他プロセツサの分散データベースに対する要求が出
された場合には、該トランザクシランの一つのＢＥとし
て該システム上の分散クライアントを使用した場合に対
応ずげるだけで同機に扱うことができる。

第２に、サブシステム障害の回復について、第１８図を
用いて説明する。

Ｕ合すブシステム形オンラインシステムでは。

サブシステム内に障害が発生した場合には、該サブシス
テムだけを障害扱いとし、サブシステム回復を行う。サ
ブシステム回復方式は、ＦＥ２とＢＥ３で異なる。

ＦＥ２に障害が発生した時の回復では、該サブシステム
の機能の回復と該サブシステム下で生成した全トランザ
クシ雪ンを回復する必要がある。

サブシステムのみ障害の場合、コントローラ１の持つト
ランザクシ冒ン管理テーブル７はそのまま仮想記憶装置
上に存在するので、該サブシステムの異常終了時に呼び
出されるルーチンの中で、トランザクシ曹ン管理テーブ
ル７の発生ＦＥ領領域０２を参照して該サブシステムの
発生させた全トランザクシ冒ンについて凍結要フラグ７
１３をオンにしておく。ここで、障害となったＦＥ２が
発生させたトランザクシランは、トランザクシ■ン管理
テーブル７中の発生トランザクシ■ン領域７０２を参照
することで限定している。このため、該ＦＥの障害は、
該ＦＥの発生させたトランザクシランに限定でき、他Ｆ
Ｅの発生させたトランザクシランに対しては影響なく業
務処理が遂行できる。サブシステムダウンをコントロー
ラが検出するとコントローラ１は、全面ダウン時と同様
に、ＪＮＬＦ５を最新チェックポイント時点から順次読
み出し、該障害発生サブシステムに関連する履歴形ジャ
ーナルを該サブシステムのＴ　Ｂ　Ｌ　ＲＦ　４２０に
格納する。その後、コントローラ１は該サブシステムを
再起動し、起動後肢サブシステムに回復指示を出す。回
復指示を受けたサブシステムは、ＣＫＰＴＦ４１０　ト
Ｔ　Ｂ　Ｌ　ＲＦ　４２０をもとに該サブシステムの機
能回復を行う。

該サブシステムの機能回復と並行して、コントローラ１
は、トランザクシ■ン管理テーブル７の凍結要フラグ７
１３がオンの全トランザクシ箇ンについて、全面回復時
と同様に第１６図の流れに従いすべて凍結し、決着を行
う。資源管理テーブル６は、コントローラｌが管理して
いるため、サブシステム障害１圓復時にも有効のままな
ので、障害発生ＦＥ２は、該サブシステム機能の回復が
済めば、コントローラ１のトランザクシ層ンｉ結、決着
を待つことなく、新しいトランザクシ璽ンの処理を開始
できる。

ＢＥ　３に障害が発生した時の回りでは、該サブシステ
ムの機能回復と、該ＢＥを使用して一二だトランザクシ
ーンの回復を行う必要がある。ＦＥ２障害時同様、トラ
ンザクシーン管理テーブルは仮想記憶装置上に存在する
ので、該ＢＥ３の異常終了時に呼び出されるルーチンの
中で、トランサクシ１ン管理テーブル７の使用ＢＥ領域
７０３領域を参照して、該ＢＥを使用していた全トラン
ザクシーンについて、ロールパック要フラグ７１４をオ
ンにしておく。ここで、障害発生となったＢＥ３を使用
したトランザクシーンをトランザクシーン管理テーブル
７の使用ＢＥ領領域０３で限定しているため、該ＢＥの
障害は、該ＢＥを実際に使用しているトランザクシーン
に限定でき、他ＢＥだけを使用しているトランザクシー
ンに対しては、影響なく業務処理が遂行できる。

さらに、該ＢＥ３の管理していた資源は、該ＢＥ３の障
害回復が終了するまで解放できないので資源凍結を行う
必要がある。資源の凍結は、該ＢＥ２の異常終了時に呼
び出されるルーチンの中で資源管理テーブル６中の該Ｂ
Ｅ３に継がる全資源ノード６３０について行う。資源凍
結は、障害発生時には単に凍結型としておき、ＢＥ回復
、トランサクシ１ン決着が−通り済むまで遅延させる方
式も考えられる。これＫより、同一資源を要求している
他トランザクシ冒ンはエラーリターンではなく、一時的
に待ちを行い、該資源を保持しているトランザクシラン
が正常に決着されれば、障害はなかったものとして処理
が継続できることになる。

サブシステムダウンをコントローラ１が検出すると、コ
ントローラ１は、ＦＥ２障害時と同様にＪＮＬＦ５から
Ｔ　Ｂ　Ｌ　ＲＦ　４２０を作成する。その後、コント
ローラ１は、該ＢＥ３を再起動し、起動後、障害発生Ｂ
Ｅ３に回復指示を行う。回復指示を受けたＢＥは、ＣＫ
　Ｐ　Ｔ　Ｆ　４１０とＴＢＬＲＦ４２０をもとに該Ｂ
Ｅの機能回復を行う。ただし、ＢＥの種類によっては、
ＣＫ　Ｐ　Ｔ　Ｆ　４１０やＴＢＬＲＦ４２０を必要と
しない。この場合は、コントローラｌは、ＪＮＬＦ５を
読まずに単に回復指示を出し、該ＢＥは機能回復を行う
。

該サブシステムの機能回復を待ち、コントローラ１は、
トランザクシーン管理テーブル７のロールバック要フラ
グ７１４がオンの全トランザクシ璽ンについて、全面回
復時と同様に第１６図の流れに従いすべて凍結し、ロー
ルバック方向の決着を行う。

以上サブシステムの障害回復で示した様にトランザクシ
ーン管理テーブル７の発生ＦＥ領域７０２及ヒ使用ＢＥ
領域７０３を用いてサブシステム障害の影響を特定のト
ランザクシーンに限定している。

本機構のため、一部サブシステム障害時でも他のサブシ
ステムの処理は正常に遂行できることとなり、複合サブ
システム形オンラインシステムの運転を続行できること
Ｋなる。また、ＲＦ４を持つことで、障害となったサブ
システムは、他サブシステムの処理が先に進む事に影響
されずに遅延しながらも回復し、他サブシステムに影響
することな（合流することができる。

第３ＶＣ１業務処理プログラムに障害が発生し。

実行中のトランザクシ厘ンが異常終了した場合には、異
常終了時に呼び出されるルーチンにて、該トランサクシ
１ンの凍結型フラグ７１３をオンにしておく。これによ
り、全面ダウン時と同様にコントローラ１が該トランザ
クシーンの凍結、決着ヲ行う。業務処理プログラムは、
ＦＥ２によって再度起動されることで、機能を回復する
。

【図面の簡単な説明】

第１図は複合サブシステム形オンラインシステムの全体
構成図、第２図はりカバリファイルの構成図、第３図は
資源管理テーブルの構成図、第４図はトランザクシーン
管理テーブルの構成図、第５図はシステムステータステ
ーブルの構成図、第６図はチェックポイントダンプ取得
の概念図、第７図はチェックポイントダンプ取得のタイ
ミング図、第８図はチェックポイントダンプ取得の流れ
図、第９図はチェックポイントダンプ有効化方式の流れ
図、第１０図はチェックポイントダンプ取得における待
ち処理の流れ図、第１１図は資源管理論理情報テーブル
の構成図、第１２図はジャーナルポインタの概念及び構
成図、第１３図は全面回復の流れ図、第１４図はジャー
ナル回復の流れ図、第１５図はコントローラのジャーナ
ル回復の流れ図、第１６図はトランザクシ曹ン凍結／決
着の流れ図、第１７図は一つのトランザクシ厘ンが複数
ＢＥ更新時の決着の流れ図、第１８図はサブシステム障
害回復の流れ図である。１・・・複合サブシステムコントローラ、２・・・フロ
ントエンドサブシステム、３・・・バックエンドサブシ
ステム、４・・・リカバリファイル、５・・ジャーナルファイル、６・・・資源管理テーブル。７・・・トランザクシ習ン管理テーブル。８・・・システムステータステーブル、９・・・システ
ムステータスファイル。１０・・・オンライン端末、１１・・・データベース、
４１０・・・チェックポイントファイル、４１１・・・
チェックポイント対象テーブル。４１０α・・・チェックポイント時点。４１０ｈ・・・チェックポイント取得開始、４１０Ｃ・
・・チェックポイント取得終了、４１０ｄ・・・チェッ
クポイント有効時点。４１０Ｃ・・・テーブル更新と対応するジャーナル取得
が完了するタイミング、４１２・・・チェックポイントダンプ取得タスク。４２０・・・テーブルリカバリファイル、４３０・・・
トランザクシ覆ンリカバリファイル。６１０・・・トランザクシ璽ンノード、６１１・・・ト
ランザクシ璽ンＩＤ部、６１２・・・次トランザクシ厘
ンノードへのＩＪ　７り。６１３・・・資源排他ノードへのリンク、６２０・・・
資源ノード、　　　６２１・・・資源名部、６２２・・
・資源排他ノードへのリンク、６２３・・・次資源ノー
ドへのリンク、６３０・・・資源排他ノード、６３１・
・・資源名部、６３２・・・同一資源に対して待ちをし
ている次資源排他ノードへのリンク。６３３・・・同一トランザクシーンが保持又は待ってい
る次の資源排他ノードへのリンク、６３４・・・トランザクシ■ンＩＤｉ、６３５・・・本
資源排他ノード情報がジャーナルとして取得されている
か否かを示すフラグ、６３６・・・本資源排他ノード情報は資源を保持してい
るのか、待っているのかを示すフラグ、７０１・・・ト
ランザクシ■ンＩＤ領域、７０２・・・発生フロントエ
ンドサブシステム領域、７０３・・・使用バックエンド
サブシステム領域。７１０・・・ステータスフラグ領域、７１１・・・影響フラグ、　　　７１２・・・実行監視
フラグ、７１３・・・凍結要フラグ、７１４・・・ロールバック要フラグ、７１５・・・同期点通過フラグ、７１６・・・凍結フラグ、７１７・・・同期点準備通過フラグ、７２０・・・ジャーナルポインタ領域、７２１・・・ジ
ャーナル通番、７２２・・・ジャーナルファイル名、７２３・・・相対ブロック番号、７３０・・・ＴＲＲＦ最終ポインタ領域、７４０・・・
資源管理テーブルへのポインタ、７５０・・・資源管理
論理情報テーブル、７５１・・・資源名領域、７５２・・・トランザクシ■ンＩＤ領域、８１０・・・
システムの状態領域。８１５・・・チェックポイント時点のジャーナルポイン
タ領域、８２０・・・サブシステムの状態領域、７０１１・・・
エントリ番号、　７０１２・・・通番。 −へ・、代理人弁理士　小　川　勝　男叉−′ 第　１　回第　２　図牛第　＋　図り高　５７第６図２．３第　７　＠４１０ａ　　　４１０ｂ　　　４１０ｃ　　　４ｆＯｄ
葛　Ｆ３　　図篤９図； σＤ第　ｌＯ図易　！１　　図ｉ　／Ｚ図名　１３　　図発　！４−　図第　Ｉ５　　図鳥　１６　　図名　１７　　図箒　１８　　図

Claims

【特許請求の範囲】

複数のデータコミュンケーションシステムやデータベー
スシステムをサブシステムとして持ち、各サブシステム
を統合制御する複合サブシステムコントローラが存在し
、障害回復用のサブシステム共用のジャーナルファイル
にジャーナルを取得し、チェックポイント用ファイルに
定期的にチェックポイント情報を取得する複合サブシス
テム形オンラインシステムにおいて、ジャーナル情報を
退避するためのジャーナル退避用ファイルを設けること
により、一部サブシステム障害発生時にも他サブシステ
ムの運転を続行し、障害サブシステムの立上がり遅れ時
にも容易に障害回復が行えることを特徴とする複合サブ
システム形オンラインシステムの障害回復方式。