JPS63261437A - 複合サブシステム形オンラインシステム - Google Patents

複合サブシステム形オンラインシステム

Info

Publication number
JPS63261437A
JPS63261437A JP62095103A JP9510387A JPS63261437A JP S63261437 A JPS63261437 A JP S63261437A JP 62095103 A JP62095103 A JP 62095103A JP 9510387 A JP9510387 A JP 9510387A JP S63261437 A JPS63261437 A JP S63261437A
Authority
JP
Japan
Prior art keywords
journal
transaction
subsystem
recovery
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62095103A
Other languages
English (en)
Other versions
JPH0833859B2 (ja
Inventor
Kazuo Masai
一夫 正井
Satoru Wakayama
和歌山 哲
Akiji Yamamoto
山本 章治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP62095103A priority Critical patent/JPH0833859B2/ja
Priority to US07/184,075 priority patent/US5065311A/en
Publication of JPS63261437A publication Critical patent/JPS63261437A/ja
Priority to US07/701,816 priority patent/US5333314A/en
Publication of JPH0833859B2 publication Critical patent/JPH0833859B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、複合サブシステム形オンラインシステムの障
害回復に係り、特に各サブシステムが同期して立上がる
ことが期待できないオンラインシステムに好適なリラン
方式に関する。
〔従来の技術〕
従来の単独オンラインシステムの障害回復方式は特開昭
54−114145号に記載のように、オージットファ
イル(ジャーナルファイル)トチニックポイントファイ
ル(及び、場合によっては、ビフォアルックファイル)
を持ち、障害時に備えて、ジャーナル及びチェックポイ
ント情報を採取しておき、障害発生時点では、障害に応
じてジャーナルとチェックポイント情報を用いて回復を
行っていた。ここで対象とするオンラインシステムは、
1個のデータコミエニケーシ層ン部と1個のデータベー
ス部を持つものに限られていた。
〔発明が解決しようとする問題点〕
上記従来技術は、複合サブシステム形オンラインシステ
ムの障害回復については配慮されておらず、複合サブシ
ステム構成をとると、それぞれのサブシステムが独立に
ジャーナルをとり、相互に無関係に回復することKなる
。これでは、複数のサブシステム忙またがる業務処理(
トランザクシーン)が発生すると、複数のサブシステム
の情報を同期して回復する必要があるにもかかわらず、
同期しての回復ができないことになる。障害発生サブシ
ステムが立上がってから同期をとってトランザクシーン
の回復を行うことにすれば良いが、障害発生後なかなか
立上がらないサブシステムがあった場合、他のサブシス
テムはいつまでも障害回復の完了しないトランザクシー
ンを残すことK fKる。このため、該トランザクシ會
ンの回復に必要となるジャーナル情報がいつまでも必要
となる。
このまま、オンラインを再開すると、回復できないトラ
ンザクシーンの回復に必要なジャーナルは後から発生す
るジャーナルに埋もれてしまい、障害発生サブシステム
が回復した後、膨大なジャーナルの中に埋もれたジャー
ナル情報を挿すことになる。従って、一部サブシステム
障害発生時にも、全サブシステムの運転を停止させ、全
サブシステム立上げ後、全トランザクシ嘴ンを回復して
からオンラインを開始する必要があるという問題があっ
た。
一部サブシステムが立上がらな(ても、情報更新の同期
情報がわかる様に全サブシステムのジャーナルを一本に
まとめた場合、障害発生サブシステム以外の情報は回復
できるが、今度は、障害発生サブシステムが必要とする
ジャーナルが一本にまとめられたジャーナルの中に埋も
れることになりやはり膨大なジャーナルの中から必要な
ジャーナルを挿すことになってしまうという問題が発生
する。
本発明の目的は、複合サブシステム形のオンラインにお
いて、一部サブシステムに障害が発生した場合、障害発
生サブシステム以外のサブシステムの運転を続行させ、
その後障害サブシステムが立上がってからの回復が容易
にできる様にすることにある。
〔問題点を解決するための手段〕
上記目的は、複合サブシステム形オンラインシステムに
回復時に必要とするジャーナルをトランザクシーンごと
に退避するジャーナル退避ファイルを設け、チェックポ
イント時点ごとK、該時点で動作中のトランプクシ1ン
が出力したジャーナルをジャーナル退避ファイルに退避
することにより達成する。
〔作用〕
各々のサブシステムが出力するジャーナルは。
−ケ所のジャーナルファイルにまとめて取得するdまた
、各ジャーナルは、チェックポイント時点で動作中のト
ランプクシ1ンのために出力したジャーナルであれば、
ジャーナル退避ファイルへ格納する。ジャーナル退避フ
ァイルは、トランザクシ璽ン単位に区割りされており、
トランザクシーンごとのジャーナルに整理して格納され
る。
一部サブシステムが障害となった時には、該サブシステ
ムを使用した全トランザクシーンを回復する必要がある
。障害となったサブシステムを使用したトランザクシ層
ンが必要とするジャーf)vを得るため、複合サブシス
テム形オンラインシステムのコントローラはチェックポ
イント時点以降のジャーナルを全て読み出し、ジャーナ
ル退避ファイルに必要なジャーナルを追加書きして行く
この動作が終了した時点で、回復を必要とする各トラン
ザクシ璽ンが必要とするジャーナルは、全てジャーナル
退避ファイルに集められたことになる。このジャーナル
退避ファイル中の情報を用いて、各トランザクシ膳ンの
回復が行われるが、使用したサブシステムのうち動作中
のサブシステムに関する情報はすぐ回復できるが、立上
がっていないサブシステムの情報は遅れて回復されるこ
とになる。しかし、必要なジャーナルはすべてジャーナ
ル退避ファイルに集められているので、障害サブシステ
ムが遅れて立ち上がっても、その時点ですぐにトランザ
クシーンの回復ができる。
〔実施例〕
以下、本発明の一実施例を第1図から第18図により説
明する。
第1図は、本発明を実現する複合サブシステム形オンラ
インシステムの全体構成図を示す。
第1図において、複合サブシステム形オンラインシステ
ムは、複数のサブシステムを制御する複合サブシステム
コントローラ1(以下単にコントローラと呼ぶ)と、そ
の配下にある2種類のサブシステム(フロントエンド形
サブシステム2及びバックエンド形サブシステム3)と
、各サブシステムごと及びコントローラ用のりカバリフ
ァイル4(以下単にRFと呼ぶ)と、全サブシステムの
ジャーナルを格納するジャーナルファイル5(以下、J
NLFと呼ぶ)と、全サブシステムの資源状態を管理す
る資鍾管理テーブル6と、トランザクションを管理する
トランザクション管理テーブル7と、システムの状態を
管理するシステムステータステーブル8と、システムス
テータステーブルの外部記憶装置上の複写として存在す
るシステムステータスファイル9(以下、5YSSFと
呼ぶ)から成る。
フロントエンド形サブシステム(以下FEと呼ぶ)は、
オンライン端末10を有し、業務処理の単位であるトラ
ンザクションを発生させる。パックエンド形サブシステ
ム3(以下、BEと呼ぶ)は、・データベース11を有
し、FE20発生させたトランザクションによる要求に
従ってデータベース11をアクセスする。
分散データベースシステムは、他プロセツサからのデー
タベースアクセス要求を受け、自プロセッサ内にトラン
ザクションを発生させて行うFEの役割(以下分散サー
バと呼ぶ)と、トランザクションからの他プロセツサの
データベースアクセス要1求を受付けるBEの役割(以
下分散クライアントと呼ぶ)を合わせて持つサブシステ
ムとして位置づけられる。従って、複合サブシステム形
オンラインシステムの一部に分散データベースY考える
ことも可能である。
第2図に、リカバリファイル4の構成を示す。
RF4は、サブシステム毎とコントローラ1用が存在し
サブシステム又はシステム全体が障害となった際の回復
用情報を格納する外部記憶の総称であり、チェックポイ
ントダンプな格納するチェックポイントファイル410
と、テーブル回復に使用するテーブルリカバリファイル
420と、トランザクション単位のジャーナルを退避す
るためのトランザクションリカバリファイル430から
成る。以下、チェックポイントファイルなCKPTFと
呼び、テーブルリカバリファイルをTBLRFと呼び、
トランザクシlンリカバリファイルをTRRFと呼ぶ。
第3図に資源管理テーブル6の構成を示す。資源管理テ
ーブル6は、各FE2ごとにキューイングされたトラン
ザクションノード610と、各BE3ごとにキューイン
グされた資源ノード620と、トランザクションと資源
の排他保持または待ち状態を示す資源排他ノード630
から成る。
トランザクションノード610は、トランザクションI
Dを格納しであるトランザクションID部611と次の
トランザクシランノードへのリンク612と資源排他ノ
ードへのリンク613から成る。資源ノード620は、
資源名の格納しである資源名部621と。
資源排他ノードへのリンク622と次の資源ノードへの
リンク623から成る。資源排他ノード630は、資源
名部631と同一資源に対して待ちをなしている次の資
源排他ノードへのリンク632と同一トランザクション
が保持又は、待っている次の資源に対する資源排他ノー
ドへのリンク633とトランザクションID部634と
、該資源排他ノード情報がジャーナルとして取得されて
いるか否かを示すフラグ635と、該資源排他ノード情
報は、資源を保持しているのか待っているのかを示すフ
ラグ636から成る。
あるトランプクシ1ンTR,が資源R8Iを保持してい
る場合、TR1とR2Hに対応するトランサクシ1ンノ
ード610と資源ノード620からリンク613とリン
ク622 Kて結合される資源排他ノード630が存在
し、排他保持か待ちかを示すフラグ636がオンになる
。さらに、該資源R8,を待つトランザクションTR2
が存在する場合、TR,とR81とリンクされている資
源排他ノードから次の資源排他ノードへのリンク632
が作成され、TR2との間にもリンク613が作成され
る。TR2からリンクされる資源排他ノードでは、排他
保持か待ちを示すフラグ636がオフとなる。該資源管
理テーブル6を用いると、リンク632 、6339t
たどることにより特定のトランザクシーンの保持する資
源一覧、又は特定の資源を保持しているトランサクシ1
フ名が得られる。各排他ノード中には、ジャーナル上に
排他ノード情報が退避されたか否かを示すフラグ635
を持つ。
資源管理テーブル6が、サブシステムを通してコントロ
ーラ1上に一本化されているので、サブ1システムダウ
ン時は、排他情報が保持できるだけでなく、サブシステ
ムをまたがったデッドロックの検出が容易となっている
第4図にトランザクション管理テーブル7の構成を示す
。トランザクション管理テーブルには、各FE2がある
時点で発生している全トランザクシ曹ンが登録される。
該テーブルには、トランザクシーンI D 701(該
テーブルのエントリ番号7011と同一エントリを使用
するたびにカウントアツプする通番7012から成る)
と、発生FE領領域02と、使用BE領領域03と、ト
ランザクシ曹ンステータス領域710ト、゛トランザク
ションの回復に必要となるジャーナルへのジャーナルポ
インタ720と、ジャーナルを格納するTRRF430
の最終ポインタ730と、資源管理テーブルの排他ノー
ド630へのポインタ740から成るエントリがトラン
ザクション単位に存在する。トランザクシ■ンステータ
ス領域710には、チェックポイントダンプ取得時の同
期用ピットすなわち影響ピット711と実行監視ピット
712及び、。
トランザクションの凍結制御用のトランザクシ曹ン凍結
要フラグ713とロールバック回復を行う必要があるこ
とを示すロールバック要フラグ714とトランザクショ
ンが同期点を通過したか否かを示す同期点フラグ715
とトランザクションが凍結中であることを示す凍結フラ
グ716とトランザクションが同期点準備を通過しかつ
同期点通過前であることを示す同期点準備通過フラグ7
17とからなる。。
第5図にシステムステータステーブル8の構成を示す。
システムステータステーブルには、コントローラ1の状
態810と各サブシステムの状態820と、システムの
チェックポイント時点のジャーナル通番記録領域815
から成る。
該システムステータステーブルは更新の都度5YSSF
へ対応エントリを書き出しておき、5YSSFに複写を
作ってお(。
本実施例で示す複合サブシステム形オンラインシステム
では、障害発生時の回復のために1種々の情報を外部記
憶装置に出力しながら業務処理を進めて行く。回復すべ
き資源(データ、情報の総称)は、大きく分けて、次の
2種類がある。
(1)仮想記憶装置上のテーブルの様に、障害発生時に
は消失してしまうタイプの揮発性資源(2)外部記憶装
置上のデータベースの様に、障害発生時にも、一般には
障害発生時点の状、態を保持したままとなるタイプの不
揮発性資源障害発生時点で消失する揮発性資源を回復す
るためには、定期的に該資源の複写を不揮発性の外部記
憶装置に作成しておく(該複写をチェックポイントダン
プと呼ぶ)。チェックポイントダンプ1得以降変更の都
度変更の差分情報をジャーナルとして取得しておき、チ
ェックポイントダンプに該ジャーナル情報を重畳するこ
とで回復が行える。・このタイプのジャーナルを履歴形
ジャーナルと呼ぶ。
障害発生時点の状態が保持される不揮発性資源を回復す
るKは、変更の都度ジャーナルを取得する。回復時には
、業務処理単位であるトランザクション毎に更新を完結
させるか、更新を無効にするかを判断し、変更都度取得
したジャーナルの変更後情報を重畳するか、変更前情報
を重畳するかで回復を行う。このタイプのジャーナルを
トランザクシ冒ン形ジャーナルと呼ぶ。
本実施例のシステムでは、障害回復に備えて。
データベース更新、テーブル更新に先立ってジャーナル
出力を行う。ジャーナル出力は、コントローラ配下の機
能を用いて、各サブシステムを統合して一つのJNLF
5に行う。JNLF5を統合することは、複合サブシス
テムを運転する際の操作性向上に大きく寄与する。ジャ
ーナル取得の方式を以下に説明する。
ジャーナルは、データベース更新、テーブル更新前に必
ず取得する。ジャーナル取得前に変更を行うと、変更後
、ジャーナル取得前に障害が発生した場合に回復できな
くなる。
トランザクションの終了に際して、該トランザクション
の全ジャーナルを出力した後に、全ジャーナルが出力源
すなわち同期点を示すジャーナル(以下同期点ジャーナ
ルと呼ぶ)を出力する。
該同期点ジャーナルがジャーナルとして存在するトラン
ザクションでは、不揮発性費源の回復に必要となるすべ
てのトランザクシーン形ジャーナルが存在するため、該
トランザクションの処理を完結させる方向の回復が行え
る。それに対し、同期点ジャーナルが存在しないトラン
ザクションでは、全ジャーナルが出力されている保証は
ないが、変更前には必ずジャーナルを出力しているため
、存在するジャーナルの変更前情報を用いて、該トラン
サクシ1ンを無効とする方向の回復が行える。
トランザクションが完結した後に、トランザクション終
了を示すジャーナルを取得する。該終了を示すジャーナ
ルを終了ジャーナルと呼ぶ。該ジャーナルが出力された
後は、トランザクシーン形ジャーナルによる回復は不要
となる。
分散データベースの場合には、一つのトランザクション
が自システム内のデータベースと他プロセツサ内のデー
タベースを更新するため、プロセッサ間にまたがってデ
ータベース更新の同期が必要となる。分散データベース
の場合のジャーナル取得の方式を以下に説明する。
トランザクションの終了に際して、まず分散クライアン
ト側の全ジャーナルが出力される。この時点で分散クラ
イアント側から分散サーバ側に全ジャーナルの出力指示
(以下、これを同期点孕備指示と呼ぶ)を行う。分散サ
ーバ側では該指示を受は全ジャーナルの出力後に同期点
準備が完了したことを示すジャーナル(以下、これを同
期点準備ジャーナルと呼ぶ)を出力する。該ジャーナル
の出力完了後、分散サーバは分散クライアントに同期点
準備の完了を報告する。分散クライアント側では、該ト
ランザクションの自システム内の全ジャーナルの出力、
及び要求を出した全ての他プロセツサの分散サーバから
同期点準備完了報告を受けた後、同期点ジャーナルを出
力する。同期点ジャーナルの出力が完了した後、分散ク
ライアントは自システム内のデータベースの更新を行い
、分散サーバに対し該トランザクションがFI期点に達
した旨の指示(以下、これを同期点指示と呼ぶ)を行う
。分散サーバは、同期点指示を受けると、まず同期点ジ
ャーナルを出力した後、バッファ上に残る該トランザク
シーンのデータベース更新ヲ完了さる。その後終了ジャ
ーナルを出力し、出力が完了後、分散クライアントにト
ランザクシーン完了を報告する。分散クライアント側で
は、自システム内のデータベースの更新、及び指示を出
した全ての分散サーバから完了報告を受けた後、終了ジ
ャーナルを出力する。
分散クライアント側では、同期点ジャーナルが存在すれ
ば、該トランザクションを有効とする方向の回復を行い
、なければ無効とする方向の回復を行うことができる。
分散サーバ側では、同期点準備ジャーナルと同期点ジャ
ーナルが存在すれば、該トランザクシーンを有効とする
方向の回復を行い、同期点ジャーナル及び同期点準備ジ
ャーナルのいずれも存在しない場合には、該トランザク
シーンを無効とする方向の回復を行う。同期点準備ジャ
ーナルだけが存在する場合には、会期クライアント側の
同期点ジャーナルの有無を調べ、それに従えば回復を行
うことができる。
なお、該プロセッサ内で独自のジャーナルファイルを持
ちジャーナルを取得する従来形オンラインシステムを複
合サブシステム形オンラインシステムに接続し、該オン
ラインシステム下で実行するトランザクションから、複
合サブシステム形オンラインのBEのデータベースを更
新する場合、該オンラインシステムを分散サーバと同様
の一つのFEとして扱い、前述のジャーナル取得方式を
用いることにより該オンラインシステム内のデータベー
ス更新と複合サブシステム形オンラインシステムのBH
のデータベース更新の同期をとった回復ができる。
本実施例では、回復すべきテーブルを定期的にチェック
ポイントダンプとしてサブシステム毎に取得し、同時点
にてトランサクシ1ン形ジャーナルなTRRFに退避す
る。各情報取得の方式を以下に説明する。
第6図、第7図、第8図にチェックポイントダンプ取得
の概念と取得の流れ図を示す。
第6図に示すように、各サブシステム2.3は。
定期的に仮想記憶装置上のチェックポイント対象テーブ
ル411の内容なCK P T F 410へ格納する
チェックポイントダンプ格納中にCK P T F 4
10に障害が発生しても回復が行える様KCKPTF4
10は世代管理な行う。システムの障害発生後の回復時
には、最新世代のCK P T F 410上の情報と
、JNLF5に格納されているチェックポイント時点以
降の更新情報を重畳して行くことにより、テーブルが回
復できる。チェックポイントダンプな定期的に取得する
ことは、障害発生後の回復時に必要となるジャーナル情
報を限定することになり、回復時に入力するジャーナル
量の削減と回復時間の短縮化の効果がある。
チェックポイントダンプ取得は、各サブシステムで行う
が、この際、当該サブシステムを使用する業務処理を停
止させない。このため、更新中のテーブルをチェックポ
イントダンプとして取得する可能性がある。更新中のテ
ーブル情報をチェックポイントダンプに取得しても、該
更新に対応するジャーナルがチェックポイント時点以降
に取得されていれば、チェックポイントダンプ取得完了
後は、チェックポイント時点以前の履歴形ジャーナル情
報を必要としない。
テーブルの更新と対応するジャーナル取得が完了するタ
イミング41(Mは、トランザクシランごとにまちまち
であり同期していない。またチェックポイントダンプ取
得にも有限の時間がかかる。このため、チェックポイン
トダンプは、第7図に示すようにチェックポイント時点
410αとチェックポイントダンプ取得開始時点410
h 、取得終了時点410C1及びチェックポイントダ
ンプ有効時点410dの4つの時点を分けて取得する。
チェックポイントダンプを取得する必要が発生すると、
まずチェックポイント時点410αの宣言を行う。該時
点で更新中のテーブル情報に対応するジャーナルは、チ
ェックポイント時点410α以前に取得されている可能
性があるのでまだチェックポイントダンプ取得を開始で
きない。そこで、チェックポイント時点410αで更新
中の処理がすべて更新処理を完了した時点まで待ち、完
了後チェックポイントダンプ取得開始を行う。チェック
ポイントダンプ取得が完了しても、まだ更新に対応する
ジャーナルが出力されていない可能性があるので、チェ
ックポイントダンプ取得終了時点410Cに更新中の処
理に対応するジャーナルがすべて出力された時点まで待
ち、出力完了後、チェックポイントダンプ有効時点41
0dとする。チェックポイントダンプ有効時点410d
を経過する以前に障害が発生した場合には、当該チェッ
クポイントダンプは使用せず、−世代前のチェックポイ
ントダンプによる回復を行う。
本実施例では、第8図に示す流れに従ってチェックポイ
ントダンプを取得する。まず、コントローラ1は、一定
のジャーナル出力件数に到達するとチェックポイントダ
ンプ取得タスク412を起動する。起動されたタスク4
12は、チェックポイント時点の宣言を行い、この時点
でのジャーナル通番をコントローラの管理する仮想記憶
上にチェックポイント時点ジャーナル通番815として
記憶しチェックポイント取得開始待ちとなる。チェック
ポイント取得開始が可能となると、各サブシステムにチ
ェックポイントダンプ取得指示を行う。各サブシステム
は、チェックポイントダンプ取得指示に従い、チェック
ポイントダンプな各サブシステムのCK P T F 
410に取得する。取得が完了するとコントローラに取
得完了報告を行う。コントローラは、各サブシステムの
取得完了報告を確認した後、チェックポイントダンプ有
効化待ちとなる。
チェックポイントダンプ有効化か可能となると、当該C
K P T F 410と5YSSF9に有効ビットを
記録して、チェックポイントダンプ取得を終了し、次の
取得タイミングまで待ちとなる。
ここで、チェックポイントダンプ取得開始待ちと、チェ
ックポイントダンプ有効化待ちは、同一の方式を用いる
。本方式を第9図を用いて説明する。
第8α図において、各トランザクションは、チェックポ
イント対象となっているテーブル更新を含む機能を使用
する際には、トランザクション管理たプル7上の影響フ
ラグ711をオンにし、機能使用終了時に影響フラグ7
11及び実行監視フラグ712をオフにする。本フラグ
操作は、処理ルーチンへ渡る際の共通ルーチンにて行う
。なお共通ルーチンを経由しない場合、各サブシステム
の処理で開始、終了を宣言する方式をとればよい。
第10図においてコントローラ内のチェックポイントダ
ンプ取得タスク412でチェックポイントダンプ開始待
ち又は、有効化待ちを開始するには、トランザクシ冨ン
管理テーブル7上の全トランザクシ1ンについて影響フ
ラグ711がオンであれば実行監視フラグ712をオン
にする。その後タイマで待ち、起動されるたびにすべて
の実行監視フラグ712がオフになっているかどうかを
チェックする。すべての実行監視フラグ712がオフに
なればζ待ちを開始する時点にテーブル更新を含む処理
がすべて終了した事になる。
チェックポイントダンプ出力時には、後述するジャーナ
ルポインタ情報の退避や、資源管理テーブルの論理情報
の退避を行い、チェックポイント時点以前のジャーナル
情報や資源管理情報がな(ても、回復ができるようにす
る。また、トランプクシ1ン管理テーブルは、チェック
ポイントダンプ対象テーブルとなっており1回復ができ
る。資源管理テーブルの論理情報の退避は、第11図に
示す資源管理論理情報テーブル750という形式にして
行う。該論理情報テーブルは資源管理テーブル中の全資
源に対し、該資源を保持しているトランザクションのト
ランザクシーンID701&第3図に示す資源管理テー
ブル6の資源ノード620から資源排他ノードへのリン
ク622をたどることにより資源排他ノード630 ?
:求め資源名751とトランザクションI D 752
をペアにして格納することで一作成する。この時出力す
べきペアは、チェックポイント時点以前に資源保持情報
をジャーナルに出力したものであり、チェックポイント
時点以降の資源保持情報は、後述する様にジャーナルか
ら回復する。
ジャーナルを外部記憶装置上のJNLF5に出力する除
、出力するバッファ上に存在する全てのトランザクシ置
ン形ジャーナルについて、第12図に示す形式のジャー
ナルポインタ720を作成しトランザクシーン管理テー
ブルの該当トランザクシ曹ンエントリに退避する。該ポ
インタ720は、ジャーナルの通番721とJNLF5
のファイル名722及びファイルの先頭からの相対ブロ
ック番号723から成り、該ポインタを用いるととによ
り、必要な時点に当該トランザク1.シーンで出力した
ジャーナルを得ることができる。障害発生時、コントロ
ーラ1がダウンしていなければ、トランザクシ薗ン回復
時には、該ジャーナルポインタでダイレクトにジャーナ
ルを得ることができる。
チェックポイントダンプ出力時には、チェツク1インド
ダンプ有効時点410dの時点で存在するトランザクシ
ョンに関して、有効化に先だち、ジャーナルポインタ7
20を用いてジャーナルをJNLF5から読み出し、ト
ランザクションリカバリファイル430へ退避しておく
。退避すべきか否かは、トランザクシ■ンテーブル7中
のジャーナルポインタ720にあるジャーナル通番72
1を参照し、チェックポイント時点410αのジャール
通番815より以前の番号であれば、退避を行い、以降
であればチェックポイント時点以降のJNLFS中に存
在するジ1ヤーナルなので退避しない。
本実施例では、トランザクションの開始に先立ち、各ト
ランザクションK T RRF 430の一定領域を割
り当てる。
退避を行つ場合、−世代前のチェックポイント時点に退
避したT RRF 430中の情報を失うことのないよ
うに、トランザクシ總ンテーブル7中のTRRF最終ポ
インタ730から追加書きを行う。
ここでTRRF最終ポインタ730は、トランザクショ
ン発生時に該トランザクションに割り当てたTRRF中
の領域の先頭を指し、以降ジャーナル退避を行う都度更
新して、常にTRRF中の該トランザクシーンに割り当
てた領域の最終を指すポインタである。
ジャーナル情報をTRRF430に退避することにより
、チェックポイントダンプ取得以降は、チェックポイン
ト時点以前から長期化しているトランザクシ習ンの回復
にもチェックポイント時点以前のジャーナルは不要とな
る。T RRF 430は、トランザクション単位のエ
ントリに整理されているので、トランザクション単位の
回復時にも該T RRF 430とチェックポイント時
点以降のジャーナルで回復に必要なデータが容易にそろ
う。
さらに、トランザクシ曽ン形ジャーナル出力時には、資
源保持情報も同時に出力する。これは、トランザクシ璽
ン形ジャーナルを出力する際に、当該トランザクシ側ン
の保有している資源を、資源管理テーブル6のトランザ
クシーンノード610から資源排他ノード630をたど
ることにより求め、該資源保持情報を第11図に示す資
源管理論理情報のエントリと同様の形式でトランザクシ
璽ン形ジャーナルに付加して出力することで行う。
障害発生後の回復時には、CK P T F 410中
のチェックポイントダンプとして保持されていた資源管
理論理情報テーブルとトランザクシーン形ジャーナルと
共にJNLF 5に出力した資源保持情報から資源確保
処理をくり返すことにより資源管理テーブルが回復でき
る。このため、データベースを全面閉塞すなわち、デー
タベースに対するアクセスを全面禁止するのではなく限
定した範囲(使用していた部分だけ)を閉塞すれば済み
、一部サブシステムがダウンしていたり、一部トランザ
クシ菖ンの決着がつかない場合にも、オンラインシステ
ムを立上げることができる。
複合サブシステム形オンラインシステム全体が障害とな
った時の回復を全面回復と呼び、特定のサブシステムだ
けが障害となった際の回復をサブシステム回復と呼ぶ。
以下、複合サブシステム形オンラインシステムの全面回
復、サブシステム回復について説明する。
第1に、複合サブシステム形オンラインシステムの全面
回復の流れを第13図から第17図を用いて説明する。
全面回復では、まずコントローラ1の機能を回復する。
その後各サブシステムの回復を行うが一部のサブシステ
ム機能が回復できなくても当該機能を縮退したままシス
テムを再開できる。
コントローラ1の機能回復は、まず5YSSF9からコ
ントローラ用CK P T F 410を決め、該CK
 P T F 410からコントローラ内のトランザク
シーン管理テーブル7を回復する。又、資源管理論理情
報テーブル750も回復する。なお、コントローラ用C
K P T F 410を読むことにより、現在の最新
チェックポイント時点のジャーナル通番及び該ジャーナ
ル通番のジャーナルに対するジャーナルポインタ815
が決まる。
次に、第14図に示すように最新チェックポイント時点
のジャーナルポインタ815で指す位置からJNLF5
を順に読む。読み出されたジャーナルは、コントローラ
の出力した履歴形ジャーナルであれば、第15図の流れ
に従いトランザクシ璽ン管1テーブル7や、資源管理論
理情報テーブル750更新情報として使用し、各テーブ
ルを障害発生時点の状態に回復して行(。コントローラ
以外が出力した履歴形ジャーナルは、出力サブシステム
のT B L RF 420へ出力する。トランザクシ
ーン形ジャーナルの場合は、トランザクシ書ン管理テー
ブル7の該当するトランザクシロンエントリのジャーナ
ルポインタ720の領域にジャーナルポインタ形式で格
納して行く。トランザクシ目ン管理シブルアの各トラン
ザクシロンのエントリは、同期1点ジャーナルが見つか
れば同期点通過ステータスを同期点通過フラグ715を
オンにすることで記録し終了ジャーナルが見つかれば、
該エントリを削除する。
分散データベースの分散サーバ側のよ5に同期点準備ジ
ャーナルが存在する場合、同期点準備ジャーナルが見つ
かれば、まず同期点準備通過フラグ717をオンにする
ことで同期点準備状態であることを記録する。同期点ジ
ャーナルが見つかれば、同期点準備通過フラグ717を
オフにし、同期点通過フラグ715をオンにする。終了
ジャーナルが見つかれば、該エントリを削除する。
ジャーナル読み込みが完了した時点では、各サブシステ
ムの履歴形ジャーナルは、サブシステムごとのT B 
L RF 420に分類されて出力されである。トラン
ザクション管理テーブル7は、障害発生時点まで回復さ
れており、障害発生時点で存在したトランザクシーンだ
けが登録されである。この時点でトランザクション管理
テーブル7中の全トランザクシランの凍結要フラグをオ
ンにしておく各トランザクションごとのエントリは、ジ
ャーナルポインタ720領域を含めて回復されである。
資源管理論理情報についても、最新のチェックポイント
時点の状態と、それ以降の更新情報がすべてそろってい
る。ジャーナルの読み込みが完了すると、資源管理論理
情報をもとに、資源確保。
解放操作をくり返すことによって資源管理テーブル6を
回復する。さらに回復された資源管理テーブルの全排他
ノード630について凍結状態にする。
凍結状態になった資源に対して新たに資源確保な行うと
、凍結状態のため、排他ノード630を作ることなせず
に、資源確保要求が失敗する。従って資源管理テーブル
を凍結状態にすることで、障害発生時に使用していた資
源を一時的に使用禁止状態にすることができ、新たなト
ランザクシーンが発生しても、使用可能な資源だけで動
作できるならば、実行ができ使用不可の資源を必要とす
るならばエラーとして扱われ長時間待つことがない。
すなわち、資源管理テーブル6の回復と凍結が済んだ時
点でコントローラ1としての回復は終了する。この時点
で、システムレディのメツセージを出力するがまだサブ
システムが回復されていないので、複合サブシステム型
オンラインシステム全体としては、動作を開始しない。
なお、資源の凍結は、後で述べる決着で失敗した時点で
始めて行う方法もある。この場合、同一資源にアクセス
するトランサクシ1ンは待ちになるが、決着が終るまで
待つだけなので障害の影響を小さくできる。
次に、サブシステムの回復を始める。各サブシステムは
、コントローラ1の指示で並行して回復処理を行う。各
サブシステムの回復は、TBLRF 420に格納され
ている履歴形ジャーナルをもとに、サブシステム内の回
復対象テーブルを回復することで終る。この時点で、複
合サブシステム形オンラインシステムは動作を開始する
。なお、一部のサブシステムが回復に失敗した場合には
該サブシステムだけが縮退した状態となる。この時点で
も、障害発生時点で動作中のトランザクシーンは回復さ
れていないが、これらのトランザクシーンはすべて凍結
要となっており、後で述べるトランザクシーンの凍結決
着処理にて回復する。新しく発生したトランザクシーン
は、そのまま実行される。
各サブシステムへの回復指示を出した後、サブシステム
における回復と並行してコントローラ1では、トランザ
クション管理テーブル7に存在する凍結要フラグがオン
となっている全トランザクシーンがアクセスしていた資
源(一般にはデータベース)をすべて回復する。そこで
、コントローラlは、トランザクションの回復のための
処理を開始する。これを凍結決着処理と呼ぶ。凍結決着
処理の流れを第16図に示す。
凍結決着処理では、まず、凍結要となっているトランザ
クションの凍結処理を行う。ここで、トランザクシーン
を凍結状態にするとは、該トランザクシーンを終了させ
ずに一時的に停止させることであり、このために回復に
必要な情報を保存する。
トランザクシーンの凍結処理では、第16図に示すよう
にトランザクション管理テーブル7のジャーナルポイン
タ720をもとに、該トランザクションのもとで出力し
たジャーナルなJNLF5から読み出す。読み出したジ
ャーナルは、チェックポイントダンプ出力時と同様に、
トランザクシ■ン管理テーブル7のTRRF最終ポイン
タ730の位置から追加書きでT RRF 430に書
き込んで行く。
該トランザクシーンのジャーナルポインタ720に関し
て、すべてのジャーナルをT RRF 430へ退避し
た時点で、該トランザクシーンの凍結処理が完了し、凍
結要フラグをオフとし、凍結フラグをオンとする。トラ
ンザクションが凍結されると、該トランザクションの回
復に必要となるすべてのジャーナルがT RRF 43
0中に格納されたことくなる。これは、最新のチェック
ポイント時点以前に出力された該トランザクションのジ
ャーナルは、チェックポイント時点にTRRF430に
退避済であり、チェックポイント時点以降のジャーナル
は、ジャーナルポインタ720を用いて凍結処理でTR
RF430に退避したためである。
凍結状態になったトランザクションすなわち、凍結フラ
グがオンとなっているトランザクションは、コントロー
ラ1が定期的にトランザクション管理テーブル7から選
択し、該トランザクションの保持する資源を回復する。
資源の回復は、同期点ジャーナルの有無により決める。
同期点ジャーナルが存在すれば、すなわち同期点通過フ
ラグ715がオンであれば、ジャーナルをもとく更新を
完結させる。これをロールフォワードと呼ぶ。同期点ジ
ャーナルが存在しなければ、すなわち同期点通過フラグ
715がオフであれば、トランザクションでの更新を無
効とし、更新源の部分はジャーナルをもとに以前の状態
に戻す。これをロールバックト呼ぶ。ロールフォワード
とロールバック処31を合わせて資源の決着、またはト
ランザクシーンの決着と呼ぶ。
決着処理は、第16図に示す様に、まず、トランザクシ
ョン管理テーブル7中の凍結フラグ716がオンとなっ
ているトランザクションを一つ選択し、該トランザクシ
ョンの状態をトランザクション管理テーブル7中の同期
点通過フラグ715でチェックする。同期点を通過して
いれば、ロールフォワード処理を行い、同期点通過以前
であれば、ロールバッp処理pt行う。ロールフォワー
ド、ロールバックは、該トランザクションの使用BE3
をトランザクション管理テーブル7の使用B E 70
3から決め、全便用BEに対してロールフォワード、ロ
ールバックを指示することで行う。指示を行うには、事
前にT RRF 430を読み、該トランザクションの
該BEに関連するジャーナルをテーブルとじて仮想記憶
上九作成し、該BEに引き渡す、BE3は、BE自身の
回復が済みBE機能が回復していれば、渡されたジャー
ナルをもとに資源の決着を行う。回復が済めば、凍結さ
れていた該資源の排他ノードを解放し、資源を解放し、
凍結フラグ716をオフにする。BE自身の回復が完了
していない、若しくは回復できない場合は、該トランザ
クシーンを凍結したままとする。従って、障害回復ので
きないBEによって回復処理が終了しない場合でも、回
復できない範囲を該BEのデータベースを更新したトラ
ンザクシーン群だけに限定することができる。
一つのトランザクションで複数BHのデータベースを更
新した場合の決着処理を図17に示す。複数BHのデー
タベースを更新した場合、T RRF 430から入力
したジャーナルを渡すべきBE3が障害中であれば、該
ジャーナルとばしTRRF430中の残りのジャーナル
について処理を続ける。TRRF430中のジャーナル
終了後、BE3が障害中のためとばしたジャーナルがあ
れば、該BE3を除き処理済となったBE3についての
部分的終了ジャーナルを出力し、決着源BEに対応する
資源を解放し、該トランザクションは凍結状態のまま托
しておく。処理済となったBE3については、トランザ
クシ鍔ン管理テーブル中の使用BEエントリーに処理済
であることを記録しておく。次に決着処理が実行される
場合には、T RRF 430から入力されたジャーナ
ルが既に処理済BE3のジャーナルであれば読みとばす
。従って、一つのトランザクシーンが複数BEのデータ
ベースを更新した場合の一部BEが障害中の回復処理で
は、該トランプクシ1ン全体ではなく、該トランザクシ
ーンの障害中BEについての回復が保留されるだけであ
り、回復可能なりEについての回復処理を完了すること
Kよって1回復できない範囲を最小限にすることができ
る。
分散データベースの分散サーバ側の場合、該サブシステ
ムはFE2に相当し、同期点通過以前の状態が更に、同
期点準備状態と同期点準備以前の状態に分けられる。同
期点準備以前の状態であれば、ロールバック処理を行い
、同期点通過後の状態であれば、ロールフォワード処理
を行う。同期点準備状態の場合、分散データベースの分
散サーバから当該トランザクシランを発生させた分散ク
ライアントに問い合わせを行い、分散クライアント側の
対応するトランザクシランが同期点通過後であればロー
ルフォワード処理を行い、同期点通過以前であればロー
ルバック処理を行う。分散サーバから問い合わすべき相
手の分散クライアントとトランザクシ茜ンの識別情報は
、分散サーバ側でのトランサクシ1ン発生時点にトラン
ザクシ習ン管理テーブルの発生FEエントリ702に記
録してお(。
自システム内の分散データベースサブシステムが障害中
、又は他プロセツサ側が障害中の場合、同期点準備状態
のトランサクシ1ンのみが決着できずに残されるが、他
のトランザクシランは、図16、図17の流れに従い決
着する。
一方分散データベースの分散クライアント側の場合該サ
ブシステムはBE3に相当する。図170流れにおいて
、コントローラ1は、トランザクシ曹ン管理テーブル中
の使用BEエントリ703に、分散クライアントが記録
されていたならば、各BE3へのジャーナル渡し処理時
に分散クライアントに対し、ロールバック、又はロール
フォワードの指示を出す。分散クライアントは、該指示
を分散サーバ側に送る。分散サーバ側では、指示を受け
たトランザクシランが同期点準備状態であれば、ロール
フォワード指示の場合は同期点通過状態圧する。ロール
バック指示の場合は同期点準備状態状懇にし、各々該当
する決着処理を行う。
なお、分散サーバ側のトランザクシランから。
更に他プロセツサの分散データベースに対する要求が出
された場合には、該トランザクシランの一つのBEとし
て該システム上の分散クライアントを使用した場合に対
応ずげるだけで同機に扱うことができる。
第2に、サブシステム障害の回復について、第18図を
用いて説明する。
U合すブシステム形オンラインシステムでは。
サブシステム内に障害が発生した場合には、該サブシス
テムだけを障害扱いとし、サブシステム回復を行う。サ
ブシステム回復方式は、FE2とBE3で異なる。
FE2に障害が発生した時の回復では、該サブシステム
の機能の回復と該サブシステム下で生成した全トランザ
クシ雪ンを回復する必要がある。
サブシステムのみ障害の場合、コントローラ1の持つト
ランザクシ冒ン管理テーブル7はそのまま仮想記憶装置
上に存在するので、該サブシステムの異常終了時に呼び
出されるルーチンの中で、トランザクシ曹ン管理テーブ
ル7の発生FE領領域02を参照して該サブシステムの
発生させた全トランザクシ冒ンについて凍結要フラグ7
13をオンにしておく。ここで、障害となったFE2が
発生させたトランザクシランは、トランザクシ■ン管理
テーブル7中の発生トランザクシ■ン領域702を参照
することで限定している。このため、該FEの障害は、
該FEの発生させたトランザクシランに限定でき、他F
Eの発生させたトランザクシランに対しては影響なく業
務処理が遂行できる。サブシステムダウンをコントロー
ラが検出するとコントローラ1は、全面ダウン時と同様
に、JNLF5を最新チェックポイント時点から順次読
み出し、該障害発生サブシステムに関連する履歴形ジャ
ーナルを該サブシステムのT B L RF 420に
格納する。その後、コントローラ1は該サブシステムを
再起動し、起動後肢サブシステムに回復指示を出す。回
復指示を受けたサブシステムは、CKPTF410 ト
T B L RF 420をもとに該サブシステムの機
能回復を行う。
該サブシステムの機能回復と並行して、コントローラ1
は、トランザクシ■ン管理テーブル7の凍結要フラグ7
13がオンの全トランザクシ箇ンについて、全面回復時
と同様に第16図の流れに従いすべて凍結し、決着を行
う。資源管理テーブル6は、コントローラlが管理して
いるため、サブシステム障害1圓復時にも有効のままな
ので、障害発生FE2は、該サブシステム機能の回復が
済めば、コントローラ1のトランザクシ層ンi結、決着
を待つことなく、新しいトランザクシ璽ンの処理を開始
できる。
BE 3に障害が発生した時の回りでは、該サブシステ
ムの機能回復と、該BEを使用して一二だトランザクシ
ーンの回復を行う必要がある。FE2障害時同様、トラ
ンザクシーン管理テーブルは仮想記憶装置上に存在する
ので、該BE3の異常終了時に呼び出されるルーチンの
中で、トランサクシ1ン管理テーブル7の使用BE領域
703領域を参照して、該BEを使用していた全トラン
ザクシーンについて、ロールパック要フラグ714をオ
ンにしておく。ここで、障害発生となったBE3を使用
したトランザクシーンをトランザクシーン管理テーブル
7の使用BE領領域03で限定しているため、該BEの
障害は、該BEを実際に使用しているトランザクシーン
に限定でき、他BEだけを使用しているトランザクシー
ンに対しては、影響なく業務処理が遂行できる。
さらに、該BE3の管理していた資源は、該BE3の障
害回復が終了するまで解放できないので資源凍結を行う
必要がある。資源の凍結は、該BE2の異常終了時に呼
び出されるルーチンの中で資源管理テーブル6中の該B
E3に継がる全資源ノード630について行う。資源凍
結は、障害発生時には単に凍結型としておき、BE回復
、トランサクシ1ン決着が−通り済むまで遅延させる方
式も考えられる。これKより、同一資源を要求している
他トランザクシ冒ンはエラーリターンではなく、一時的
に待ちを行い、該資源を保持しているトランザクシラン
が正常に決着されれば、障害はなかったものとして処理
が継続できることになる。
サブシステムダウンをコントローラ1が検出すると、コ
ントローラ1は、FE2障害時と同様にJNLF5から
T B L RF 420を作成する。その後、コント
ローラ1は、該BE3を再起動し、起動後、障害発生B
E3に回復指示を行う。回復指示を受けたBEは、CK
 P T F 410とTBLRF420をもとに該B
Eの機能回復を行う。ただし、BEの種類によっては、
CK P T F 410やTBLRF420を必要と
しない。この場合は、コントローラlは、JNLF5を
読まずに単に回復指示を出し、該BEは機能回復を行う
該サブシステムの機能回復を待ち、コントローラ1は、
トランザクシーン管理テーブル7のロールバック要フラ
グ714がオンの全トランザクシ璽ンについて、全面回
復時と同様に第16図の流れに従いすべて凍結し、ロー
ルバック方向の決着を行う。
以上サブシステムの障害回復で示した様にトランザクシ
ーン管理テーブル7の発生FE領域702及ヒ使用BE
領域703を用いてサブシステム障害の影響を特定のト
ランザクシーンに限定している。
本機構のため、一部サブシステム障害時でも他のサブシ
ステムの処理は正常に遂行できることとなり、複合サブ
システム形オンラインシステムの運転を続行できること
Kなる。また、RF4を持つことで、障害となったサブ
システムは、他サブシステムの処理が先に進む事に影響
されずに遅延しながらも回復し、他サブシステムに影響
することな(合流することができる。
第3VC1業務処理プログラムに障害が発生し。
実行中のトランザクシ厘ンが異常終了した場合には、異
常終了時に呼び出されるルーチンにて、該トランサクシ
1ンの凍結型フラグ713をオンにしておく。これによ
り、全面ダウン時と同様にコントローラ1が該トランザ
クシーンの凍結、決着ヲ行う。業務処理プログラムは、
FE2によって再度起動されることで、機能を回復する
【図面の簡単な説明】
第1図は複合サブシステム形オンラインシステムの全体
構成図、第2図はりカバリファイルの構成図、第3図は
資源管理テーブルの構成図、第4図はトランザクシーン
管理テーブルの構成図、第5図はシステムステータステ
ーブルの構成図、第6図はチェックポイントダンプ取得
の概念図、第7図はチェックポイントダンプ取得のタイ
ミング図、第8図はチェックポイントダンプ取得の流れ
図、第9図はチェックポイントダンプ有効化方式の流れ
図、第10図はチェックポイントダンプ取得における待
ち処理の流れ図、第11図は資源管理論理情報テーブル
の構成図、第12図はジャーナルポインタの概念及び構
成図、第13図は全面回復の流れ図、第14図はジャー
ナル回復の流れ図、第15図はコントローラのジャーナ
ル回復の流れ図、第16図はトランザクシ曹ン凍結/決
着の流れ図、第17図は一つのトランザクシ厘ンが複数
BE更新時の決着の流れ図、第18図はサブシステム障
害回復の流れ図である。 1・・・複合サブシステムコントローラ、2・・・フロ
ントエンドサブシステム、3・・・バックエンドサブシ
ステム、 4・・・リカバリファイル、 5・・ジャーナルファイル、 6・・・資源管理テーブル。 7・・・トランザクシ習ン管理テーブル。 8・・・システムステータステーブル、9・・・システ
ムステータスファイル。 10・・・オンライン端末、11・・・データベース、
410・・・チェックポイントファイル、411・・・
チェックポイント対象テーブル。 410α・・・チェックポイント時点。 410h・・・チェックポイント取得開始、410C・
・・チェックポイント取得終了、410d・・・チェッ
クポイント有効時点。 410C・・・テーブル更新と対応するジャーナル取得
が完了するタイミング、 412・・・チェックポイントダンプ取得タスク。 420・・・テーブルリカバリファイル、430・・・
トランザクシ覆ンリカバリファイル。 610・・・トランザクシ璽ンノード、611・・・ト
ランザクシ璽ンID部、612・・・次トランザクシ厘
ンノードへのIJ 7り。 613・・・資源排他ノードへのリンク、620・・・
資源ノード、   621・・・資源名部、622・・
・資源排他ノードへのリンク、623・・・次資源ノー
ドへのリンク、630・・・資源排他ノード、631・
・・資源名部、632・・・同一資源に対して待ちをし
ている次資源排他ノードへのリンク。 633・・・同一トランザクシーンが保持又は待ってい
る次の資源排他ノードへのリンク、 634・・・トランザクシ■ンIDi、635・・・本
資源排他ノード情報がジャーナルとして取得されている
か否かを示すフラグ、 636・・・本資源排他ノード情報は資源を保持してい
るのか、待っているのかを示すフラグ、701・・・ト
ランザクシ■ンID領域、702・・・発生フロントエ
ンドサブシステム領域、703・・・使用バックエンド
サブシステム領域。 710・・・ステータスフラグ領域、 711・・・影響フラグ、   712・・・実行監視
フラグ、713・・・凍結要フラグ、 714・・・ロールバック要フラグ、 715・・・同期点通過フラグ、 716・・・凍結フラグ、 717・・・同期点準備通過フラグ、 720・・・ジャーナルポインタ領域、721・・・ジ
ャーナル通番、 722・・・ジャーナルファイル名、 723・・・相対ブロック番号、 730・・・TRRF最終ポインタ領域、740・・・
資源管理テーブルへのポインタ、750・・・資源管理
論理情報テーブル、751・・・資源名領域、 752・・・トランザクシ■ンID領域、810・・・
システムの状態領域。 815・・・チェックポイント時点のジャーナルポイン
タ領域、 820・・・サブシステムの状態領域、7011・・・
エントリ番号、 7012・・・通番。 −へ・、 代理人弁理士 小 川 勝 男叉−′ 第 1 回 第 2 図 牛 第 + 図 り 高 57 第6図 2.3 第 7 @ 410a   410b   410c   4fOd
葛 F3  図 篤9図 ; σD 第 lO図 易 !1  図 i /Z図 名 13  図 発 !4− 図 第 I5  図 鳥 16  図 名 17  図 箒 18  図

Claims (1)

    【特許請求の範囲】
  1. 複数のデータコミュンケーションシステムやデータベー
    スシステムをサブシステムとして持ち、各サブシステム
    を統合制御する複合サブシステムコントローラが存在し
    、障害回復用のサブシステム共用のジャーナルファイル
    にジャーナルを取得し、チェックポイント用ファイルに
    定期的にチェックポイント情報を取得する複合サブシス
    テム形オンラインシステムにおいて、ジャーナル情報を
    退避するためのジャーナル退避用ファイルを設けること
    により、一部サブシステム障害発生時にも他サブシステ
    ムの運転を続行し、障害サブシステムの立上がり遅れ時
    にも容易に障害回復が行えることを特徴とする複合サブ
    システム形オンラインシステムの障害回復方式。
JP62095103A 1987-04-20 1987-04-20 複合サブシステム形オンラインシステム Expired - Lifetime JPH0833859B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP62095103A JPH0833859B2 (ja) 1987-04-20 1987-04-20 複合サブシステム形オンラインシステム
US07/184,075 US5065311A (en) 1987-04-20 1988-04-20 Distributed data base system of composite subsystem type, and method fault recovery for the system
US07/701,816 US5333314A (en) 1987-04-20 1991-05-17 Distributed data base system of composite subsystem type, and method of fault recovery for the system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62095103A JPH0833859B2 (ja) 1987-04-20 1987-04-20 複合サブシステム形オンラインシステム

Publications (2)

Publication Number Publication Date
JPS63261437A true JPS63261437A (ja) 1988-10-28
JPH0833859B2 JPH0833859B2 (ja) 1996-03-29

Family

ID=14128536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62095103A Expired - Lifetime JPH0833859B2 (ja) 1987-04-20 1987-04-20 複合サブシステム形オンラインシステム

Country Status (1)

Country Link
JP (1) JPH0833859B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04230553A (ja) * 1991-01-07 1992-08-19 Nec Corp ファイル転送誤り回復方法
JPH052563A (ja) * 1991-06-26 1993-01-08 Hitachi Ltd 複数オンラインシステムの履歴フアイル共用方式
JP2008226227A (ja) * 2007-03-12 2008-09-25 Hitachi Ltd アプリケーション情報に基づくボリューム間の整合性を管理するためのシステムおよび方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04230553A (ja) * 1991-01-07 1992-08-19 Nec Corp ファイル転送誤り回復方法
JPH052563A (ja) * 1991-06-26 1993-01-08 Hitachi Ltd 複数オンラインシステムの履歴フアイル共用方式
JP2008226227A (ja) * 2007-03-12 2008-09-25 Hitachi Ltd アプリケーション情報に基づくボリューム間の整合性を管理するためのシステムおよび方法

Also Published As

Publication number Publication date
JPH0833859B2 (ja) 1996-03-29

Similar Documents

Publication Publication Date Title
US5065311A (en) Distributed data base system of composite subsystem type, and method fault recovery for the system
US7779295B1 (en) Method and apparatus for creating and using persistent images of distributed shared memory segments and in-memory checkpoints
EP1481324B1 (en) Producing a mirrored copy using incremental-divergence
US7996363B2 (en) Real-time apply mechanism in standby database environments
US5884328A (en) System and method for sychronizing a large database and its replica
US20050283504A1 (en) Disaster recovery system suitable for database system
US20150339366A1 (en) Replication for on-line hot-standby database
US20070180000A1 (en) Storage apparatus and storage system
US20030074600A1 (en) Data backup/recovery system
US20080178050A1 (en) Data backup system and method for synchronizing a replication of permanent data and temporary data in the event of an operational error
JPS633341B2 (ja)
US11010256B1 (en) Method and system for implementing current, consistent, and complete backup copy by rolling a change log backwards against a storage device
CN106991606B (zh) 交易数据处理方法及装置
EP3210119B1 (en) Recovery and fault-tolerance under computational indeterminism
Borr Robustness to Crash in a Distributed Database: A Non Shared-memory Multi-Processor Approach.
US20160170845A1 (en) Database system control method and database system
CN110196788B (zh) 一种数据读取方法、装置、系统及存储介质
CN106371919B (zh) 一种基于映射-归约计算模型的洗牌数据缓存方法
CN105659214B (zh) 数据单元集合的检查点设置
JPS63261437A (ja) 複合サブシステム形オンラインシステム
JPH0827753B2 (ja) オンラインシステムのチェックポイントダンプ取得方法
JP4139642B2 (ja) データベース管理方法およびシステム
JP3290182B2 (ja) 共用環境におけるデータ・セットのバックアップ方法及び装置
JPH01108667A (ja) 資源の共用排他制御方法
JP2569063B2 (ja) 複合サブシステム形オンラインシステムの障害回復方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080329

Year of fee payment: 12