JPS6326412B2 - - Google Patents

Info

Publication number
JPS6326412B2
JPS6326412B2 JP55159844A JP15984480A JPS6326412B2 JP S6326412 B2 JPS6326412 B2 JP S6326412B2 JP 55159844 A JP55159844 A JP 55159844A JP 15984480 A JP15984480 A JP 15984480A JP S6326412 B2 JPS6326412 B2 JP S6326412B2
Authority
JP
Japan
Prior art keywords
processing
logic
file
message
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55159844A
Other languages
English (en)
Other versions
JPS5783853A (en
Inventor
Ryohei Nakano
Toshuki Iida
Hiromitsu Mizutani
Yoshuki Tokuno
Koichi Sato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Hitachi Ltd
NEC Corp
Nippon Telegraph and Telephone Corp
Original Assignee
Fujitsu Ltd
Hitachi Ltd
Nippon Telegraph and Telephone Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Hitachi Ltd, Nippon Telegraph and Telephone Corp, Nippon Electric Co Ltd filed Critical Fujitsu Ltd
Priority to JP55159844A priority Critical patent/JPS5783853A/ja
Publication of JPS5783853A publication Critical patent/JPS5783853A/ja
Publication of JPS6326412B2 publication Critical patent/JPS6326412B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Retry When Errors Occur (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 本発明は電文処理を分担するホストプロセツサ
とフアイル処理またはデータベース処理を分担す
るバツクエンドプロセツサとが、結合路を介して
結合されたシステムに於いて、結合路またはバツ
クエンドプロセツサ側に障害が発生した場合、再
開始処理を高速且つ簡単に行なうことができる分
散システム障害方式に関するものである。
第1図は従来方式を実施する装置のブロツク線
図であり、同図を参照して従来方式を説明する
と、電文を多重に処理するホストプロセツサ1と
電文処理の中で必要となるフアイル処理またはデ
ータベース処理を救済単位を単位として専任する
バツクエンドプロセツサ7とが結合路6を介して
結合されたシステムに於いて、ホストプロセツサ
1側には電文処理を遂行する複数の電文処理ロジ
ツク2と、電文処理の中で必要となるフアイル処
理またはデータベース処理をバツクエンドプロセ
ツサ7側と送受信する分散制御ロジツク3と、再
開始処理時に起動される再開始処理ロジツク4と
が設けられており、又、バツクエンドプロセツサ
7側にはホストプロセツサ1側とフアイル処理ま
たはデータベース処理を送受信する分散制御ロジ
ツク8と、再開始処理時に起動される再開始処理
ロジツク9と、フアイル処理を行なうフアイル処
理ロジツクまたはデータベース処理を行なうデー
タベース処理ロジツク(以下フアイル処理ロジツ
ク等と称す)10が設けられている。
またホストプロセツサ1側には電文処理の履歴
を取得する電文ジヤーナル5が設けられており、
バツクエンドプロセツサ7側には、救済単位の履
歴を取得する救済単位ジヤーナル11と、フアイ
ルまたはデータベース14の更新前の状態を取得
する更新前ジヤーナル12と、フアイルまたはデ
ータベース14の更新後の状態を取得する更新後
ジヤーナル13とが設けられている。ここで、救
済単位とは、電文処理ロジツク2で受信した電文
が、救済単位の開始を宣言してから、救済単位の
終了を宣言するまでの処理の範囲であり、救済単
位の途中で障害に遭遇した場合、該救済単位内で
のフアイルまたはデータベース14の更新処理を
全て無効にすることと、該救済単位の処理中、処
理に関連するフアイルまたはデータベース14の
領域を占有する為に、上記領域をロツクしてお
き、フアイルまたはデータベース14のインテグ
リを保つと言う2つの目的を持つものである。
上記構成のシステムに於ける電文処理は、第2
図の電文処理流れ図に示す通りに行なわれる。即
ち、電文処理ロジツク2が電文を受取ると電文処
理が始まり、入力された電文は、電文ジヤーナル
5に取得される。電文処理の中で救済単位の開始
が宣言されると分散制御ロジツク3はその旨を分
散制御ロジツク8に転送し、分散制御ロジツク8
は更にフアイル処理ロジツク等10に通知する。
これにより、フアイル処理ロジツク等10は救済
単位の開始処理を行うが、その一環として救済単
位の開始を救済単位ジヤーナル11に取得する。
バツクエンドプロセツサ7側で救済単位の開始処
理が終了すると、その旨が分散制御ロジツク8、
分散制御ロジツク3を介して電文処理ロジツク2
に通知される。
救済単位が開始されると、その中でフアイル処
理またはデータベース処理が要求されるが、それ
らは分散制御ロジツク3、分散制御ロジツク8を
介してフアイル処理ロジツク等10に通知され、
フアイル処理またはデータベース処理が行われ
る。ここでフアイルまたはデータベース14の更
新があれば、更新前ジヤーナル12と更新後ジヤ
ーナル13とに、それぞれ、更新前の状態と更新
後の状態を取得する。
電文処理ロジツク2が救済単位の終了を宣言す
ると、その旨が分散制御ロジツク3、分散制御ロ
ジツク8を介してフアイル処理ロジツク等10に
通知され、フアイル処理ロジツク等10は救済単
位の終了処理としてフアイルまたはデータベース
14の実更新を行い、救済単位の終了を救済単位
ジヤーナル11に取得し(以上の処理を救済単位
終了処理1と呼ぶ)、処理後その旨(レスポンス
1)を分散制御ロジツク8を介して分散制御ロジ
ツク3に通知する。分散制御ロジツク3はバツク
エンドプロセツサ7側からレスポンス1を受信し
た旨(レスポンス2)をバツクエンドプロセツサ
7側に転送すると共に、電文処理ロジツク2に救
済単位の終了を通知する。分散制御ロジツク8は
レスポンス2を受信すると、それをフアイル処理
ロジツク等10に通知する。通知を受けたフアイ
ル処理ロジツク等10は該救済単位で占有するた
めにロツクしていたフアイルまたはデータベース
14の資源をアンロツクする(以上の処理を救済
単位終了処理2と呼ぶ)。このように、救済単位
の終了処理のみ分散制御ロジツク8からみて2回
に分けて指示を受信することにした理由は、救済
単位内でロツクしている資源が不用意にアンロツ
クされないようにする為である。
救済単位の終了を通知された電文処理ロジツク
2は処理を続け、電文処理は終了する。このと
き、電文処理が正常に終了している旨を電文ジヤ
ーナル5に取得する。
次に、上記構成のシステムに於いて、結合路6
またはバツクエンドプロセツサ7に致命的な障害
が発生した時の従来の処理方式を第3図,第4図
を参照して説明する。
電文処理の中で必要となるフアイル処理、デー
タベース処理、及び救済単位の終了処理がバツク
エンドプロセツサ7側に依頼されている時に、結
合路6またはバツクエンドプロセツサ7側に致命
的な障害が発生すると、第3図に示すように、分
散制御ロジツク3は障害を検出し、電文処理ロジ
ツク2に異常が発生したことを通知する。異常を
通知された電文処理ロジツク2は、救済単位を異
常終了させ、現在処理中の電文を異常として扱う
と共に、電文が異常終了した旨を電文ジヤーナル
5に取得し、障害回復後の再開始指示を待つ。
尚、結合路6に障害が発生した場合、バツクエン
ドプロセツサ7側は処理を打切り、前述したと同
様に再開始指示を待つものである。
障害回復後、再開始指示があると、第4図に示
すように、ホストプロセツサ1側では再開始処理
ロジツク4が起動され、バツクエンドプロセツサ
7側では再開始処理ロジツク9が起動される。再
開始処理ロジツク4は、先ず電文ジヤーナル5の
所定の範囲、例えば、一番近いチエツクポイント
までの範囲をリードし、上記所定範囲内の電文の
終了状態を検出し、検出結果を再開始処理ロジツ
ク9に通知する。又、再開始処理ロジツク9は、
救済単位ジヤーナル11の所定範囲をリードし、
上記所定範囲内の救済単位の終了状態を検出す
る。電文の終了状態、救済単位の終了状態を検出
すると、再開始処理ロジツク9はそれぞれの検出
結果をつき合せ、無効にする救済単位を抽出す
る。
この場合、無効にする救済単位には、救済単位
の途中で処理がストツプしたものと、正常終了、
即ち、救済単位ジヤーナル11に救済単位の終了
は取得されているが、レスポンス1がホストプロ
セツサ1側に届かなかつた為に、電文処理ロジツ
ク2で異常扱いされたものとの2種類がある。
尚、前者を無効化する処理は、ロールバツクと呼
ばれ、後者を無効化する処理はキヤンセルと呼ば
れている。
ロールバツクまたはキヤンセルの対象となる救
済単位が抽出されると、再開始処理ロジツク9
は、ロールバツクまたはキヤンセルをフアイル処
理ロジツク等10に指示し、これによりフアイル
処理ロジツク等10は、更新前ジヤーナル12に
取得されている情報に基づいて、ロールバツクま
たはキヤンセルを行なう。尚、フアイルまたはデ
ータベース14についてみれば、ロールバツクも
キヤンセルも、フアイルまたはデータベース14
の状態を、無効にする救済単位の開始時の状態に
復元する処理を行なうものである。
しかし、上述した従来の処理方式は、電文ジヤ
ーナル5、救済単位ジヤーナル11のリード処理
に時間がかかり、再開始処理が遅くなる欠点があ
る。時に、リード範囲が複数の媒体にまたがつて
いる場合は、人手を伴なう操作となる為、再開始
処理に非常に多くの時間がかかる欠点がある。
又、電文ジヤーナル5、救済ジヤーナル11のリ
ード処理、無効化する救済単位の抽出の為に、複
雑なロジツクが必要となる欠点もある。
本発明は前述の如き欠点を改善したものであ
り、その目的は電文処理を分担するホストプロセ
ツサとフアイル処理またはデータベース処理を分
担するバツクエンドプロセツサが結合路を介して
結合されたシステムに於いて、結合路またはバツ
クエンドプロセツサ側に発生する致命的な障害に
対して通常処理に何ら影響を及ぼすことなく、再
開始処理を高速かつ簡単にすることにある。以
下、実施例について詳細に説明する。
第5図は本発明方式を実施するシステムの一例
を示すブロツク線図で、15はホストプロセツ
サ、16は電文処理ロジツク、17は分散制御ロ
ジツク、18は障害発生時のみに起動される障害
時記録ロジツク、19はバツクエンドプロセツ
サ、20は分散制御ロジツク、21は再開始処理
ロジツク、22はフアイル処理またはデータベー
ス処理を行なうフアイル処理ロジツクまたはデー
タベース処理ロジツク(以下フアイル処理ロジツ
ク等22と称す。)、23は障害記録処理プロセツ
サ、24は接続路であり、他の第1図と同一符号
は同一部分を表わしている。尚、障害記録処理プ
ロセツサ23内には、ロールバツク、キヤンセル
の対象となる救済単位を記憶するロールバツクテ
ーブル23a、キヤンセルテーブル23bが設け
られており、又、障害時記録ロジツク18は結合
路6、又はバツクエンドプロセツサ19の障害時
にホストプロセツサ15上に保有されている救済
単位がロールバツクの対象か、キヤンセルの対象
かを検出する手段を有している。尚、この検出
は、ホストプロセツサ15が、各救済単位の処理
がどの段階にあるのか保有していることを利用し
て行なわれる。
正常時の処理は、第2図の電文処理流れ図の通
りに行なわれるものであるので、ここでは説明を
省略し、結合路6またはバツクエンドプロセツサ
19に致命的な障害が発生した時の処理方式を第
6図を参照して説明する。
分散制御ロジツク17で結合路6またはバツク
エンドプロセツサ19に致命的な障害が発生した
ことを検出すると、障害時記録ロジツク18が起
動される。障害時記録ロジツク18は、この時ホ
ストプロセツサ15上に保有されている救済単
位、即ち、障害により異常扱いとなる電文の救済
単位がキヤンセルの対象であるか、ロールバツク
の対象であるかを、ホストプロセツサ15が処理
中電文の救済単位の状態を保有していることを利
用し、検出する。そして、障害により異常扱いと
なる救済単位がロールバツクの対象であると検出
したときは、該救済単位を障害記録処理プロセツ
サ23に送信すると共に、該救済単位を、ロール
バツクテーブル23aに記録することを指示する
SAVE命令を発行し、又、異常扱いとなる救済単
位がキヤンセルの対象であると検出した時は、該
救済単位を障害記録処理プロセツサ23に送信す
ると共に、キヤンセルテーブル23bに記録させ
ることを指示するSAVE命令を発行する。障害記
録処理プロセツサ23は、SAVE命令を分析し、
障害時記録ロジツク18からの救済単位をロール
バツクテーブル23a或はキヤンセルテーブル2
3bに記録する。
障害時記録ロジツク18は、上述の如き処理を
ホストプロセツサ15に保有されている全ての救
済単位について行なうと、この旨を分散制御ロジ
ツク17に通知し、分散制御ロジツク17はこの
通知を受けると、電文処理ロジツク16に異常を
通知する。そして、異常の通知を受けた電文処理
ロジツク16は、第3図に示した従来の処理方式
と同様の処理を行なう。
次に障害回復後の再開始処理を第7図の再開始
処理流れ図を参照して説明する。障害が回復する
と、バツクエンドプロセツサ19側の再開始処理
ロジツク21が駆動される。再開始処理ロジツク
21は、障害記録処理プロセツサ23に、ロール
バツクテーブル23a、キヤンセルテーブル23
bに記憶されている救済単位にその処理種別(ロ
ールバツクかキヤンセルか)を付して再開始処理
ロジツク21に送ることを指示するRECALL命
令を加える。障害記録処理プロセツサ23は、こ
のRECALL命令を分析し、ロールバツクテーブ
ル23a、キヤンセルテーブル23bに記憶され
ている救済単位にその処理種別を付して再開始処
理ロジツク21に送出する。再開始処理ロジツク
21は、障害記録処理プロセツサ23からの情報
に基づいて、フアイル処理ロジツク等22にロー
ルバツクまたはキヤンセルを指示し、これにより
フアイル処理ロジツク等22は、更新前ジヤーナ
ル12に取得されている情報に基づいてロールバ
ツクまたはキヤンセルを行ない、フアイルまたは
データベース14の状態を、ロールバツクテーブ
ル23a、キヤンセルテーブル23bに記憶され
ている救済単位の開始時の状態に復元する。
尚、実施例に於いては、ロールバツクテーブル
23a、キヤンセルテーブル23bを障害記録プ
ロセツサ23内に設けたが、ホストプロセツサ1
5に設けられている記憶装置(図示せず)の所定
領域をロールバツクテーブル、キヤンセルテーブ
ルとしても良いことは勿論である。
以上説明したように、本発明によれば、電文処
理を分担するホストプロセツサと電文処理の中で
必要となるフアイル処理またはデータベース処理
を分担するバツクエンドプロセツサが結合路を介
して結合されたシステムに於いて、結合路または
バツクエンドプロセツサ側に発生した致命的な障
害に対して、障害を検出したホストプロセツサが
正常であること及び処理中電文の救済単位の状態
を保有していることを利用して、障害検出後に処
理する電文の救済単位を、例えばロールバツクテ
ーブル23a、キヤンセルテーブル23bに記憶
しておき、その情報を使用することにより、シス
テムの再開始処理を通常処理に何ら影響を及ぼす
ことなく、高速かつ簡単に行なうことができる利
点がある。
【図面の簡単な説明】
第1図は従来方式を実施する装置のブロツク線
図、第2図は電文処理流れ図、第3図は障害発生
時の従来の処理流れ図、第4図は従来の再開始処
理流れ図、第5図は本発明の実施例のブロツク線
図、第6図は障害発生時の本発明の処理流れ図、
第7図は本発明の再開始処理流れ図である。 1,15はホストプロセツサ、2,16は電文
処理ロジツク、3,8,17,20は分散制御ロ
ジツク、4,9,21は再開始処理ロジツク、5
は電文ジヤーナル、6は結合路、7,19はバツ
クエンドプロセツサ、10はフアイル処理ロジツ
クまたはデータベース処理ロジツク、11は救済
単位ジヤーナル、12は更新前ジヤーナル、13
は更新後ジヤーナル、14はフアイルまたはデー
タベース、18は障害時記録ロジツク、23は障
害記録処理プロセツサ、23aはロールバツクテ
ーブル、23bはキヤンセルテーブル、24は接
続路である。

Claims (1)

    【特許請求の範囲】
  1. 1 電文を多重に処理するホストプロセツサと電
    文処理の中で必要となるフアイル処理またはデー
    タベース処理を救済単位を単位として専任するバ
    ツクエンドプロセツサとが結合路を介して結合さ
    れたシステムに於いて、データベースまたはフア
    イルの更新前の情報を取得する更新前ジヤーナル
    と、前記結合路或はバツクエンドプロセツサに障
    害が発生したときに、前記ホストプロセツサ上に
    保有されている救済単位を検出する検出手段と、
    該検出手段で検出した救済単位を記憶する記憶手
    段とを設け、再開始処理時、前記更新前ジヤーナ
    ル及び記憶手段の記憶内容に基づいて、前記デー
    タベースまたはフアイルの状態を、前記記憶手段
    に記憶されている救済単位の開始時の状態に復元
    することを特徴とする分散システム障害処理方
    式。
JP55159844A 1980-11-13 1980-11-13 Fault processing system for distributed system Granted JPS5783853A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55159844A JPS5783853A (en) 1980-11-13 1980-11-13 Fault processing system for distributed system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55159844A JPS5783853A (en) 1980-11-13 1980-11-13 Fault processing system for distributed system

Publications (2)

Publication Number Publication Date
JPS5783853A JPS5783853A (en) 1982-05-25
JPS6326412B2 true JPS6326412B2 (ja) 1988-05-30

Family

ID=15702465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55159844A Granted JPS5783853A (en) 1980-11-13 1980-11-13 Fault processing system for distributed system

Country Status (1)

Country Link
JP (1) JPS5783853A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2812037B2 (ja) * 1992-02-25 1998-10-15 日本電気株式会社 業務処理プログラムの再起動制御方式

Also Published As

Publication number Publication date
JPS5783853A (en) 1982-05-25

Similar Documents

Publication Publication Date Title
US5065311A (en) Distributed data base system of composite subsystem type, and method fault recovery for the system
KR19990082867A (ko) 갱신 트랜잭션 완성 방법 및 장치
JP4315016B2 (ja) コンピュータシステムの系切替方法
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
JP3551079B2 (ja) 修正ロードモジュール置換後の復旧方法ならびに装置
JPS6326412B2 (ja)
JPH04369735A (ja) 計算機システムのバックアップ方式
JPS6146543A (ja) 転送装置の障害処理方式
JPH0535606A (ja) 電子デイスク装置
JPS597982B2 (ja) 計算機システムのシステム障害時の再開始方式
JP2000293407A (ja) 監視制御装置及びcpu監視方法並びにプログラム記録媒体
JPH08329025A (ja) プロセスマイグレーション方式
JP2624106B2 (ja) 交換システムにおけるバックアップファイルの自動検証処理方法
JPS6167153A (ja) 直接アクセス記憶装置の部分障害回復処理方法
JP3316739B2 (ja) 装置間インタフェース制御方式
JPH0727484B2 (ja) 計算機システムのデータ保存方法
JPH07271611A (ja) プロセス自動再起動処理方式
JPH06342407A (ja) チャネル装置
JPS62284440A (ja) 端末装置のソフトウエア資源保守方式
JPH06187102A (ja) 二重化ディスク処理方式
JPH03100719A (ja) 2重化ボリューム障害処理方式
JPH04330531A (ja) チェックポイント処理方式
JPS63211054A (ja) オンラインdasdジャーナルの再使用方法
JPS6341943A (ja) 論理装置のエラ−回復方式
JPS6326414B2 (ja)