JPH0831043B2 - コミット手順の非同期的再同期化実行装置および方法 - Google Patents
コミット手順の非同期的再同期化実行装置および方法Info
- Publication number
- JPH0831043B2 JPH0831043B2 JP3088997A JP8899791A JPH0831043B2 JP H0831043 B2 JPH0831043 B2 JP H0831043B2 JP 3088997 A JP3088997 A JP 3088997A JP 8899791 A JP8899791 A JP 8899791A JP H0831043 B2 JPH0831043 B2 JP H0831043B2
- Authority
- JP
- Japan
- Prior art keywords
- resource
- application
- manager
- recovery
- log
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/466—Transaction processing
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Debugging And Monitoring (AREA)
- Hardware Redundancy (AREA)
- Retry When Errors Occur (AREA)
Description
オペレーティグ・システムに関するものであり、具体的
には、同期点の障害の後に自動的かつ効率的に2段階コ
ミット手順を再同期できる、分散アプリケーション用の
分散コンピュータ・オペレーティング・システムに関す
るものである。
は、コンピュータ・システムのネットワーク内で使用で
きる。こうした各コンピュータ・システムは、1台の中
央ホスト・コンピュータと、複数の仮想計算機またはそ
の他の形式の実行環境を含むことができる。仮想計算機
用のホスト・コンピュータには、システム制御プログラ
ムが含まれ、このシステム制御プログラムは、ホストの
データ・プロセッサに対する各仮想計算機のアクセスを
スケジューリングし、大容量メモリを含むホストの資源
の管理を助けて、各仮想計算機が別々のコンピュータで
あるように見えるようにする。各仮想計算機はまた、ホ
ストを介してメッセージまたはファイルを送るために、
他の仮想計算機と会話することができる。各VM(米国
ニューヨーク州アーモンクのIBMコーポレーションの
登録商標)仮想計算機は、その仮想計算機のユーザと会
話する(すなわち、ユーザから命令を受け取り、ユーザ
にプロンプトを提示する)ための、それ自体のシステム
制御プログラムのCMS部分を有している(“CMS”
は、IBMコーポレーションの登録商標)。共用ファイ
ル・システム(SFS)や共用(SQL)関係データベ
ースなど、任意のユーザ仮想計算機およびホストからア
クセス可能な資源が存在してもよい。
実計算機であると見なされる。2台以上のこのような実
計算機をネットワーク内で相互接続し、異なる実計算機
の仮想計算機の間での会話を介してデータを転送するこ
とが一般に行われている。このような転送は、AVSゲ
ートウェイやVTAMファシリティ(“AVSゲートウ
ェイ”および“VTAM”は、IBMコーポレーション
の登録商標)などの通信ファシリティを介して行われ
る。
ファイルを変更するには、まずそれらの変更を定義する
作業要求を行う。これに応答して、元のデータベースま
たはファイルは変更しないままで、その作業要求に基づ
く仮の変更がシャドウ・ファイル内で行われる。この
時、シャドウ・ファイルは有効でない。ここで、アプリ
ケーションは、シャドウ・ファイルの変更を有効にし、
それによってシャドウ・ファイルの変更で元のファイル
を置換するために、その変更をコミットするよう要求す
ることができる。1段階のコミット手順が使用できる。
この1段階コミット手順は、シャドウ・ファイルに含ま
れる資源の変更を1個のコマンドでコミットするもので
ある。SFS資源やSQL資源などの資源が変更される
時、その資源に対するコミットは、別々の1段階コミッ
ト手順で完了できる。大多数の場合、すべての資源が別
々の手順でエラーや中断なしにコミットされる。しかし
ながら、いずれかの1段階コミット手順の最中に問題が
発生した場合、完了したコミットもあれば完了しないコ
ミットもあり、整合性が失われる。問題が生じた後にク
リティカルでない資源を再構築するコストは、1段階コ
ミット手順の効率を考慮すれば、許容できるものであ
る。
ィカルな会話を保護するには、2段階のコミット手順が
必要である。たとえば、第1の人物の当座預金口座が第
1のデータベース内で表され、第2の人物の普通預金口
座が第2のデータベース内で表されていると仮定する。
第1の人物が第2の人物に対して小切手を振り出し、第
2の人物がその小切手を自分の普通預金口座に預金する
場合、2段階コミット手順を用いれば、第1の人物の当
座預金口座が借方記入されるなら第2の人物の普通預金
口座が貸方記入され、そうでないならばどちらの口座も
変更しないことが保証される。これらの当座預金口座と
普通預金口座は、保護されたクリティカルな資源と見な
される。というのは、これらの当座預金口座と普通預金
口座にかかわるデータの転送が、信頼のおける取扱いを
受けることが非常に重要であるからである。アプリケー
ション・プログラムは、1個のコマンドで2段階コミッ
ト手順を開始できる。この手順は、以下のステップまた
は段階からなる。 (1)準備段階の間、各関係者(借方と貸方)の資源
が、その資源がすべての変更をコミットする用意ができ
ているかどうか判定するために、同期点マネジャによっ
てポーリングされる。各資源は、すべての資源がこの準
備段階を首尾よく完了する、すなわち更新される用意が
できている場合に、資源更新を完了すると約束する。 (2)コミット段階の間、同期点マネジャは、すべての
資源に更新を最終的なものにするよう指示し、いずれか
の資源が準備段階を首尾よく完了できなかった場合に
は、それらを撤回する。
クチャSNA LU6.2アーキテクチャ(解説書SC
31−6808、第5.3章、“Presentation Service
s -Sync Point Verbs”、IBMコーポレーション刊)
は、2つ以上の保護された資源間でコミットを調整する
ことが以前から知られていた。このアーキテクチャは、
すでに、単一のアプリケーション環境内で実行される同
期点処理とそれに関連する回復処理の両方を実行する、
同期点マネジャからなる同期点ファシリティに対処して
いた。複数のアプリケーションがこの環境内で同時に実
行できた。LU6.2アーキテクチャは、資源の調整、
同期点のロギングおよび回復の責任を負う同期点マネジ
ャ(SPM)をサポートする。従来技術のCICS/V
S(IBMコーポレーションの登録商標)環境は、この
ようなアーキテクチャをサポートする。
ーキテクチャによれば、段階1および段階2で、コミッ
ト手順が実行され、同期点マネジャがその段階を同期点
ログに記録する。また、同期点マネジャは、現在処理中
の論理ユニットまたは作業の識別番号を記録する。この
ようなロギングは、2段階コミット手順中に問題が生じ
た場合に、同期点マネジャによる資源回復または再同期
を助ける。2段階コミット手順の開始後にこのような問
題が発生する場合、ログを読み取り、資源回復処理を実
施して、関連する資源を整合性のある状態にする。この
問題には、通信経路の障害や資源マネジャの障害が含ま
れる。
クチャは、以下のようにしてコミット障害を管理する。
同期点マネジャは、ログ・エントリ内の状態に基づいて
その第2段階の決定を知っており、コミットを要求した
アプリケーション・プログラムに制御を返す前に、障害
を発生した調整中の資源に関する完全な再同期動作を呼
び出す。障害を発生した資源の1つは、保護された会話
であり得る。前述のSNA LU6.2同期点アーキテ
クチャでは、開始側の同期点マネジャは、障害が発生し
たシステム内のパートナの同期点マネジャまたは回復フ
ァシリティとの間でセッションを再確立しなければなら
ない。このようなセッションが即座に利用できない場
合、同期点マネジャは、セッションが利用可能になるま
でそれを求め続ける。やはり再同期化を必要とする他の
保護された資源の場合も、障害に出会った資源マネジャ
との間でセッションが必要である。同期点マネジャは、
回復が行われるまで、その処理を完了できない。この遅
延は長引く可能性があり、開始側アプリケーションおよ
び多分その他の関係アプリケーションは、この遅延の間
他の有用な作業を行えない。SNA LU6.2同期点
アーキテクチャを用いると、再同期化を強制するための
ヒューリスティックな決定(手動またはシステム省略時
介入)が可能になる。この介入は、アプリケーション・
プログラムに不定の割込みが生じないように、プログラ
ミングするか、または操作員が直接制御することができ
る。しかし、この介入は、ヒューリスティックな損害を
生じる可能性があり、これによって、その同期点に関係
する資源のあるものはコミットされ、あるものはバック
アウトされる。
アーバナ−チャンペイン校(Urbana- Champaign))の
論文“A Commit Protocol for Resilient Transaction
s”から、その処理中にある間隔でチェックポイントを
設けたアプリケーション・プログラムを提供することが
知られている。各チェックポイントでは、プロセスの状
態に関する情報が、バックアップ・ノードに書き込まれ
る。あるチェックポイントを完了した後、次のチェック
ポイントの前に障害が発生した場合、完了したチェック
ポイントの後に発生したすべての処理と更新を、バック
アウトしなければならない。このバックアウトは、アプ
リケーション・プログラムに対して非同期的に行われ、
アプリケーション・プログラムは、そのチェックポイン
トで、バックアウトの発生を待たずに再始動できる。再
始動した時、そのアプリケーション・プログラムは、同
じデータを新しい名前の下で処理するために、同じルー
チンの新しいインスタンスを試みることができる。この
新しいインスタンスが有効になり、元の名前による以前
のインスタンスは無効になる。この論文中には、有効な
インスタンスを無効なインスタンスから区別する、イン
スタンスの命名方法も記載している。しかし、この論文
は、障害を発生したコミット手順の非同期的回復は扱っ
ていない。
は、コミット手順を開始したアプリケーション・プログ
ラムの動作の長い遅延を防ぎながら、保護された資源お
よび会話のためにコミット手順を再同期させる方法を提
供することである。
ャが、アプリケーションに戻る前に、再同期化が行われ
るのを待つべきか否かを、アプリケーションがローカル
に決定できるようにすることである。
中に障害を効率的に処理する、資源回復のためのシステ
ムまたは方法に関する。あるアプリケーションが、プロ
セッサ上で実行され、異なる実計算機内の別のアプリケ
ーションとの保護された会話などの資源を必要とする作
業動作を要求する。この作業要求に対するコミット手順
が開始され、このコミット手順が完了前に障害を発生し
た場合、一方または両方のアプリケーションの使用を最
適化するために、以下のステップが実行される。コミッ
ト手順が障害を発生した後の何らかの時点で、少なくと
もそのコミットを開始したアプリケーションに、そのア
プリケーションのコミット指令の意図と、そのアプリケ
ーションが実行を継続できること、および再同期化(回
復)を待つ必要がないことを示す戻りコードを送る。そ
の後、開始側アプリケーションが実行を継続している間
に、並列、非同期的に再同期化が実施される。
照番号で示す。図1には、従来技術によるLU6.2同
期点タワー・モデルまたはアーキテクチャが示されてい
る。このアーキテクチャは、1つの実行環境として定義
されている。この例では、3つのアプリケーション・プ
ログラム14、16および18が、実行環境12内で時
分割式に実行される。資源マネジャ26および27は、
DB/2またはCICSファイル制御装置(DB/2お
よびCICSはIBMコーポレーションの登録商標)で
あり、それぞれ資源22および24へのアクセスを制御
する。DB/2(CCIS/MVSオペレーティング・
システム)またはSQL/DS(CCIS/VSEオペ
レーティング・システム)資源マネジャが実行環境12
の外部にある場合、実行環境12は、従来技術によって
資源マネジャへインタフェースする資源アダプタを含む
ことになる。この従来技術のアーキテクチャでは、アプ
リケーション・プログラム14は、同期点マネジャ20
に対して資源22および24を呼び出す作業要求を行っ
た後で、その作業要求に含まれる資源のコミットを要求
する。
は、以前の作業要求のデータ更新をコミットするため、
同期点マネジャ20からのコミットを要求する。これに
応答して、同期点マネジャ20は、資源マネジャ26お
よび27をポーリングして、それらが資源をコミットす
る準備ができているか否かを判定し、準備ができている
場合は続いてそのコミットを指令することによって、2
段階のコミット手順を実施する。この2段階コミット手
順の各段階(および各段階の各ステップ)で、同期点マ
ネジャ20は、2段階コミット手順の状態を示す同期点
情報をログ30に転送する。この2段階コミット手順中
に障害が発生した場合、同期点マネジャは、資源を整合
性のある状態にするために、同期点回復手順を実施す
る。同期点マネジャは、ログ30内の同期点情報を用い
て、中断以前に2段階コミット手順がどこまで進行した
かを決定する。
または18のうちのいずれかが、保護会話マネジャ40
を介して保護された会話を使用して、同一システム内の
別の環境内にあるパートナ・アプリケーション(図示せ
ず)、または通信ファシリティを介して相互接続された
別のシステム内にあるパートナ・アプリケーション(図
示せず)の通信を試みるときにも、同期点マネジャ20
と2段階コミット手順が使用される。この従来技術の同
期点アーキテクチャによれば、この別のシステムまたは
別の環境は、実行環境12と機能的に同等であり、20
と機能的に同等な別の同期点マネジャ、30と機能的に
同等な別の同期点ログ、40と機能的に同等な別の保護
会話マネジャ、ならびに26および27と機能的に同等
な別の資源マネジャを含む。この別の環境は、実行環境
12のそれとは独立した、調整機能および回復機能を提
供する。
ている。本発明は、UNIX環境、OS/2環境、OS
/2オペレーティング・システム内のDOS環境、VM
オペレーティング・システム内のCMS環境、VMオペ
レーティング・システム内のAIX環境、VMオペレー
ティング・システム内のCICS環境、VMオペレーテ
ィング・システム内のMUSIC環境など、それ自体の
実行環境内で実行される分散式および非分散式のアプリ
ケーションをサポートする、分散コンピュータ・オペレ
ーティング・システムを含む。分散アプリケーション
は、別の実行環境内の資源を使用するか、あるいは別の
実行環境内のパートナ・アプリケーションとの通信会話
(特別なタイプの資源)を有することを特徴とする。資
源マネジャまたはパートナ・アプリケーションの実行環
境は、同一のシステム内にあっても、異なるシステム内
にあってもよく、同一形式の環境であっても、異なる環
境であってもよい。分散アプリケーション実行環境は、
アプリケーションをそれ自体の環境内でサポートする1
つまたは複数のシステムを含む。前記の環境が必要な資
源をすべて含む必要はない。これらの資源は、他所に分
散されており、通信ファシリティを使って獲得される。
分散アプリケーションの完全な環境は、すべての機能を
備えるように見える。というのは、分散アプリケーショ
ンは、他の環境にある資源、特に回復ファシリティと通
信ファシリティを必要とするからである。
計算機または中央電子処理装置群(CEC))50Aお
よび50Dを含む。この実施例では、システム50A
は、複数の同等な分散アプリケーション環境52A、5
2B、52C、システム制御プログラム55Aの一部で
ある会話マネジャ53Aと実行環境制御プログラム61
A、61B、61C、および回復ファシリティ70Aを
含む。限定ではなく例として示すと、分散アプリケーシ
ョン環境52A、52B、52Cはそれぞれ、拡張バー
ジョンのVM仮想計算機であってよく、回復ファシリテ
ィ70Aは、別の拡張バージョンのVM仮想計算機に常
駐でき、システム制御プログラム55Aは、仮想計算機
である分散アプリケーション環境52A、52B、52
C用の拡張バージョンのVMオペレーティング・システ
ムであってよい。実計算機であるシステム50A内の分
散アプリケーション環境52Aないし52C内で実行さ
れるアプリケーションは、実計算機であるシステム50
D内または他のシステム(図示せず)内で実行される同
様の分散アプリケーション環境内で実行されるパートナ
・アプリケーションと、通信ファシリティ57Aおよび
57Dを介して通信できる。たとえば、通信ファシリテ
ィ57Aは、仮想記憶通信アクセス方式(“VTA
M”)ファシリティと、APPC/VM VTAMサポ
ート(AVS)ゲートウェイ・ファシリティを含む。各
分散アプリケーション環境52は、単一の同期点マネジ
ャ(SPM)60Aと、複数の保護資源アダプタ62
A、62Bおよび64Aを含む。同期点マネジャを用い
ると、変更がアトミックにみえる形で、関連する1群の
更新をコミットまたはバックアウト(取消し)できるよ
うになる。同期点間で実行される更新(すなわち、コミ
ットまたはバックアウト)は、作業論理ユニットと称
し、関連する更新は、回復ファシリティを介して同期点
マネジャによって割り当てられた、作業論理ユニット識
別子と称する一義的な名前で識別される。作業論理ユニ
ットは、同一の分散アプリケーション環境内のアプリケ
ーションからアクセスされる複数の保護された資源を含
むことができ、また他のアプリケーション環境内のパー
トナ・アプリケーションから保護された資源の1タイプ
である会話を介してアクセスされる保護された資源を含
むこともできる。
ョンの間で体系的に確立された経路である。各アプリケ
ーションによる会話の使用は、そのアプリケーションの
設計と、使用される会話のパラダイムによって決定され
る。会話が同期点処理に含まれる場合、これを保護され
た会話と称する。保護された資源は、下記「コミット手
順のための資源の登録」で説明する登録と称する処理を
介して同期点マネジャとコンタクトすることによって、
作業論理ユニットの一部になる。各保護資源アダプタ
は、アプリケーションならびに同期点マネジャに資源マ
ネジャへのインタフェースを提供する。(資源マネジャ
がアプリケーションと同一の実行環境内に常駐する場合
には、その代わりに、保護資源アダプタを資源マネジャ
と組み合わせることができる。)
イルと会話である。本発明の他の実施例では、保護され
た資源は、データベース・テーブル、待ち行列、遠隔手
順コールその他であってよい。保護資源アダプタ62A
および62Bは、それぞれ、アプリケーション56Aの
ために、ファイル78Aおよび78Bを管理する資源マ
ネジャ63Aおよび63Bへのインタフェースを取り扱
う。資源マネジャ63Aおよび63Bは、同一のシステ
ム内にある。また、これらが通信ネットワーク内の異な
るシステム内に常駐することもできる。この実施例で、
会話は会話マネジャによって管理される。会話マネジャ
は、あるアプリケーションから、同一システム内の異な
る分散アプリケーション環境内、または通信ネットワー
ク内の異なるシステム内の異なる分散アプリケーション
環境内で実行される他のパートナ・アプリケーションへ
の会話または経路を管理する。保護された会話が、同一
システム内の異なるアプリケーション環境内で実行され
る2つのアプリケーション・パートナの間、たとえばア
プリケーション環境52Aおよび52Bで実行されるア
プリケーションの間で行われる場合、会話マネジャは、
システム50Aのシステム制御プログラム55Aに含ま
れ、各保護会話アダプタ64Aおよび64B(図示せ
ず)を介してアプリケーション・パートナの間で通信が
行われる。保護された会話が、異なるシステム内の異な
るアプリケーション環境の間、たとえばアプリケーショ
ン環境52Aおよび52Dで実行される2つのアプリケ
ーション・パートナの間で行われる場合、通信ファシリ
ティ57Aおよび57Dを介してシステム50A内の会
話マネジャ53Aとシステム50D内の会話マネジャ5
3Dの間で通信が行われる。この実施例では、このよう
な通信は、対等通信フォーマットを使用する。会話マネ
ジャ53Aおよび53Dは、通信ファシリティ57Aお
よび57Dと通信するのに、環境内フォーマットを使用
する。通信ファシリティ57Aおよび57Dは、環境内
フォーマットから体系的システム間通信標準フォーマッ
トに、またその逆に変換する。たとえば、この体系的シ
ステム間通信標準フォーマットは、IBMのシステム・
ネットワーク体系、LU6.2プロトコルによって定義
されるタイプのものでよい。
るシステム50A内の分散アプリケーション環境52
A、52B、52Cのすべてにサービスする。回復ファ
シリティ70Aはログ72Aを含み、その処理は、同期
点マネジャ60A、60B、60Cに対するロギングを
取り扱い、すべての分散アプリケーション環境52A、
52B、52Cのために、障害が発生した同期点の回復
を行う。システム50D上の回復ファシリティ70Dと
そのログ72Dおよび同期点マネジャ60Dについても
同様である。
リケーション56Aが、ファイル78Aおよび78Bを
更新したい場合、アプリケーション56Aは、アプリケ
ーション56A内のファイル・アプリケーション・プロ
グラム・インタフェースを介して、別々の2つの更新要
求を行う。これらの要求は、それぞれファイル78Aお
よび78Bのための保護資源アダプタ(以下、このタイ
プの資源に関しては保護ファイル・アダプタPFAと呼
ぶ)62Aおよび62Bを呼び出す(図3のステップ5
00)。資源マネジャ特有の実施様態に基づいて、保護
ファイル・アダプタは、このファイルが保護されている
ことを知る。まだこの作業ユニットに関して同期点マネ
ジャに登録されていない場合、保護ファイル・アダプタ
62Aおよび62Bは、この作業ユニットに関するすべ
てのコミット要求およびバックアウト要求に関わりたい
と、同期点マネジャ60Aに登録する(ステップ50
2)。「作業ユニット」とは、ある同期点に参加する、
そのアプリケーションから直接アクセス可能であり可視
である、すべての資源をグループにまとめたものであ
り、通常、作業論理ユニット識別子と関連づけられてい
る。作業ユニットに関するさらに詳しい説明は、下記の
「作業ユニットに合わせて調整されたローカルおよびグ
ローバルなコミット範囲」を参照されたい。次に、保護
ファイル・アダプタ62Aおよび62Bは、それぞれ当
該の資源マネジャ63Aおよび63Bにコンタクトし
て、それぞれファイル78Aおよび78Bを更新し(ス
テップ504)、アプリケーション56Aに戻る。次
に、アプリケーション56Aは、同期点マネジャ60A
に、同期点58Aを要求する、すなわち、この場合はコ
ミットを要求する(ステップ506)。これに応答し
て、同期点マネジャ60Aは、保護ファイル・アダプタ
62Aおよび62Bとそのそれぞれの資源マネジャ63
Aおよび63Bによって表されるその登録された資源で
ある、ファイル78Aおよび78Bのために実行すべ
き、2段階コミット手順を開始する。ステップ508
で、同期点マネジャ60Aは、段階1の「準備」コール
で、登録されたその各資源を、登録中に各資源アダプタ
から同期点マネジャに与えられたアダプタ同期点出口入
口点で呼び出す。
同期点マネジャ60Aは、回復ファシリティ70Aに要
求を発行して、段階1の同期点マネジャ情報をログ72
Aに強制ロギング(「強制ロギング」とは、同期点マネ
ジャ60Aに戻る前に、確実に情報が実際の物理装置に
書き込まれるようにすることを意味する)させる(ステ
ップ508)。この情報には、作業論理ユニット識別
子、同期点マネジャの状態および、このコミット要求に
参加する登録された各保護資源アダプタに関する名前そ
の他の関連情報が含まれる。この情報は、保護ファイル
・アダプタ62Aおよび62Bが登録された時に、同期
点マネジャ60Aに与えられたものである。同期点マネ
ジャ60Aの状態は、準拠する2段階コミット・パラダ
イムの規則によって決定される。たとえば、この2段階
コミット・パラダイムは、IBMコーポレーションの刊
行物“System Network Architecture LU 6.2 Referenc
e: PeerProtocols, SC31-6808, Chapter 5.3 Presentat
ion Services - Sync Point verbs”に記載されている
タイプのものである。この同期点処理の間に障害が発生
した場合、同期点マネジャの状態を使用して、作業論理
ユニットの結果(コミットまたはバックアウト)を決定
する。この実施例で使用する2段階コミット・パラダイ
ムの規則によれば、同期点マネジャの段階1の状態は、
「開始側(Initiator)」、「同期点マネジャ
保留中(Syncpoint Manager Pen
ding)」である。2段階コミット手順の第1段階が
中断されずに完了した場合(判断ブロック512)、同
期点マネジャ60Aは、回復ファシリティ70Aに第2
の要求を発行して、ログ72Aにその段階2の状態を強
制ロギングさせる。保護ファイル・アダプタと資源マネ
ジャからの回答と、使用している2段階コミット・パラ
ダイムの規則とに基づいて、同期点マネジャ60Aは、
その第2段階の決定を知る。この実施例では、このパラ
ダイムは以下のようなものである。1つまたは複数の保
護資源アダプタが、段階1の要求に対して「バックアウ
ト」と回答した場合、段階2の決定は「バックアウト」
である。すべてが「要求コミット」と回答した場合、決
定は「コミット」である。図3に示した例では、保護フ
ァイル・アダプタ62Aおよび62Bは、「要求コミッ
ト」と回答し(ステップ510)、段階2の状態は、同
期点マネジャ60Aによって、「開始側コミット済み
(Initiator Committed)」として
ロギングされる。この例では、ファイル・マネジャ63
Aおよび63Bは、段階1の要求に対してそれぞれの保
護ファイル・アダプタ62Aおよび62Bを介して「要
求コミット」と回答した後、「不確定(indoub
t)」の状態になる、すなわち、それらのファイル・マ
ネジャは、同期点マネジャ60Aからの段階2の決定に
基づいて、ファイル更新をコミットまたはバックアウト
できることに留意されたい。
保護ファイル・アダプタ62Aおよび62Bに対して、
コミットの決定と共に段階2のコールを発行する(ステ
ップ513)。ファイル・マネジャ63Aおよび63B
は段階2のコミットの決定を受け取った時、それぞれ先
に進んで、データをコミットするのに、すなわち更新を
恒久的にするのに必要なことを何でも行う(ステップ5
16)。成功の回答が、当該のファイル・マネジャに代
わって保護ファイル・アダプタ62Aおよび62Bから
送られ、同期点処理に中断がなかった場合(判断ブロッ
ク514)、同期点マネジャ60Aは、回復ファシリテ
ィ70Aを呼び出して、この作業論理ユニットに関して
ログ72Aに「忘却(forget)」の状態を書き込
む(ステップ515)。これは強制ログ書込みである必
要はない。すなわち、ログ・レコードをデータ・バッフ
ァに書込んだ後、同期点マネジャ60Aに戻ることがで
きる。このバッファは、後の時点で物理媒体に書き込む
ことができる。この実施例で使用する2段階コミット・
パラダイムに基づいて、同期点マネジャ60Aは、作業
論理ユニット識別子を更新し(1つだけ増分する)、こ
れによって、アプリケーション56Aの行う次の作業論
理ユニットが一義的であることを保証する。次に同期点
マネジャは、アプリケーション56Aに戻る(ステップ
515A)。
処理用の規則をもち、したがって、回復ファシリティ7
0Aは、中断された同期点を完了する方法(ステップ5
17および図4)を知っている。同期点マネジャ60A
の処理が中断された場合、判断ブロック514からステ
ップ517に進み、同期点マネジャ60Aが回復ファシ
リティ70Aにコンタクトする。ステップ517で、回
復ファシリティ70Aは、同期点マネジャ60Aから、
作業論理ユニット識別子と、障害を発生した1つまたは
複数の関連する資源に関する情報を受け取る。次に回復
ファシリティ70Aは、正しいログ・エントリを見つけ
る(図4のステップ518)。このログ情報を使用され
る2段階コミット・パラダイムと組み合わせて用いる
と、回復ファシリティ70Aの手順で、中断された同期
点処理が完了できるようになる(ステップ519)。こ
の例で使用される2段階コミット・パラダイムに基づく
と、ログ72A上の作業論理ユニット識別子に対する同
期点状態エントリが「開始側、同期点マネジャ保留中」
である場合、障害を発生した資源マネジャ63Aまたは
63Bはそれぞれ、バックアウトするよう命じられる。
そうでない場合は、各資源マネジャは、ログ上にある同
期点マネジャの段階2の状態、すなわちコミットまたは
バックアウトを命じられる(ステップ520)。回復状
態が決定された後、回復ファシリティ70Aは、下記
「保護された資源を回復するためのログ名の交換」およ
び「分散アプリケーション用の未完了の同期点のための
回復ファシリティ」に記載するように、障害を発生した
各保護資源マネジャで回復処理を開始する。この処理
は、ログ名の交換と状態の比較からなり、これによって
回復ファシリティ70Aの回復処理は、障害を発生した
資源マネジャ63Aまたは63Bに、行うべきこと、す
なわちコミットまたはバックアウトを命じ、資源マネジ
ャ63Aまたは63Bは、それが行ったことを回復処理
に伝える。回復ファシリティ70Aの回復処理は、同期
点マネジャ60Aがその段階1のロギング活動中に書き
込んだ情報に基づいて、障害を発生した資源にコンタク
トする方法を知る。障害を発生した資源マネジャがコン
タクト可能である場合は(判断ブロック521)、即座
に回復が行われる(ステップ522)。障害を発生した
各資源で回復が行われた後(判断ブロック523)、同
期点マネジャ60Aに戻ることができる(ステップ52
3A)。その後、同期点マネジャ60Aは、アプリケー
ション56Aに戻る(ステップ515A)。障害を発生
した資源マネジャがコンタクト不能である場合は、判断
ブロック521から判断ブロック524へ進み、回復フ
ァシリティ70Aは、アプリケーション56Aに戻る前
に回復処理を完了しなければならないか否かを検査す
る。この判定は、段階1のロギング中に同期点マネジャ
が書き込んだ、作業論理ユニットに対するログ・レコー
ドに含まれる情報に基づいて行われる。回復を完了させ
なければならない場合、回復処理は、障害を発生した資
源とコンタクトしようと試み続ける(ステップ52
5)。回復を後の時点で完了してよい場合、すなわち回
復を待つことが以前に選択されている場合、回復ファシ
リティ70Aは、下記「コミット手順の非同期的再同期
化」に記載のように、同期点マネジャ60Aに戻って、
回復処理(すなわち、コミットまたはバックアウト)の
意図と、回復が後で完了されるとの指示とを戻す(ステ
ップ526)。すべての資源が回復された時(ステップ
525A)、同期点マネジャ60Aは、アプリケーショ
ン56Aにこの情報を戻す(ステップ515)。
散アプリケーションの一部であり得ることを示してい
る。これは、アプリケーション56Aと共同してその処
理を完了することのできるパートナ・アプリケーション
が、少なくとも1つ存在することを意味する。分散アプ
リケーションを確立するために、アプリケーション56
Aは、保護された会話を開始する。この保護された会話
は、アプリケーション・プログラム会話開始インタフェ
ースを呼び出すことによってシステム50D内のパート
ナ・アプリケーション56Dを起動し、この会話が保護
すべきものであることを示す(図5A、ステップ53
0)。この要求は、保護会話アダプタ64Aによって処
理される。保護会話アダプタ64Aは、同期点マネジャ
60Aに作業論理ユニット識別子を求め、これを一義的
な会話識別子と一緒に、遠隔システム50Dに送る情報
に含める。次に、保護会話アダプタ64Aは、この要求
を会話マネジャ53Aに送り、会話マネジャ53Aは、
これを通信ファシリティ57Aに送る。保護会話アダプ
タ64Aは、会話開始要求が通信ファシリティ57Aか
ら通信ファシリティ57Dに送られた(またはこれから
送られる)旨の指示を得る。この時、保護会話アダプタ
64Aは、同期点マネジャ60Aに登録する(ステップ
532)。会話開始要求は、この登録処理とは非同期
に、通信ファシリティ57Dに送られ、次に会話マネジ
ャ53Dに送られ、次に保護会話アダプタ64Dに送ら
れる(図5Aのステップ532)。保護会話アダプタ6
4Dは、作業論理ユニット識別子と一義的な会話識別子
を検索し、会話マネジャのために同期点マネジャに登録
する(ステップ532)。また、この時、保護会話アダ
プタ64Dは、会話開始要求時に受け取った作業論理ユ
ニット識別子を同期点マネジャ60Dに与える。アプリ
ケーション56Dによって行われた保護された作業が、
最初にアプリケーション56Aによって開始されたこの
作業論理ユニット識別子と関連づけられる(ステップ5
32)。また、この作業論理ユニット識別子が、アプリ
ケーション56D用の新しい作業ユニットに割り当てら
れ、その後アプリケーション56Dが開始される。
6Dは、パートナ・アプリケーションであり、これらを
まとめて分散アプリケーションと称する。保護された会
話を用いると、アプリケーション56Aと56Dが、対
等にデータを送受できるようになる。これは、アプリケ
ーション56Aまたはアプリケーション56Dのどちら
側からも送信または受信を開始でき、それが、アプリケ
ーションの製作者と、通信マネジャが使用するパラダイ
ムとによって決定されることを意味する。上述したよう
に、保護された会話は、それぞれ保護会話アダプタ64
Aおよび64Dによって、両方の同期点マネジャに登録
される。最初のコミットを発行したアプリケーションに
対する同期点処理の間、保護会話アダプタは、同期点マ
ネジャに対して資源を代理し、要求された作業をコミッ
トできるか否か(第1段階)、およびそれを成功裡に達
成したか否か(第2段階)を応答しなければならない。
パートナの保護会話アダプタから第1段階のコールを受
け取るもう一方の保護会話アダプタにとって、保護され
た会話はパートナの同期点マネジャであり、それを介し
て段階1と段階2の指令を受け取る。そのローカル同期
点マネジャは、資源マネジャのように振る舞う。すなわ
ち、保護会話アダプタは、同期点マネジャの資源が行っ
たことの結果を受け取る(段階1および段階2)。使用
される同期点パラダイムは、アプリケーション・パート
ナが第1のコミットを発行する規則を提供することに留
意されたい。この例では、どのアプリケーション・パー
トナも、最初にコミットを発行することができ、このこ
とは分散アプリケーションの設計によって決まる。
信ファシリティ57Aから成功裡に送られた旨の指示と
共に制御を得る。この時点で、アプリケーション56A
は、アプリケーション56Dに要求を送ることができ、
アプリケーション56Aは、確立された会話を介してア
プリケーション56Dに要求を送る。この例では、最終
的にこの要求は、アプリケーション56Dにファイル・
アプリケーション・プログラム・インタフェースを呼び
出させて、ファイル78Dを更新させる。上述したよう
に、この更新要求は、保護ファイル・アダプタ62D
に、(アプリケーション56Dが開始された時にアプリ
ケーション56Dに割り当てられた(ステップ53
2))同一の作業ユニットの下で、同期点マネジャ60
Dに登録させる(ステップ533)。また、ステップ5
33で、アプリケーション56Dは、会話を介してアプ
リケーション56Aに、作業を完了したことを示す応答
を送る。次に、アプリケーション56Aは、ファイル7
8Aおよび78Bに関する更新要求を発行する。上述し
たように、保護ファイル・アダプタ62Aおよび62B
は、すでに同期点マネジャ60Aに登録済みであり、そ
れぞれ資源マネジャ63Aおよび63Bにコンタクトし
てこの更新を実行する(ステップ533および533
A)。
マネジャ60Aにコミット58Aを発行する(ステップ
534)。上述したように、同期点マネジャ60Aは、
回復ファシリティ70Aにコンタクトしてその段階1の
ロギングを求め、登録された各資源に対して段階1の
「準備」コールを発行する(ステップ534Aおよび5
35A)。保護ファイル・アダプタ62Aおよび62B
は、上述したように振る舞う。保護会話アダプタ64A
は、段階1の「準備」コールを受け取った時、それが代
理する保護された会話、すなわち最初にアプリケーショ
ン56Aによってアプリケーション56Dに対して確立
された会話を介して、体系的システム間「準備」コール
を送る(ステップ535)。保護会話アダプタ64D
は、この「準備」コールを認識して、会話メッセージ受
取コールを発行したアプリケーション56Dに、コミッ
トの発行を要求する戻りコードを与える(ステップ53
6)。次に、アプリケーション56Dは、同期点マネジ
ャ60Dに対してコミット58Dを発行する(ステップ
537)。上述したように、同期点マネジャ60Dはそ
の回復ファシリティにコンタクトするが、この場合は、
回復ファシリティ70Dにコンタクトして、段階1情報
をログ72Dに強制ロギングさせる(ステップ53
8)。アプリケーション56Aが元のコミット要求を発
行し、その要求に応じてアプリケーション56Dが後で
コミットを発行したので、この実施例で使用する2段階
コミット・パラダイムに基づくと、同期点マネジャ60
Dの段階1の状態は「開始側カスケード、同期点マネジ
ャ保留中(Initiator Cascade,Sy
ncpoint Manager Pending)」
である(ステップ538)。同期点マネジャ60Dは、
段階1の「準備」コールを用いて保護ファイル・アダプ
タ62Dにコンタクトする(ステップ538)。保護フ
ァイル・アダプタ62Dとそれに関連する資源マネジャ
63Dは、上述したように段階1の処理を実行し、「コ
ミット要求」の回答を戻す。
ロック539からステップ540に進み、同期点マネジ
ャ60Dが、回復ファシリティ70Dにコンタクトし
て、ログ72Dを「代理、不確定(Agent,Ind
oubt)」の状態に強制ロギングさせる。この状態
は、その後に中断が起こり、その結果、同期点マネジャ
60Dが、同期点マネジャ60Aから段階2の決定を受
け取らなくなる場合、回復ファシリティ70Aからの回
復処理がその同期点処理を完了するのを待たなければな
らないことを意味する。次に、同期点マネジャ60D
は、保護会話アダプタ64Dにコンタクトして「コミッ
ト要求」の回答を与える。次に、保護会話アダプタ64
Dは、体系的システム間フォーマットの「コミット要
求」を保護会話アダプタ64Aに送り(ステップ54
1)、保護会話アダプタ64Aは、同期点マネジャ60
Aに「コミット要求」と回答する(ステップ542)。
上述したように、同期点マネジャ60Aは保護ファイル
・アダプタ62Aおよび62Bから「コミット要求」を
受け取った(ステップ535A)。この例では中断がな
いので、判断ブロック543からステップ544に進
み、同期点マネジャ60Aが回復ファシリティ70Aに
コンタクトして、ログ72Aを段階2の「開始側、コミ
ット済み(Initiator,committe
d)」の状態に強制ロギングさせる(ステップ54
4)。次に、同期点マネジャ60Aは、段階2の「コミ
ット済み」の決定で、登録された各保護資源アダプタを
呼び出す(図5B、ステップ545)。保護ファイル・
アダプタ62Aおよび62Bは、上述したようにこのコ
ミットの決定を処理する(ステップ545A)。保護会
話アダプタ64Aは、このコミット決定を受け取った
時、それが代理する保護会話、すなわち最初にアプリケ
ーション56Aによってアプリケーション56Dに対し
て確立された会話を介して、体系的システム間フォーマ
ットの「コミット済み」コールを送る(ステップ54
6)。保護会話アダプタ64Dは、この「コミット」コ
ールを受け取り、同期点マネジャ60Dに段階2の「コ
ミット」の決定を回答する(ステップ547)。
は、回復ファシリティ70Dにコンタクトして、ログ7
2Dを段階2の状態に強制ロギングさせる。アプリケー
ション56Aが、元のコミット要求を発行し、それに応
じてアプリケーション56Dが後でコミットを発行した
ので、この実施例で使用する2段階コミット・パラダイ
ムに基づいて、同期点マネジャ60Dの段階2の状態は
「開始側カスケード、コミット済み」である(ステップ
548)。同期点マネジャ60Dは、保護ファイル・ア
ダプタ62Dにコンタクトしてこの段階2のコミットの
決定を与える(ステップ549)。保護ファイル・アダ
プタ62Dとそれに関連する資源マネジャ63Dは、上
述のコミット処理を行い、「忘却」の回答を戻す。中断
がなかった(判断ブロック550)ので、同期点マネジ
ャ60Dは回復ファシリティ70Dにコンタクトして、
この作業論理ユニットに対する同期点ログ・レコードに
対して、状態「忘却」をログ72Dにロギングさせる
(ステップ551)。「忘却」は、同期点処理が完了
し、そのログ・レコードが消去可能であることを意味す
る。次に、同期点マネジャ60Dは、保護会話アダプタ
64Dとコンタクトして、「忘却」の回答を与える。こ
の実施例で使用する2段階コミット・パラダイムに基づ
いて、同期点マネジャ60Dは、作業論理ユニット識別
子を1だけ増分し、アプリケーション56Dに、コミッ
トが成功裡に完了したとの指示を戻す(ステップ55
2)。作業論理ユニット識別子を更新することによっ
て、分散アプリケーションが行う次の作業論理ユニット
が一義的であることが保証される。
システム間フォーマットの「忘却」の回答を保護会話ア
ダプタ64Aに送り、保護会話アダプタ64Aは、同期
点マネジャ60Aに「忘却」を回答する(ステップ55
3)。上述したように、同期点マネジャ60Aは、保護
ファイル・アダプタ62Aおよび62Bからも「忘却」
の回答を受け取る(ステップ545A)。中断がないと
仮定すると、判断ブロック554からステップ555に
進んで、同期点マネジャ60Aは、回復ファシリティ7
0Aにコンタクトして、この作業論理ユニットに対し
て、状態「忘却」をログ72Aにロギングさせる。やは
り、使用する2段階コミット・パラダイムに基づいて、
次に同期点マネジャ60Aは作業論理ユニット識別子を
1だけ増分する(ステップ556)。この変更によっ
て、分散アプリケーションに対する次の作業論理ユニッ
ト識別子が一義的であることが保証される。次に、同期
点マネジャ60Aは、このコミット要求が成功裡に完了
した旨をアプリケーション56Aに通知する。2段階コ
ミット手順中に、同期点マネジャ60Aまたは同期点マ
ネジャ60Dまたはその両方内で同期点処理が中断され
た場合、回復ファシリティ70Aおよび回復ファシリテ
ィ70Dは、論理流れの中でステップ557と558お
よびステップ559と560で表される回復動作を実施
することになる。この回復動作は、下記「保護された資
源を回復するためのログ名の交換」、「分散アプリケー
ション用の未完了の同期点のための回復ファシリティ」
および「コミット手順の非同期的再同期化」にさらに詳
しく説明されている。
り、図2と比較して説明するのが最適である。図2およ
び図55では共に、アプリケーション環境、システム・
ファシリティおよび資源マネジャが分散されている。し
かし、図2では、1つの物理装置、システム50Aが、
複数のアプリケーション環境52A、52B、52C、
2つの資源マネジャ63A、63B、回復ファシリティ
70Aおよび通信ファシリティ57Aを含んでいる。図
2では、システム制御プログラム55Aは、会話マネジ
ャ53Aおよび同期点マネジャ60A、60B、60C
を含んでいる。図2のシステム50Aは、メインフレー
ム・コンピュータであってよく、このタイプの構成は、
しばしば集中コンピュータ処理と呼ばれる。また、図2
では、システム50A内のアプリケーション環境が、通
信ネットワークを介してシステム50D内のアプリケー
ション環境に接続されている。これとは対照的に、図5
5では、アプリケーション環境、システム・ファシリテ
ィおよび資源マネジャが、それぞれ別々の実計算機内に
ある。この構成は、分散コンピュータ処理と呼ばれる。
この環境では、システム90A、90B、90C、11
0E、114F、120Gは、プログラム式ワークステ
ーションであって、図2のシステム50Aおよび50D
に機能は類似しているが、サイズや性能は必ずしも類似
していない。図55のシステムは、たとえばローカル・
エリア・ネットワーク(LAN)などの通信ネットワー
クによって接続される。図55のアプリケーション環境
92A、92B、92Cは、図2のアプリケーション環
境52A、52B、52Cと機能は同等である。しか
し、アプリケーション環境92A、92B、92Cはそ
れぞれ、別々のプログラム式ワークステーションに含ま
れている。図55のシステム制御プログラム95A、9
5B、95Cはそれぞれ、図2のシステム制御プログラ
ム55Aと機能的に同等である。システム制御プログラ
ム95A、95B、95Cはそれぞれ、(a)同期点マ
ネジャ60A、60B、60Cと機能的に同等な同期点
マネジャ100A、100B、100C、(b)実行環
境制御プログラム61A、61B、61Cと機能的に同
等な実行環境制御プログラム91A、91B、91C、
(c)保護会話アダプタ(PCA)64A、64B、6
4Cと機能的に同等な保護会話アダプタ104A、10
4B、104C、(d)資源アダプタ(RA)62Aお
よび62Bと機能的に同等な資源アダプタ102A、1
02B、102C、および103A、103B、103
C、(e)会話マネジャ53A、53B、53Cと機能
的に同等な会話マネジャ93A、93B、93C、およ
び通信ファシリティ57Aと機能的に同等な通信ファシ
リティ97A、97B、97Cを含む。しかし、図55
の例では、通信ファシリティは各システム制御プログラ
ム95A、95B、95Cの一部であって、それ自体の
実行環境に含まれてはいない。また、図55では、資源
マネジャ112Eおよび113Fは、図2の資源マネジ
ャ63Aおよび63Bと機能的に同等であり、それらの
ファイル115E、117Fおよびログ116E、11
8Fは、図2のファイル78A、78Bおよびログ80
0A、800Bと機能的に同等である。しかし、資源マ
ネジャ112Eおよび113Fは、それぞれ別々のプロ
グラム式ワークステーション上にある。図55の回復フ
ァシリティ121Gおよびそのログ122Gは、図2の
回復ファシリティ70Aおよびそのログ72Aと機能的
に同等である。しかし、回復ファシリティ121Gは1
つのプログラム式ワークステーション内にある。図55
のシステム50Dは、図2のシステム50Dと同一であ
り、このネットワークの融通性を示すために含めてあ
る。この環境での同期点処理の説明は、上記の同期点処
理の説明で、図2の番号を対応する図55の番号に置き
換えることによって得られる。したがって、本発明は広
範囲なコンピュータ・システムおよびネットワークで実
施できる。
ら回復ファシリティ70Aが利用不能になる可能性があ
る。したがって、システム50Aはバックアップを提供
する。たとえば、回復ファシリティ70Aが、資源マネ
ジャをも制御する実行環境の一部であり、この資源マネ
ジャが動作不能になる障害に出会った場合、回復ファシ
リティ70Aも動作不能になる。図28に示した例で
は、システム50Aは1つの資源マネジャ専用の複数の
実行環境を含み、その資源マネジャを含む各実行環境が
回復ファシリティ・プログラムをも含んでいるが、シス
テム内で同時に活動状態になれる回復ファシリティは1
つだけである。
0A内に、それぞれ資源マネジャ(プログラム)260
A、260B、260Cを含む3つの同等な実行環境5
2E、52F、52Gがある。資源マネジャ260A、
260B、260Cはそれぞれ、VM/SPリリース6
オペレーティング・システムの共用ファイル・システム
(SFS)資源マネジャ(“VM”はIBMコーポレー
ションの登録商標)の拡張バージョンとそれに関連する
資源262A、262B、262Cであることが好まし
い。さらに、各実行環境52E、52F、52Gはま
た、図23に示した回復ファシリティ70Aの機能を実
現するため、プログラム70A、70B、70Cをも含
む。共用ファイル・システムを含む実行環境内に各回復
ファシリティを置くことの利点は、その共用ファイル・
システムに、回復ファシリティが使用できるサービス、
すなわち通信サービスおよびタスク処理サービスが含ま
れることである。通信サービスは、通信プロトコル、割
込み処理、メッセージ管理を処理する。図28のシステ
ム50Aでは、回復ファシリティ70Aは、当初、実行
環境52Eが初期設定される際に回復ファシリティ・ロ
グ72Aに関連づけられる回復ファシリティとして、シ
ステム制御プログラムに識別される。これは、実行環境
52Eの初期設定処理への入力としてあるパラメータを
指定することによって達成される。実行環境52Eは、
システム制御プログラムに対してそれ自体を、回復ファ
シリティとして、かつシステム50A内での資源識別子
sync_point_logに対するすべての通信のターゲットとし
て識別する(資源識別子sync_point_logの説明について
は、「保護された資源を回復するためのログ名の交換」
を参照されたい。)。この資源識別子sync_point_log
は、システム50A内で一義的でなければならず、常に
1つの実行環境にしか関連づけることができない。この
実施例では、実行環境52Eが回復ファシリティ・ログ
72Aを含む持久記憶域を定義し、その結果、実行環境
52Eを指定すると、別の記憶域を指定するそれに勝る
指定がない場合、自動的にログ72Aが資源回復ログと
して暗示されることになる。
る場合、ユーザはバックアップとして回復ファシリティ
70Bまたは70Cを活動化し、ログ72Aを実行環境
52Fまたは52Gに移動することができる。これは、
実行環境52Fまたは52Gの初期設定時に前述のパラ
メータを指定し、この実行環境に対して回復ファシリテ
ィ・ログ72Aの位置を指定することによって行われ
る。ユーザがログ72Aの位置を指定するには、回復フ
ァシリティ・ログ72Aを含む持久記憶域の位置を識別
するのに必要な、選択された実行環境52Fまたは52
Gからのコマンドを、システム制御プログラムに与え
る。
に回復ファシリティが必要とする情報は、すべて回復フ
ァシリティ・ログ72Aに含まれており、同期点回復に
必要な情報は、実行環境、資源マネジャまたは関連する
持久記憶域には含まれていない。したがって、回復ファ
シリティ・プログラムを含む資源マネジャを有するどん
な実行環境も、活動状態の回復ファシリティがログ72
Aにアクセスできる限り、回復ファシリティ70Aとし
て動作することができる。回復ファシリティ機能の、実
行環境52Fへのバックアップ転送は、通信経路272
Bで示され、回復ファシリティ機能の、実行環境52G
へのバックアップ転送は、通信経路272Cで示されて
いる。
ション環境内の同期点マネジャ60A、60Bまたは6
0Cのいずれかの間で通信を行うには、システム制御プ
ログラムを介して回復ファシリティに対する会話を開始
する際に、資源識別子sync_point_logを使用する。
ルおよびグローバルなコミット範囲前述の図5Aおよび
5Bの流れ図には、単一の作業論理ユニットまたはコミ
ット範囲が、たとえば異なるシステム内の複数の実行環
境内の資源とアプリケーションなど、異なるシステム内
の2つのアプリケーション・パートナに拡がり、コミッ
ト手順がこの2つのアプリケーション・パートナの間で
調整される場合の例が示されている。以下に、この処
理、ならびにシステム50Aが、同一の実行環境内にあ
る同一のアプリケーションに別々の作業ユニットまたは
コミット範囲を提供できることについて、詳細に説明す
る。すべてのシステム50は、このように1つまたは複
数の関連する作業ユニットに用いられる資源に合わせて
コミット範囲を正確に調整することができる。
1つのアプリケーションから直接アクセス可能であり、
共通の同期点に参加する、資源の範囲である。たとえば
(図2において)、資源アダプタ62A、62Bおよび
保護会話アダプタ64Aに結合された資源は、すべてア
プリケーション56Aから直接アクセス可能であり、し
たがって、すべて同一の作業ユニットを有することがで
きる。これらがすべてアプリケーション56Aによって
行われる関連する作業要求に用いられる場合、これらは
すべて同一の作業ユニットを有する。作業ユニット識別
子は、システム制御プログラム55によって選択され、
それぞれの実行環境内で一義的である。この実施例で
は、システム制御プログラム55Aは、会話マネジャ5
3Aと、各実行環境52用の実行環境制御プログラム6
1を含む。限定ではなく例として示すと、実行環境制御
プログラム61Aは、VM/SPリリース6オペレーテ
ィング・システム(“VM”はIBMコーポレーショ
ン.の登録商標)の拡張CMS構成要素でよい。この実
行環境制御プログラムは、アプリケーション56Aの実
行を制御し、上述したように、作業ユニット識別子を割
り当てる。したがって、作業ユニット識別子は、各実行
環境内で一義的である。アプリケーションは、複数の関
連する作業要求に対して同一の作業ユニットを使用し、
関連しない作業要求に対しては異なる作業ユニットを使
用する。「作業論理ユニット」識別子とは、関連する作
業要求に使用されるすべての資源に対するグローバルに
一義的な(ネットワーク全体を通じての)識別子であ
り、関連する作業要求をすべてカバーする。作業論理ユ
ニット識別子は、その作業要求を生成したシステムの回
復ファシリティ70によって割り当てられ、この実施例
では、下記のものを含む。 (1)相互接続された1群のシステムを識別する、ネッ
トワーク識別子、 (2)そのネットワーク内の1つの通信ファシリティを
識別する、システム識別子、 (3)ローカルに一義的な要素をLUWIDに与える、
インスタンス番号(たとえば、タイムスタンプを使用し
てよい)、 (4)特定の同期点インスタンスを識別する、シーケン
ス番号。たとえば、これは、“System Network Archite
cture LU6.2 Reference: Peer Protocols, SC31-6808 C
hapter 5.3 Presentation Services- Sync Point verb
s”によって定義されるタイプのものである。同期点マ
ネジャ60は、保護会話が作業ユニット内で使用される
場合、または作業要求が保護会話を必要としなくとも、
2段階コミット手順が必要な場合に、回復ファシリティ
から作業論理ユニット識別子(LUWID)を要求す
る。LUWIDは、資源アダプタが同期点マネジャを呼
び出すことによって要求することができ、またLUWI
Dがまだ獲得されていないがコミットのために必要な場
合には、コミット処理の始めに同期点マネジャがLUW
IDを要求することができる。以下で詳細に説明するよ
うに、保護された会話や多数の保護された資源などの保
護された資源が作業ユニットで使用される時に、作業ユ
ニットがLUWIDと関連づけられる。作業ユニット
は、複数のファイルと複数のファイル記憶場所の混合
物、他の保護された資源と他の参加する資源マネジャ、
およびある分散アプリケーションの異なる部分間での保
護された会話を含むことができる。保護された会話の場
合は、各アプリケーション・パートナが、この同一の保
護された会話とこのアプリケーションによって直接アク
セスされる他の資源とに(それぞれの実行環境内で)異
なる作業ユニットを割り当てる場合であっても、単一の
作業論理ユニットが、2つ以上のアプリケーション・パ
ートナの間に拡がる。したがって、ある保護された会話
に関連する各アプリケーション・パートナはそれぞれ、
それ自体の作業ユニットをローカルに割り当てて使用す
るが、2つ以上のアプリケーション・パートナの作業ユ
ニットは、同一の分散された作業論理ユニットを参照す
る。各実行環境は、他の実行環境で割り当てられた作業
ユニットの識別を知らず、異なる実行環境内の作業ユニ
ットが同一の識別子を有することは、偶然の一致によっ
てしか起こり得ないことに留意されたい。LUWIDで
はなく、上述の拡張された範囲をもつ作業ユニットを使
用して、ローカルなコミット範囲が定義される。という
のは、既存のアプリケーションが、最小限の変更で拡張
された機能の利益を享受できるからである。作業ユニッ
トからLUWIDへの変更は面倒であり、既存のアプリ
ケーションを変更する必要がある。
ン56A用の異なる作業ユニットおよび作業論理ユニッ
トと、それぞれ異なるシステム50Aおよび50D内で
実行される複数のアプリケーション・パートナ56Aお
よび56Dに関連づけられた複数の資源に拡がる別の作
業論理ユニットとを確立する処理を、実例によって示し
た図である。図7に示した例で、アプリケーション56
Aが開始され、実行環境制御プログラム61Aから作業
ユニット識別子Xを得る(ステップ928)。実行環境
制御プログラムは、各実行環境内で一義的な作業ユニッ
ト識別子を選択する責任を負う。次に、アプリケーショ
ン56Aは、実行環境52A内の資源アダプタ62Aに
対して作業要求を行って、資源78A内にある1ファイ
ルを更新してこの作業要求を作業ユニットXの下で行う
ように、あるいはデフォルトにより、アプリケーション
56Aによって指定された「現作業ユニット」の下に割
り当てられるように指定する(ステップ930)。資源
アダプタが作業ユニットX用のLUWIDを要求する場
合(判断ブロック935)、同期点マネジャ60Aは、
LUWIDがまだ割り当てられていなければ、回復ファ
シリティ70Aから作業ユニットXをカバーするLUW
IDを要求し、そのLUWIDを作業ユニットXと関連
づける。その後、同期点マネジャは、資源アダプタにこ
のLUWIDを戻す(ステップ936)。図6に示した
例では、(資源アダプタ62Aを介してアクセスされ
た)資源78Aは、保護された会話ではないので、判断
ブロック937(図7)からステップ939に進み、資
源が更新される。資源アダプタ62Aが、まだ作業ユニ
ットXのために登録されていない場合(判断ブロック9
33)、資源アダプタ62Aを同期点マネジャ60Aに
登録する(ステップ934)。前述の例では、アプリケ
ーション56Aは、同一の作業ユニットの下でさらに別
の作業を行うことは望まず(判断ブロック940)、関
連しない新規の作業を行うことも望まない(判断ブロッ
ク941)ので、次のステップでは、アプリケーション
56Aがコミットを発行する(ステップ942)。これ
に応答して、同期点マネジャ60Aは、1段階コミット
手順を開始する(ステップ944)。ところで、アプリ
ケーション56Aは、他の関連しない作業要求を開始す
る前に作業ユニットXのためにコミットを発行する必要
がないことに留意されたい(判断ブロック941)。こ
の特定の場合には、同期点マネジャは、1段階のコミッ
ト手順を実行するので、LUWIDは不要である。
次に作業ユニットXとは独立な作業を行うために、下記
の処理を開始する。アプリケーション56Aは、実行環
境制御プログラム61Aから新規の作業ユニットを要求
し、実行環境制御プログラム61Aは、作業ユニットY
を戻す(ステップ928)。次に、アプリケーション5
6Aは、資源アダプタ62Bを介して、作業ユニットY
の下で資源78Bを更新する要求を行う(ステップ93
0)。資源アダプタが作業ユニットY用のLUWIDを
要求する場合(判断ブロック935)、同期点マネジャ
60Aは、回復ファシリティ70AからLUWIDを得
て、それを作業ユニットYと関連づける(ステップ93
6)。この時、作業ユニットY用の作業論理ユニット
は、資源マネジャ63Bのみに拡がる。次に、資源78
Bに対する更新を実施する(ステップ939)。資源ア
ダプタ62Bは、まだ作業ユニットYのために登録され
ていないので、同期点マネジャ60Aに登録される(ス
テップ934)。
作業ユニットYの下で、さらに別の作業たとえば他の資
源中のデータの変更を行うことを望む(判断ブロック9
40)。図6に示した例では、この別の作業は保護され
た会話であり、この保護された会話が、分散アプリケー
ション・パートナ56Dを介してシステム50D内の資
源にアクセスするのに使用される。この例では、これが
新規の保護された会話の始まりである。すなわち、アプ
リケーション56Aは、作業ユニットYの下で、アプリ
ケーション56Dとの新規の保護された会話を開始する
(ステップ930)。保護会話アダプタ64Aは作業ユ
ニットY用のLUWIDを要求するので、LUWIDが
まだ割り当てられておらず、作業ユニットに関連づけら
れていない場合、同期点マネジャは、回復ファシリティ
を呼び出し、保護会話アダプタにLUWIDを戻す(ス
テップ936)(保護会話アダプタは、この会話を開始
する時にLUWIDを必要とする(ステップ94
7)。)。次に、判断ブロック937から判断ブロック
946に進む。これは新規の保護された会話であるの
で、会話マネジャ53Aは、保護された会話を開始し、
作業ユニットYに関連するLUWIDを通信ファシリテ
ィに送る(ステップ947)。この例では、アプリケー
ション・パートナ56Dが異なるシステム内に常駐して
いるので、通信ファシリティ57Aを使用する。しか
し、アプリケーション・パートナが同一のシステム50
A内の別の実行環境、たとえば52B内に常駐している
場合は、この通信機能は、システム制御プログラム55
Aの会話マネジャ53Aによって提供され、通信ファシ
リティ57Aは使用されないことに留意されたい。保護
会話アダプタ64Aが会話マネジャ53Aから制御を返
され、保護会話開始要求が成功したことが示された時、
保護会話アダプタ64Aは、同期点マネジャ60Aに登
録され(ステップ948)、アプリケーション56Aに
制御を返す。この時、アプリケーション56Aは、アプ
リケーション56Dにメッセージを送って、資源78D
の更新を要求する(ステップ949)。ただし、このメ
ッセージは、アプリケーション56Dが開始されるま
で、システム50D内にバッファされる。メッセージを
送った後、アプリケーション56Aはこれ以上行うべき
作業がない(判断ブロック940および941)ので、
作業ユニットYに対するコミットを発行する(ステップ
942)。同期点マネジャ60Aが、2段階コミット手
順を開始する(ステップ944)。
ァシリティ57Dを介して通信ファシリティ57Aから
会話開始要求を受け取った時(図8のステップ96
0)、システム制御プログラム55Dは、実行環境52
Dを開始する(ステップ962)。保護会話アダプタ6
4Dは、実行環境52D用の新規の作業ユニットZを獲
得し、この実行環境52D内で、アプリケーション56
Dが実行環境制御プログラム61Dから実行されること
になる。この作業ユニットは、実行環境52D内で一義
的である。また、保護会話アダプタ64Dは、開始され
た会話で受け取ったLUWIDをこの新規の作業ユニッ
トに関連づけるよう同期点マネジャに指令し、その後、
この新規の作業ユニットの下で同期点マネジャ60Dに
登録される(ステップ966)。(ステップ947での
会話開始要求の流れは、保護会話アダプタ64Aから、
会話マネジャ53A、通信ファシリティ57A、通信フ
ァシリティ57D、会話マネジャ53Dを経て、保護会
話アダプタ64Dへと向かう。)その後、アプリケーシ
ョン56Dが開始される。
プ930Dで作業要求を行う。この例では、この最初の
作業要求は、会話上でメッセージを受け取ることであ
る。この保護された会話はすでにLUWIDを有してい
るので、判断ブロック935Dから判断ブロック937
Dに進む。これは、保護された会話であるが、新規のア
ウトバウンドな保護された会話ではない(すなわち、新
規の保護された会話の開始ではない)ので、判断ブロッ
ク937Dおよび946Dからステップ949Dに進
み、メッセージをアプリケーション56Dが受け取る。
は、アプリケーション56Dに、追加の作業、たとえば
(資源アダプタ62Dを介して)資源78D内のファイ
ルの更新を行わせ、したがって判断ブロック940Dか
らステップ930Dに進み、アプリケーション56D
が、作業ユニットZを使用して資源78Dを更新するよ
うにとの作業要求を行う。資源アダプタがLUWIDを
要求する場合(判断ブロック935D)、同期点マネジ
ャは資源アダプタにLUWIDを戻す(ステップ936
D)。ステップ966ですでにLUWIDが割り当てら
れ、作業ユニットに関連づけられているので、回復ファ
シリティを呼び出してLUWIDを割り当てる必要はな
い。この作業要求は、保護された会話資源を使用しない
ので、判断ブロック937Dからステップ939Dに進
み、作業要求に従って資源78Dを更新する。資源アダ
プタ62Dはまだ登録されていないので、判断ブロック
933Dからステップ934Dに進み、資源アダプタ6
2Dが同期点マネジャ60Dに登録される。この時点で
アプリケーション56Dは、アプリケーション56Aが
いつこの作業のコミットを要求するかを決定する必要が
ある。これは、アプリケーション56Dにより、保護さ
れた会話上で(作業要求を)受け取ることによって、達
成される。アプリケーション56Aがコミットを発行済
みの時には、アプリケーション56Dは、戻りコードTa
ke_Syncpointを得る。したがって、判断ブロック940
Dからステップ930Dに進み、アプリケーション56
Dが、作業ユニットZの下で保護された会話上で受取り
を発行する。保護会話アダプタ64DにはLUWIDが
不要であり(判断ブロック935D)、この作業要求は
保護された会話を使用し(判断ブロック937D)、こ
の保護された会話は新規のアウトバウンドな会話ではな
い(判断ブロック946D)ので、受取りが行われる
(ステップ949D)。アプリケーション56Dには、
作業ユニットZ上で行うべき追加の作業がないので、判
断ブロック940Dから判断ブロック941Dに進む。
アプリケーション56Aがコミットを発行済みの時は
(判断ブロック941D)、アプリケーション56D
は、受取り時に戻りコードTake_Syncpointを得て、コミ
ットを発行する(ステップ942D)。次に、同期点マ
ネジャ60Dが、コミット手順を開始する(ステップ9
44D)。この例では、これで作業ユニットZに関連す
る作業要求は完了し、判断ブロック950Dからアプリ
ケーション56Dの終わりに進む。この時、アプリケー
ション56Aは、同期点マネジャ60Aから制御を返さ
れ、終了する。
は、本発明で使用する例による、実行環境52Aおよび
52D内でのコミットのタイミングが示されている。保
護された会話が、実行環境52Aに対して送られる状態
の時、アプリケーション56Aは、ステップ942(図
7)に関して前述したように、作業ユニットYに関する
コミットを発行する。実行環境52Dが、保護された会
話に対して受け取る状態にある時は、実行環境52D
は、実行環境52Aから戻りコードTake_Syncpointと共
にメッセージを受け取る。戻りコードTake_Syncpointを
受け取った後、アプリケーション56Dはできるだけ早
くコミットを発行すべきであることに留意されたい。と
いうのは、この戻りコードは、アプリケーション56A
がコミットを発行済みであり、実行環境52Dがそれに
対応するコミットを発行するのを待っていることを示し
ているからである。したがって、保護された会話上でメ
ッセージと戻りコードを受け取った後、アプリケーショ
ン56Dは、システム50D内の作業ユニットに関連す
る他の保護された資源に関する作業を完了して、それら
他の資源を整合性のある状態にする。これを行った結
果、作業ユニットZに関連するシステム50D内のすべ
ての資源が整合性のある状態になった後に、アプリケー
ション56Dは前記のコミットを発行する。次に、同期
点マネジャ60Aおよび60Dは、それぞれアプリケー
ション56Aおよび56Dから直接アクセスされる資源
に対して2段階コミット手順を実施する。それぞれのア
プリケーションからアクセスされる資源をコミットする
ために、別々のコミットが呼び出されるにもかかわら
ず、この2段階コミット処理の間に、各同期点マネジャ
は、同期点状況の情報をもう一方の同期点マネジャに報
告する。同期点処理のさらに詳しい説明については、
「保護された資源の調整式同期点管理」を参照された
い。
る。この登録は、保護された資源を同期点マネジャ(S
PM)60に対して識別するファシリティである。それ
ぞれのアプリケーション実行環境52で、資源アダプタ
62/64および同期点マネジャ60は、アプリケーシ
ョン56のために登録に参加する。この実施例では、資
源マネジャ63と資源78は、この環境の外部にある。
部分、作業要求とコミット要求を有するものとして示さ
れている。これらの部分は共に、通常は同一のアプリケ
ーション実行環境内で実行される。しかし、図中でこれ
ら2つの部分の間にある破線が示すように、このアプリ
ケーションは分散していてもよく、またこれら2種類の
要求が異なる環境から出されてもよい。
グラムの開始ファシリティを呼び出して、アプリケーシ
ョン56を開始すると仮定する。この開始ファシリティ
は、アプリケーション実行環境52を構築し、アプリケ
ーション56をロードし、それに制御を移す。アプリケ
ーション56が実行を開始する時、まだ同期点マネジャ
60に登録されている資源78はない。
を使用するために作業要求を行う時(図3のステップ5
00および図5Aのステップ530)、この要求は、資
源78に関連する特定の資源アダプタ62または64を
呼び出す。資源アダプタ62または64の一般的な機能
は、アプリケーション56を資源マネジャ63に接続す
ることである。システム50において、資源アダプタ6
2または64は、同期点マネジャ60に自動的に登録を
行う登録サブルーチンと、2段階コミット手順をサポー
トするアダプタ同期点出口入口点とを含むように拡張さ
れている。
6から資源マネジャ63へ作業要求(たとえば、ファイ
ルのオープン、データベースへのレコード挿入、会話の
開始など)をパスする、資源アダプタ62または64内
のコード行を示す。また、これらのコード行は、資源ア
ダプタ62または64内の登録サブルーチンと相互作用
して、自動的に登録を行う。この登録で、同期点マネジ
ャ60に、資源78がある作業ユニットの一部であるこ
とが知らされる。また、この登録で、資源マネジャ63
が同期点マネジャ60に対して識別される。これは、具
体的には、同期点マネジャ60に、アダプタ同期点出口
入口点と、資源マネジャの資源識別子object_recovery
を知らせることからなる。
求が行われる時に(図3のステップ506および図5A
のステップ534)同期点マネジャ60の2段階コミッ
ト・ファシリティが使用する、資源アダプタ62または
64内のコード行を示す。資源識別子object_recovery
は、下記「保護された資源を回復するためのログ名の交
換」(図26のステップ225)で説明するように、同
期点マネジャ60の2段階コミット手順中に障害が発生
した場合に、回復ファシリティ70が資源マネジャ63
との会話を開始するために使用する識別子である。
を処理するために、資源アダプタ62または64のいず
れかに対する作業要求によって開始される処理は、資源
に応じて異なる。使用される資源78は、本来作業要求
の性質とは無関係に保護されることができ、それがまだ
登録されていない場合には、資源アダプタ62または6
4が、その登録サブルーチンを使用して、アプリケーシ
ョン56のためにこの資源を同期点マネジャ60に自動
的に登録する。また、アダプタ62または64は、資源
78が保護されるか否かを知らず、資源マネジャ63が
これを知っていてもよい。この場合、資源アダプタ62
または64は、資源マネジャ63に登録して、作業要求
を資源マネジャ63に渡すことができる。資源マネジャ
63は、この作業要求を行った後、アダプタ62または
64に資源78が保護を必要とするか否かの指示を戻す
ことができる。保護が不要な場合、資源アダプタ62ま
たは64は、その登録サブルーチンを使用して、同期点
マネジャ60から登録を取り消すことができる。あるい
は、資源アダプタ62または64は、その資源がアプリ
ケーション56によって変更されるか否か、すなわちそ
の資源が読取りだけに使用されるか否かを、作業要求ま
たは資源マネジャ63から独自に決定することができ
る。読取りのみの場合、資源アダプタ62または64
は、同期点マネジャ60の登録ファシリティを使用し
て、登録を読取り専用に変更することができる。最後
に、資源アダプタ62または64は、資源78が読取り
専用の資源か、それともできるだけ早く他のアプリケー
ションに利用可能にしなければならない、保護されない
資源かを決定することができる。この場合、資源アダプ
タは、2段階コミット手順中に「準備」指令を得るため
に、登録されたままでいてよい。その後、資源アダプタ
62または64は、資源78をロック解除する合図とし
てこの指令を使用することができる。この場合、アダプ
タ62または64は、同期点マネジャ60からの指令に
対して「準備済み」および「コミット」と回答すること
ができる。
の取消しと変更をサポートすることによって、資源アダ
プタ62または64は、2段階コミット手順の最適化を
可能にする情報を同期点マネジャ60に与えることがで
きる(これも以下で説明する)。アプリケーション56
がコミット要求を発行する時、同期点マネジャ60は、
1つの資源だけが変更済みとして登録されている(他の
資源が登録されていないか、あるいは他のすべての資源
が読取り専用として登録されている)と認識することが
できる。この場合、同期点マネジャ60は、より効率的
な1段階コミット手順を使用することができる。
行中であって、パートナ・アプリケーション56Dとの
保護された会話を求める作業要求を行う(図5Aのステ
ップ530)という特定の例に対して適用した場合の、
前述の一般的な制御の流れについて考察する。この要求
は、資源アダプタの1タイプである保護会話アダプタ6
4Aによって処理される。アダプタ64Aは、その登録
サブルーチンを使用して、同期点マネジャ60Aの登録
ファシリティを呼び出す(ステップ532)。次に、ア
ダプタ64Aは、資源マネジャとして働く通信ファシリ
ティ57Aを使用して、パートナ・アプリケーション5
6Dを初期設定する。図2に示すように、会話マネジャ
53Aは、同一のシステム50A上のパートナ・アプリ
ケーションを始動することができ、あるいは通信ファシ
リティ57Aを介して別のシステム50D上の対応する
通信ファシリティ57Dと通信して、システム50D内
のアプリケーションを始動することもできる。後者の場
合、パートナ・アプリケーションはシステム50D上で
実行され、通信ファシリティ57Dが、システム制御プ
ログラム55Dの開始ファシリティを呼び出すことによ
って、パートナ・アプリケーション56Dを開始する。
このファシリティは、パートナ・アプリケーション56
D用の新規のアプリケーション実行環境52Dを構築す
る。開始ファシリティは、それがパートナ・アプリケー
ション56Dを構築中であることを知っているので、起
点側アプリケーション56Aとの保護された会話で通信
ファシリティ57Dが使用されることも知っている。し
たがって、開始ファシリティは、一時的にパートナ・ア
プリケーション56Dとして働き、保護された会話のた
めに保護会話アダプタ64Dを呼び出す。次に、資源ア
ダプタ64Dは、この保護された会話を同期点マネジャ
60Dに登録する。したがって、パートナ・アプリケー
ション56Dと起点側アプリケーション56Aとの保護
された会話が、パートナを呼び出す前に登録される(そ
の代わりに、パートナ・アプリケーション56Dがアプ
リケーション56Aとの会話を使用するまで、登録を遅
延させることもできる)。したがって、図2において、
アプリケーション56Aの実行環境52A内の同期点マ
ネジャ60Aと、パートナ・アプリケーション56Dの
実行環境52D内の同期点マネジャ60Dは、それぞ
れ、この保護された会話資源について知らされる。
ケーション56Aおよびパートナ・アプリケーション5
6Dは、それぞれの作業ユニットの下でそれぞれの実行
環境52Aおよび52D内で実行中であり、それぞれ1
つまたは複数の保護された資源78Aまたは78Dを使
用することができる。たとえば、保護されたファイルを
使用することができる。アプリケーション56Aが、フ
ァイル資源78Aを使用するようにとの要求を行う時、
資源アダプタ62Aが呼び出される。アダプタ62A
は、その登録サブルーチンを使用して、同期点マネジャ
60Aの登録ファシリティを呼び出す。次に、アダプタ
62Aは、ファイル資源マネジャ63Aを呼び出す。し
たがって、アプリケーション56Aによる保護された資
源78Aの使用が、やはり自動的に登録される。同様に
して、実行環境52D内で、資源78Dなど1つまたは
複数の資源に対する登録を行うことができる。
ないので、この登録の実施例が総称的であることがわか
る。図10では、保護された資源78をサポートしよう
とする資源マネジャ63は、その資源アダプタ62また
は64に登録サブルーチンを追加することができる。シ
ステム50の同期点サポートを変更する必要はない。
されない資源を使用することもできる。たとえば、アプ
リケーション56は、実行中の作業に関するメッセージ
を定期的に表示する保護されないパートナ・アプリケー
ションを生成したいが、この表示を実際の作業の完了と
同期させる必要はないことがある。この場合、アプリケ
ーション56は、保護されない会話をもつようにとの作
業要求を行う。この制御の流れは、上述の例の保護され
た会話の場合とほぼ同じである。唯一の相違は、資源ア
ダプタ64が作業要求内の情報から、この会話が保護さ
れず、この実施例では同期点マネジャ60に登録されな
いことを知っている点である。したがって、保護されな
い会話は、同期点マネジャ60の同期点処理には参加し
ない。
ると、アプリケーション56がコミット要求を発行する
時、同期点マネジャ60は、同期させる必要のある保護
された資源の完全なリストをもっている。同期点マネジ
ャ60内での2段階コミット手順について説明した、前
述の「保護された資源の調整式同期点管理」を参照され
たい。この説明は、資源マネジャ63内で同期点サポー
トを使用するために、同期点マネジャ60が、資源アダ
プタ62または64内のアダプタ同期点出口入口点をど
のように使用するかを示している。図10には示されて
いないが、アプリケーション56はバックアウト要求を
発行することもできる。この場合、同期点マネジャ60
は、資源アダプタ62または64内のアダプタ同期点出
口入口点にバックアウト指令を与える。
0は、アプリケーション56の登録リストを破壊しな
い。しかし、各マネジャは、後同期処理のために、資源
アダプタの出口をもう1度呼び出す。この呼出しに対し
て、アダプタはその登録を修正するよう決定することが
できる。性能上の理由から、アダプタは、アプリケーシ
ョン56が終了するまで資源を登録状態に保つことがで
きる。一方、資源78がこれ以上使用されない(たとえ
ば、アプリケーション56が終了する前に保護された会
話が終わる)ことをアダプタが知っている場合、アダプ
タは、その登録入口点を使用して、同期点マネジャ60
から登録を取り消すことができる。
ジャ63を仮定した。したがって、資源78を使用する
という要求は、必ず適当な資源アダプタ62または64
に向かい、このアダプタは、同期点マネジャ60内の登
録ファシリティと、分散資源マネジャ63内の作業要求
を呼び出した。ところが、資源マネジャ63が分散式で
はない場合、作業要求でアダプタを使用する必要はな
い。この場合、資源マネジャ63と同期点マネジャ60
が、同一のアプリケーション実行環境52内にあるの
で、資源マネジャ63は、同期点マネジャ60内の登録
ファシリティを直接呼び出すことができる。
56Aが複数の作業要求を行う。これらの要求は、シス
テム50Aによって並列に処理され、複数の資源マネジ
ャと資源を必要とする。この例について具体的に言う
と、アプリケーション56Aは、2つの作業ユニットC
およびDに対して8つの作業要求を行い、これらの要求
がシステム50Aによって並列に処理される。コミット
点が図13に示されているが、作業ユニットCのコミッ
ト点は時刻19と44にあり、作業ユニットDのコミッ
ト点は時刻33にある。図13の時間単位は、シーケン
スを表す論理的クロック単位である(物理的クロック単
位ではない)。図13において、同一の時刻に発生する
事象は、互いの順序がどうでもよいことを暗示してい
る。
に参加するかについてのアプリケーション側の理解また
は範囲である。アプリケーションは、どの作業ユニット
に対して保護された資源の変更が行われるかを指定する
ことができる。また、アプリケーションは、保護された
会話をどの作業ユニットの下で開始するかも指定するこ
とができる。システム50Aは、アプリケーション実行
環境(図12の52A)内で複数の作業ユニットを許容
する。具体的に言うと、アプリケーション、同期点マネ
ジャ60Aおよび保護されたアダプタ(たとえば、図1
2のSQL資源アダプタ)は、複数の作業ユニットを並
列してサポートすることができる。また、システム50
Aは、保護された会話を介して、2つのアプリケーショ
ン実行環境の作業ユニットを結合することも許容する。
各作業ユニットは、一連の同期点を有することができ
る。ある作業ユニットに対する同期点要求は、あるアプ
リケーションの実行環境内の他の作業ユニットの活動に
は影響しない。
する。ホームタウンにいるジョーンズ氏は、息子の信託
預金への振替を行いたいと思っている。ジョーンズ氏の
銀行の安全保護部門は、顧客も従業員も含めて、取引に
かかわるすべての人物を追跡する。安全保護記録と会計
レコードは、互いに「すべてか無か」の包含関係にある
わけではないが、この2つの作業ユニットを並列して処
理する必要があるかもしれない。1つの理由としては、
この2つの作業ユニットを順に処理するのでは応答時間
が遅くなりすぎることが挙げられよう。
する作業要求は、シカゴにあるこの銀行の本店の安全保
護記録を制御する資源マネジャ63Aを使用する。資源
マネジャ63Aと通信するために、資源アダプタ62A
によって保護されない会話1が使用される。時刻1の作
業ユニットDに関する作業要求も、ジョーンズ氏の信託
預金用にシカゴにある資源マネジャ63Aを使用し、一
方、時刻7の要求は、ジョーンズ氏の他の会計レコード
が保存されているホームタウンの資源マネジャ63Bに
対するものである。資源マネジャ63Aと通信するため
に、資源アダプタ62Aによって保護されない会話2が
使用され、資源マネジャ63Bと通信するために、資源
アダプタ62Bによって保護されない会話3が使用され
る。
を使用してその最初のレコードであるメッセージ“star
t security event(安全保護事象開始)”を書き込む時
(図14のステップ612)、資源マネジャ63Aは、
その資源アダプタ62Aを介してアプリケーション実行
環境52A内に登録される。同期点マネジャ60Aは、
図12の表126内で作業ユニットCの下に、資源マネ
ジャ63A用の登録エントリを作成する(ステップ61
4)。このエントリは、出口ルーチン名と、資源アダプ
タ62Aが登録の際に渡した特別なプライベート値とを
含む、資源アダプタ62Aの出口に渡すべきパラメータ
のリストを含む。資源アダプタの出口は、この特別な値
を使用して、会話1用の制御ブロックを探し出すことが
できる。
刻19に作業ユニットCに関するコミットを要求する
時、同期点マネジャ60Aは、表126を読み取って、
どの資源アダプタ出口にこのコミット手順を開始するよ
う通知するべきかを決定する。この例では、時刻19に
作業ユニットCに関するコミットが要求される時、同期
点マネジャ60Aが資源アダプタ62Aの出口を呼び出
して、1段階コミット手順を開始する。というのは、保
護された資源が1つだけ登録されているからである。資
源アダプタ62Aの出口ルーチンは、同期点マネジャ6
0Aから、登録中に表126にセーブされた特別な値を
受け取るので、会話1を使用して資源マネジャ63Aと
通信すべきことを知る。
扱う銀行員の従業員IDをロギングする時には、登録は
行わない(ステップ613)。再登録が不要なのは、作
業ユニット登録表126から、資源マネジャ63Aが作
業ユニットCに参加していることを、同期点マネジャ6
0Aがすでに知っているからである。その結果、最初の
作業要求の後の作業ユニットCに関する各作業要求、お
よびその後の時刻44でのコミットの処理が、手早く行
われる。また、作業ユニットC用の各同期点にで、資源
アダプタ62Aと資源マネジャ63Aだけが通知を受け
る。他の資源アダプタまたは他の資源マネジャに通知す
ることによる時間の浪費はない。
Dの下で、時刻1と時刻7に作業要求を行う時、資源ア
ダプタ62Aおよび62Bの両方が、同期点マネジャ6
0Aに登録され、同期点マネジャ60Aは、表127に
登録エントリ63Aおよび63Bを追加する。
が行われる時、時刻17の信託預金更新は、全く影響を
受けない。時刻33に信託預金レコードと会計レコード
がコミットされる時、従業員IDメッセージはやはり影
響を受けない。シカゴにある資源マネジャ63Aは、別
々な2つの会話1および2を介してアプリケーション5
6Aと通信しているので、混乱しないことに留意された
い。
どの作業ユニットが活動状態であるかを知っており、資
源アダプタをこのタスクから解放するので、資源アダプ
タの開発は簡単になる。設計が簡単なので、資源アダプ
タ出口は良好に動作する。資源アダプタ出口は、必要な
ものをすべて有しており、同期点マネジャ60Aの行動
をその資源マネジャに送るだけである。もう1つの性能
上の展望は、同期点マネジャ60Aが、同期点手順を最
適化できることである。というのは、同期点マネジャ6
0Aは、どの作業ユニットのために資源マネジャが活動
状態であるかを知っており、同期点に関係ない資源のた
めに資源アダプタおよび資源マネジャを呼び出すことに
よるオーバヘッドを回避できるからである。
データベースなどの保護された資源に対して行われるタ
イプの作業要求が、その資源の状態を変更し、その結
果、登録情報を変更しなければならない場合があり得
る。これが重要であるのは、元の作業要求が、読取り専
用の要求であって、1段階コミット手順しか必要としな
いのに、その後の同一の作業ユニットの下での関連する
作業要求が、書込み要求であって、使用される複数の保
護された資源を調整するために、2段階コミット手順を
必要とすることがあるからである。
ケーション56Aは、通常、更新すべきファイル内の特
定のレコードの位置を探すために、書込み要求を行う前
にそのファイル上で1つまたは複数の読取り要求を行
う。このような読取り動作は、1段階コミット手順を用
いて実施できるが、この場合、資源アダプタ62Aは、
この読取り作業要求を受け取ると(ステップ500)、
同期点マネジャ60Aに読取りモードで登録される(ス
テップ502)。その後の読取り動作中には、必要なコ
ミット手順のタイプが変化しないので、資源アダプタ6
2Aが同期点マネジャ60Aと相互作用する必要がない
ことに留意されたい。しかし、その後、アプリケーショ
ン56Aが、同一の作業ユニットの下で資源アダプタ6
2Aに対して書込み要求を行う際には(ステップ50
4)、資源アダプタ62Aは、その同期点マネジャ60
Aにおける登録状況を書込みモードに変更する。以下で
さらに詳細に説明するように、複数の保護された資源
が、同一の作業ユニット上で書込みモードで登録される
場合には、幾分時間のかかる2段階コミット手順が使用
される。
細に示されている。ステップ580の作業要求が、その
保護された資源に関する最初の要求であり、この要求が
読取り専用である場合、判断ブロック581から判断ブ
ロック582に進む。資源アダプタ62Aは、それが登
録されている各作業ユニットの下で各資源用の内部標識
を保存していることに留意されたい。この標識が、判断
ブロック581で検査される。この資源は、保護された
会話ではないので、判断ブロック582から判断ブロッ
ク583に進む。この作業は読取り専用なので、判断ブ
ロック583からステップ585に進む。ステップ58
5で、対応する資源アダプタ62Aが、読取り専用資源
として登録される。ステップ580の次の作業要求が、
同一の作業ユニットの下での同一の資源への書込みまた
は更新である場合、資源アダプタ62Aは、読取りモー
ドとしてであるとはいえ、ステップ585ですでに登録
されているので、判断ブロック581から判断ブロック
584に進む。この資源は保護された会話ではないの
で、判断ブロック584から判断ブロック586に進
み、この要求は更新モード用なので、判断ブロック58
6から判断ブロック588に進む。次に、判断ブロック
588からステップ590に進み、資源アダプタ62A
(ステップ585ですでに読取りモードとして登録済
み)は、同期点マネジャ60Aにおけるその登録を書込
みモードに変更する。図11によれば、この資源に対す
るある作業ユニットの下での最初の作業要求が書込みモ
ードである場合には、資源アダプタ62Aが、ステップ
592で書込みモードとして登録されることに留意され
たい。
し、その同期点の完了以降に別の要求をもたないという
状況もある。その資源アダプタ62は、同期点手順が完
了した時点で、その登録状況を「中断」に変更すること
を許され、その結果、同期点マネジャ60は、現在、資
源マネジャ63が、その作業ユニットに関してどの同期
点にも参加していないことを知る。書込みモードの資源
の中断により、たとえばその作業ユニット内に書込みモ
ードの資源が他に1つしかないような時、同期点マネジ
ャ60は、残りの資源用のその後のコミット手順(1段
階コミット)を最適化できるようになる。中断された資
源アダプタ62は、その作業ユニットに関する新規の作
業要求を受け取る場合、同じ登録修正機能を用いてその
登録を活動状態に戻すことができる。
源アダプタは、分散式の同期点活動について通知を受け
るために、アプリケーションとの対話の初期に登録され
る必要がある。ただし、その時点では、登録情報が完全
に揃っていなくてもよい。たとえば、保護会話アダプタ
64Aは、同期点が発生したか否かを知る必要があるの
で、パートナ・アプリケーション56Dとの保護された
会話を開始する時点で登録される必要があるが、保護会
話アダプタ64Aがすべての登録情報を得るのは、会話
のパートナがこの会話を受け入れた後であり、これはず
っと後になってから発生するかも知れない事象である。
この情報は、その後、ステップ590に示された前述の
登録変更処理の下で追加することができる。
法をこの登録処理に追加して提供する。各資源アダプタ
62は、初めて同期点マネジャ60に登録される際に、
資源マネジャ63の識別と、その資源アダプタの同期点
処理用の出口ルーチン名の他にも、追加の情報を登録す
る。この追加情報の多くは、通常、登録が変更される際
に変更されない。その結果、この追加情報は、ステップ
590で資源アダプタ62の登録が変更される際に再登
録されない。資源アダプタ62が同期点マネジャに一回
だけ登録し、他の登録情報が変化しても変化しない、前
記の追加情報の一部のリストを下記に示す。 1.資源マネジャと資源が、システムおよびネットワー
ク内のどこに位置するかを記述する、資源識別子とネッ
トワーク識別子、 2.製品を示す、すなわち、たとえば共用ファイル、デ
ータベース、保護された会話など、資源のタイプを示す
製品識別子、 3.再同期化に必要なその他のデータ。これらの追加情
報は、毎回再登録されはしないので、登録処理が手早く
行われる。
保護された資源を使用できない、または使用しないこと
がある。この例には、アプリケーション終了、資源マネ
ジャ終了、資源マネジャへの経路が利用不能などの事象
が含まれる。ある資源がもはや使用中ではないとアプリ
ケーションが宣言できるようにする、アプリケーション
または資源マネジャのプロトコルを設けることができ
る。アプリケーション実行環境が、アプリケーションの
終了以前に資源の登録を取り消すことができるようにす
るプロトコルをサポートすることもできる。また、保護
された会話が、アプリケーションの活動のために、また
は経路障害などのエラー状態のために、終了することも
ある。このような場合には、資源アダプタまたは保護会
話アダプタが、同期点マネジャから該当する資源のイン
スタンスすべての登録を取り消すことが好ましい(図1
4のステップ618)。というのは、この登録取消しに
よって、その後の同期点処理がより効率的になる(考慮
すべき資源の数が減り、多分、消費されるメモリも少な
くなる)からである。さらに、この資源アダプタまたは
保護会話アダプタは、登録された資源に関する制御情報
を削除することができ、したがって、その後の処理をよ
り効率的にすることができる。
話アダプタ64が、資源78または保護された会話が利
用不能であることを発見した(ステップ904)、ある
いはアプリケーションが終了したことを発見した(ステ
ップ903)場合の、登録解除活動の流れを示す図であ
る。資源が利用不能であることをアダプタが発見するの
は、通常、アプリケーションの作業要求の処理中である
ことに留意されたい(ステップ902)。アダプタは、
それ自体の資源登録状況の情報から、どの資源の登録を
取り消さなければならないかを決定する(ステップ90
6)。このような登録されている各資源について、アダ
プタは、同期点マネジャ60を呼び出して、その資源の
登録を取り消す(ステップ907)。アダプタは、同期
点マネジャ60に対して、資源と作業ユニットを識別し
なければならないことに留意されたい。
すごとに(ステップ910)、同期点マネジャ60は、
アダプタから供給された作業ユニット識別子を使用し
て、その作業ユニット資源表を探し出す(ステップ91
1)。この作業ユニットの資源表から、同期点マネジャ
60は、アダプタから供給された作業ユニット識別子を
使用して、所望の資源エントリを探し出す(ステップ9
12)。次に、同期点マネジャ60は、その資源エント
リに登録を取り消された旨のフラグを立て(ステップ9
13)、呼出し側アダプタに戻る(ステップ914から
ステップ907に戻る)。しかし、論理上、この登録を
取り消された資源エントリは、次の同期点まで保存しな
ければならないエラー情報を含んでいるので、同期点マ
ネジャ60は、まだこの資源エントリを消去することが
できない(「コミット手順におけるエラー・コードおよ
びエラー記述情報の調整式処理」を参照されたい)。
源に関する制御情報を削除する(あるいは、登録を取り
消された旨のマークを付ける)ことができる(ステップ
908)。登録取消しを引き起こした事象が、複数の資
源登録を削除させる場合があることに留意されたい(た
とえば、1つの資源が複数の作業ユニットのために登録
されている場合がある)。したがって、ステップ90
6、907、908をプログラム・ループにして、以前
に登録された該当する各資源を処理することができる。
その後、アダプタは呼出し側に戻ることができる(ステ
ップ909)。資源が利用不能であるために作業要求が
失敗した場合、アダプタは、資源アダプタがアプリケー
ション・ユーザにエラー情報を戻すために選択したどん
な機構を用いてもアプリケーションにエラー状態を報告
することができる。
か、またはアプリケーションが終了した結果として、他
の処理上の問題を生じることがある。たとえば、資源が
利用不能な状態であったため資源更新のバックアウトを
引き起こす場合、アダプタは、アプリケーションまたは
同期点マネジャ60あるいはその両方に、該当する作業
ユニット上の次の同期点がバックアウトでなければなら
ないことを通知する必要がある。同期点処理中にこの状
態が発生すると、アダプタは、(バックアウト中の)資
源の状況を同期点マネジャ60に通知しなければならな
い。この他にも、資源、環境または実施様態に依存する
他の問題が生じるかもしれない。
てられた登録取消し済みの(ステップ913からの)資
源の処理に従事し、その結果、それらの資源は通常の処
理では無視されて、最終的に消去されることになる。同
期点マネジャ60は、フラグを立てられた登録取消し済
みの資源エントリを、その影響を受ける作業ユニットの
次の同期点の始めに消去することができる。図16に、
同期点マネジャ60内の同期点処理の流れが記述されて
いる。次の同期点処理で、登録された資源の表を読み取
る時(ステップ622)、その表中のフラグを立てられ
た登録取消し済みの資源エントリをすべて消去すること
ができる(この行動は図16には図示せず)。ステップ
622で、現在の同期点処理の間のすべての同期点資源
の参加リストを作成するので、アダプタによる資源登録
エントリの資源登録の取消しと変更は、現在の同期点処
理には影響しない。この時点で、登録取消し処理の全体
が完了する。
cture LU 6.2: Peer Protocols, sc31-6808, Chapter
5.3 Presentation Services - Sync Point Verbs”に記
載の2段階コミット手順などの2段階コミット手順を実
行する能力があり、1段階コミット手順を実行する能力
はあってもなくてもよい。2段階コミット手順は、資源
を保護するのに重要である。しかし、2段階コミット手
順は、1段階コミット手順と比べて、相対的に複雑で時
間のかかる処理である。たとえば、後で詳細に説明する
ように、2段階コミット手順では、同期点参加者に関す
る情報を回復ファシリティのログ72(図2)にロギン
グするという時間のかかるステップが必要であるが、1
段階コミット手順では、そのようなロギングの必要はな
い。また、2段階コミット手順では、コミットを実行す
るのに、資源アダプタ調整出口を2回呼び出す必要があ
るが、1段階コミット手順でデータをコミットするに
は、このような呼出しは1回だけでよい。「資源アダプ
タ調整出口」とは、同期点マネジャ60(図2)が、関
連する資源マネジャに情報を提供するための機構であ
る。同期点マネジャは、システムをできるだけ手早く動
作させるのに必要な時に限り、2段階コミット手順を使
用する。要約すると、同期点マネジャは、保護された会
話を使用するか、少なくとも2つの資源が更新モードで
あるか、あるいは1つまたは複数の参加する資源マネジ
ャが1段階コミット手順を実行できない時、2段階コミ
ット手順を使用する。すべての資源が1段階コミット手
順を実行でき、更新モードの資源がせいぜい1つである
場合には、同期点マネジャは、1段階コミット手順を使
用する。また、ある資源が読取り専用モードであり、し
たがってその資源内のデータは読み取られるが更新され
ず、かつ資源マネジャが1段階コミット手順を実行でき
る場合には、他の資源に使用されるコミット手順のタイ
プが何であれ、この資源には1段階コミット手順が使用
される。この最適化の最重要な構成要素は、資源マネジ
ャおよび資源アダプタが、作業要求によって定義される
状態、すなわち資源が読取り専用モードであるか更新モ
ードであるかを、同期点以前に決定できることである。
ある資源が読取り専用モードである場合、それは、アプ
リケーションがその資源からデータを読み取っただけで
あることを意味する。ある資源が更新モードである場
合、それは、アプリケーションがその資源内のデータを
変更したことを意味する。
アプリケーション56(図2)が、ある資源に対する作
業要求を行う(図14のステップ612)。これが特定
の作業ユニットに対する最初の作業要求である場合(図
14の判断ブロック613)、その資源に関連する資源
アダプタ62(図2)は、それが現在、その作業ユニッ
ト用の活動状態の参加する資源であることを、同期点マ
ネジャに登録する(図14のステップ615)。登録時
(図14のステップ616)に提供しなければならな
い、この資源に関する情報の1つは、関連する資源マネ
ジャが1段階コミット手順を実行できるか否かであり、
たとえば、その資源が、特定の情況の下で1段階コミッ
ト手順を実行できるデータベース・マネジャであるかど
うかである。やはり登録中に、資源アダプタは、このア
プリケーションによって行われた作業要求が、その資源
を読取り専用モードにしたか、それとも更新モードにし
たかを同期点マネジャに記録する(図14のステップ6
16)。
がその資源に対して次の作業要求を行ったとき、資源の
状態が変化することがある。すなわち、資源が読取り専
用モードから更新モードに変化することがある。このよ
うな変化が発生した場合、資源アダプタは、この変化に
ついて同期点マネジャに知らせなければならず、登録情
報は新しい状態を反映するように更新される(図14の
ステップ619)。
された会話に対するものである場合、保護会話アダプタ
用の登録エントリは、その保護会話アダプタが更新モー
ドであって、1段階コミット手順を実行できないことを
必ず示す。保護会話アダプタは、複数の資源を使用する
可能性のある別のアプリケーション実行環境への通信経
路を表すので、読取り専用モードの資源への通信経路を
表しているのか、それとも更新モードの資源への通信経
路を表しているのかは、保護会話アダプタには決定でき
ない。したがって、別のアプリケーション実行環境への
通信経路が存在する場合には、クリティカルな資源に必
要な保護を提供するために、2段階コミット手順が必要
である。保護会話アダプタは、1段階コミット手順を実
行できない更新モードの資源として登録することによっ
て、2段階コミット手順が使用されることを保証する。
了した後に、資源上のデータのコミットまたはバックア
ウトを試みる。これを達成するために、アプリケーショ
ンは同期点マネジャに同期点要求を発行する。この同期
点要求の処理を開始するために(図16のステップ62
0)、同期点マネジャは、作業ユニット表を読み取っ
て、影響を受ける作業ユニットのエントリを見つける
(図16のステップ621)。作業ユニットの詳細につ
いては、「作業ユニットに合わせて調整されたローカル
およびグローバルなコミット範囲」を参照されたい。正
しい作業ユニット・エントリが見つかると、同期点マネ
ジャは、その作業ユニット用に登録された資源に関する
情報をそのエントリから読み取り、資源の3つのリスト
を生成する(図16のステップ622)。
つ。読取り専用リストは、アプリケーションがデータを
読み取っただけである資源を含む。更新リストは、アプ
リケーションによってそのデータが更新された資源と、
読取り専用の状態であるが、その資源マネジャが1段階
コミット手順を実行できない資源を含む。開始側リスト
は、更新を資源に同期させたい旨のメッセージを送った
通信パートナのリストを含む。各資源は、これらのリス
トのうちの1つだけにしか現れない。
つのフラグが含まれる。これらのフラグは、同期点マネ
ジャに読み取られ、ある資源を更新リストに入れるべき
か、それとも読取り専用リストに入れるべきかを決定す
るのに使用される。第1のフラグは、その資源が読取り
専用モードの時オンとなり、更新モードの時オフとな
る。第2のフラグは、その資源が1段階コミット手順と
2段階コミット手順の両方をサポートする時オンとな
り、2段階コミット手順しか実行できない時オフとな
る。実際には、各資源の登録には、通信パートナが更新
を資源と同期させたい旨を示すメッセージをこの資源ア
ダプタが通信パートナから受け取ったか否かに関する情
報を含むフィールドも含まれる。同期点マネジャは、こ
のフィールドを読み取り、そのデータを使用して、その
資源を開始側リストに入れるべきか否かを決定する。
ネジャは、同期点要求のタイプを検査する(図16の判
断ブロック623)。この同期点要求がバックアウトで
ある場合には、同期点マネジャは以下のバックアウト処
理を実行する。まず、更新リスト中に資源アダプタがあ
るならば、それらのすべてに、その資源の変更をバック
アウトするように指令する(図16のステップ62
6)。次に、読取り専用リスト中に資源アダプタがある
ならば、それらのすべてに、それらの資源に対する作用
をバックアウトするよう指令する(図16のステップ6
27)。読取り専用の資源に対する「バックアウト」の
処理は、バックアウトすべき資源内の実際のデータが変
更されないので、その資源の実施様態によって定義され
ることに留意されたい。たとえば、共用ファイル資源マ
ネジャ63(図2)内の読取り専用ファイルをバックア
ウトするための処理は、そのファイルをクローズし、そ
のアプリケーションの使用のために以前に維持されてい
たファイル位置情報を放棄することを含むことができ
る。読取り専用の資源をバックアウトするよう指令した
後、開始側リスト中に資源アダプタがあれば、それらす
べてに、このアプリケーション実行環境がこの同期点に
対する変更をバックアウトしたことを伝える(図16の
ステップ628)。
トである場合(図16の判断ブロック623)、同期点
マネジャは、このコミットの最適化処理を開始する。こ
の最適化処理の第1ステップでは、開始側リストが空で
あるか否か決定する(図16の判断ブロック624)。
開始側リストが空でないならば、それは、このアプリケ
ーション実行環境が、その同期点ツリー内のカスケード
式開始側であり、このコミットのために完全な2段階コ
ミット手順を使用しなければならないことを意味する。
それが必要なのは、この同期点ツリーの完全な範囲、す
なわちこの同期点に対して活動状態でありかつ更新モー
ドである資源がどれだけあるかを、どのアプリケーショ
ン実行環境も知らないからである。この数が未知である
ので、これらのクリティカルな資源に必要な保護を提供
するために、2段階コミット手順を使用しなければなら
ない。
断ブロック624)は、次のステップで、更新リスト中
に複数の資源があるか否かを決定する(図16の判断ブ
ロック625)。そうである場合は、このコミットのた
めに完全な2段階コミット手順を使用しなければならな
い。すべての資源がそれぞれの変更をコミットできると
認めない限り、どの資源もその変更をコミットしないの
で、この2段階コミット手順は、更新モードの資源に対
してより多くの保護を提供する。
合(図16の判断ブロック625)、次のステップで、
更新リスト中に資源がないか、それとも1つあるか決定
する(図16の判断ブロック640)。更新リスト中に
資源がない場合、読取り専用の資源をコミットするため
に1段階コミット手順を使用する。同様に、更新リスト
中に資源が1つだけあり、その資源マネジャが1段階コ
ミット手順を実行できる場合には、1段階コミット手順
を使用する。
に資源アダプタがあるならば、それに対してその変化を
コミットするよう同期点マネジャが指令することから始
まる(図16のステップ641)。資源マネジャによる
データの1段階コミットは、2段階コミット中には2回
の呼出しが必要であるのとは対照的に、資源アダプタを
1回呼び出すだけで達成されることに留意されたい。こ
の同期点全体を通じて、更新モードの資源はせいぜい1
つしか存在し得ないので、異なる資源に対する異なる決
定によってデータの整合性が失われる可能性はない。ま
た、この1段階コミット手順中には、2段階コミット手
順の一部としてロギングが(図17のステップ644、
648、651、658および659)必要であるのと
は対照的に、回復ファシリティのログ72(図2)への
書込みが行われないことに留意されたい。この1段階コ
ミット手順は、読取り専用リスト中に資源アダプタがあ
るならば、それに対してその変更をコミットするよう同
期点マネジャが指令することで終了する(図16のステ
ップ642)。読取り専用の資源の「コミット」は、コ
ミットすべきデータが実際には変化していないので、資
源の実施様態によって定義されることに留意されたい。
たとえば、一部の共用ファイル資源マネジャ63(図
2)は、読取りの整合性をもたらすので、あるアプリケ
ーションが共用ファイル資源マネジャ内のファイルを読
み取る時に、そのアプリケーションは、そのファイルの
整合性のあるイメージを与えられる。すなわち、他のア
プリケーション環境がそのファイルに対して行った変更
は、ファイルの内容の読取りに干渉せず、ファイルがオ
ープンされた時の内容が読み取られる。アプリケーショ
ンが読取りの目的でファイルをオープンする時、読取り
専用の資源であるとみなされる資源マネジャによってこ
のイメージが生成される。アプリケーションは、ファイ
ルの読取りを終えた時、このファイルをクローズし、コ
ミットを試みる。共用ファイル資源マネジャは、読取り
専用の資源としてこのコミットを実行する時、アプリケ
ーションの使用のために維持されたイメージを破棄する
ことができる。これで、アプリケーションがこのファイ
ルを再度オープンする場合、他のアプリケーションによ
って行われたコミット済みの変更をすべて含むファイル
のイメージが見えることになる。
ク624、625または640の結論に従って、2段階
コミット手順となる場合、同期点マネジャ60(図2)
は、やはり読取り専用の資源のコミットを最適化する。
読取り専用の資源のこの最適化にはいくつかの部分があ
る。第1に、(図17のステップ644)この読取り専
用の資源に関する情報は、回復ファシリティのログ72
(図2)に書き込まれない。読取り専用の資源が、それ
自体のログに「不確定」の状態をロギングすることは絶
対にないので、読取り専用の資源に関する情報を回復フ
ァシリティ70(図2)にロギングする必要はない。こ
れは、資源マネジャが回復ファシリティ70(図2)と
の再同期化を決して試みず、したがって、回復ファシリ
ティはこの資源に関する知識を必要としないことを意味
する。第2に、この読取り専用の資源は、コミットの第
1段階、すなわち更新リスト中のすべての資源アダプタ
への“prepare(準備)”の送出には使用されない(図
17のステップ645)。データの整合性の点で、読取
り専用の資源にとってバックアウトはコミットと同等な
ので、読取り専用の資源の行動が、資源の保護に影響を
与えることはありえない。
使用されるのは、コミットの最終決定を伝えられる時、
すなわち、変更をコミットする(図17のステップ65
3)か、または変更をバックアウトする(図17のステ
ップ655)よう伝えられる時だけである。
テムの一部である3つの異なるアプリケーション実行環
境に関わる、2段階コミット手順の例を示す。各アプリ
ケーション実行環境は、異なるアプリケーションを実行
中である。アプリケーションAとアプリケーションB
は、保護された会話を介して通信中である。アプリケー
ションBとアプリケーションCは、保護された会話を介
して通信中である。この2段階コミット手順は、アプリ
ケーションAが、これと同一の実行環境内で現在実行中
の同期点マネジャにコミット要求B1(図18)を発行
することによって、コミットを試みる時に開始される。
段階1は、この同期点マネジャが、回復ファシリティの
ログB2(図18)にログ・レコード“SPM Pending (S
PM保留)”を書き込む時に始まる。ログ・レコード“SPM
Pending”は、その同期点用の作業論理ユニット識別子
と、その同期点参加者に関する情報を含み、この場合、
ログ・レコード“SPM Pending”は、1つの参加者とし
てアプリケーションBを示す。
ァシリティへ成功裡に書き込まれた後、同期点マネジャ
は、保護会話アダプタを介してアプリケーションBにメ
ッセージ“prepare”を送る。アプリケーションBは、
その会話パートナであるアプリケーションAが資源の同
期化を望んでいることを知らされ、その後アプリケーシ
ョンBは、それと同一の実行環境内で現在実行中の同期
点マネジャにコミット要求B3(図18)を発行する。
コミット手順の第1段階は、回復ファシリティのログB
4(図18)にレコード“SPM Pending”を書き込むこ
とから始まる(図18)。レコード“SPM Pending”
は、この同期点用の作業論理ユニット識別子と、この同
期点参加者に関する情報を含む。この場合、ログ・レコ
ード“SPM Pending”は、アプリケーションAに関す
る、それを同期点開始側として示す情報とアプリケーシ
ョンCに関する、それを同期点参加者として示す情報を
含む。ログ・レコード“SPM Pending”が回復ファシリ
ティのログに成功裡に書き込まれると、同期点マネジャ
は、保護会話アダプタを介してアプリケーションCにメ
ッセージ“prepare”を送る。アプリケーションCは、
その会話パートナであるアプリケーションBが資源の同
期化を望んでいることを知らされ、その後アプリケーシ
ョンCは、それと同一の実行環境内で現在実行中の同期
点マネジャに、コミット要求B5(図18)を発行す
る。
g”を回復ファシリティのログB6(図18)に書き込
むことによって、2段階のコミット手順第1段階を開始
する。このレコード“SPM Pending”は、この同期点参
加者に関する情報と、この同期点用の作業論理ユニット
識別子を含む。この例では、レコード“SPM Pending”
は、この同期点の開始側であるアプリケーションBに関
する情報を含む。また、レコード“SPMPending”は、ア
プリケーションCに対する同期点参加者がないことを示
している。
が、保護会話アダプタを介してメッセージ“prepare”
を送る必要はない。そこで、C側の同期点マネジャは、
回復ファシリティに状態レコードを送り、同期点の状態
を「代理、不確定」B7(図18)に更新する。この状
態レコードが回復ファシリティのログに成功裡に書き込
まれると、C側の同期点マネジャは、このメッセージ
“prepare”に応答して、保護会話アダプタを介してB
側の同期点マネジャにメッセージ“request commit(コ
ミット要求)”を送る。
タを介してC側の同期点マネジャからのメッセージ“re
quest commit”を受け取る。メッセージ“request comm
it”だけが受け取られたので、次のステップで、回復フ
ァシリティに状態レコードを送って、同期点の状態を
「代理、不確定」B8(図18)に更新する。状態レコ
ードが回復ファシリティのログに成功裡に書き込まれる
と、B側の同期点マネジャは、Aからのメッセージ“pr
epare”に応答して、保護会話アダプタを介してA側の
同期点マネジャにメッセージ“request commit”を送
る。
ネジャからメッセージ“request commit”を受け取り、
これでこの同期点の第1段階が完了する。次に、この同
期点マネジャは、この同期点の開始側として、作業論理
ユニットをコミットするかそれともバックアウトするか
を決定しなければならない。メッセージ“request comm
it”だけがA側の同期点マネジャに受け取られたので、
A側の同期点マネジャは、この作業論理ユニットをコミ
ットすると決定する。この2段階コミット手順の第2段
階は、状態レコードを回復ファシリティに送ることによ
ってこの同期点マネジャがこの決定を記録することから
始まる。この状態レコードは、この同期点の状態を「開
始側、コミット済み」B9(図18)に変更する。この
状態レコードが回復ファシリティのログに成功裡に書き
込まれると、この同期点マネジャは、保護会話アダプタ
を介してB側の同期点マネジャにメッセージ“committe
d(コミット済み)”を送る。
“committed”を受け取り、これで2段階コミット手順
の第1段階が完了する。第2段階は、この同期点マネジ
ャが回復ファシリティに状態レコードを送って、この同
期点の状態を「開始側カスケード、コミット済み」B1
0(図18)に更新する時に開始される。次に、B側の
同期点マネジャは、保護された会話を介してC側の同期
点マネジャにメッセージ“committed”を送る。
“committed”を受け取り、これで2段階コミット手順
の第1段階が完了する。C側の同期点マネジャは、回復
ファシリティに状態レコードを送って、この同期点の状
態を「開始側カスケード、コミット済み」B11(図1
8)に更新することによって、第2段階を開始する。メ
ッセージ“committed”を受け取る参加者は他にはもう
存在しないので、C側の同期点マネジャは、この同期点
に関する作業を完了している。このことを記録するため
に、C側の同期点マネジャは、状態レコードを回復ファ
シリティに送って、この同期点の状態を「忘却」B12
(図18)に更新する。この状態を介して回復ファシリ
ティは、この作業論理ユニット識別子に関してC側の同
期点マネジャが書き込んだすべてのレコードが、もはや
不要であり消去可能であることを知る。この状態レコー
ドが回復ファシリティのログに成功裡に書き込まれた
後、C側の同期点マネジャは、メッセージ“committe
d”に応答して、保護会話アダプタを介してB側の同期
点マネジャにメッセージ“forget(忘却)”を送り、こ
れでC側の同期点マネジャの2段階コミット手順の第2
段階が終了する。このメッセージ“forget”が送られた
後、C側の同期点マネジャは、この同期点が成功裡に完
了したとの指示と共に、制御をアプリケーションCに返
す。
ネジャから保護会話アダプタを介して、メッセージ“fo
rget”を受け取る。このメッセージ“forget”の受取り
は、B側の同期点マネジャがこの同期点を完了したこと
を示す。このことを記録するために、B側の同期点マネ
ジャは、回復ファシリティに状態レコードを送って、こ
の同期点の状態を「忘却」B13(図18)に更新す
る。この状態から、回復ファシリティは、この作業論理
ユニット識別子に関してB側の同期点マネジャが書き込
んだすべてのレコードが、もはや不要であり消去可能で
あることを知る。この状態レコードが回復ファシリティ
に成功裡に書き込まれた後、B側の同期点マネジャは、
メッセージ“committed”に応答して、保護会話アダプ
タを介してA側の同期点マネジャにメッセージ“forge
t”を送り、これでB側の同期点マネジャの2段階コミ
ット手順の第2段階が終了する。メッセージ“forget”
が送られた後、B側の同期点マネジャは、この同期点が
成功裡に完了したとの指示と共に、制御をアプリケーシ
ョンBに返す。
“forget”を受け取る。このメッセージ“forget”の受
取りは、A側の同期点マネジャがこの同期点を完了した
ことを示す。このことを記録するために、A側の同期点
マネジャは、回復ファシリティに状態レコードを送っ
て、この同期点の状態を「忘却」B14(図18)に更
新する。この状態から、回復ファシリティは、この作業
論理ユニット識別子に関してA側の同期点マネジャが書
き込んだすべてのレコードがもはや不要であり消去可能
であることを知る。これでA側の同期点マネジャの2段
階コミット手順の第2段階が終了するが、このことは、
この同期点がそのすべての参加者について完了したこと
を意味する。この状態レコードが回復ファシリティのロ
グに成功裡に書き込まれた後、A側の同期点マネジャ
は、この同期点が成功裡に完了したとの指示と共に、制
御をアプリケーションAに返す。
びエラー記述情報の処理の調整図29ないし32は、い
ずれかの資源または保護された会話がエラーまたは警告
を報告する場合に、アプリケーション56Aに戻りコー
ドを与える、システム50Aの構成要素を示す図であ
る。また、アプリケーション56Aは、それぞれの資源
および保護された会話から、詳細なエラー情報を要求す
ることができる。この詳細エラー情報は、報告元の資源
を識別し、同期点エラーの理由を記述し、同期点に関す
る警告のこともあり得る。
A内の分散アプリケーション実行環境52A(図32参
照)内で実行中である。保護資源アダプタ62Aは、共
用ファイル資源マネジャ63A用のアダプタであり、資
源アダプタ62Gは、SQL資源マネジャ63G用のア
ダプタであり、保護会話アダプタ64Aは、保護会話ア
ダプタ64Bを介するシステム50Bとの保護された会
話用のアダプタである。この例では、アダプタ62Aお
よび64Aは、システム50A内のシステム制御プログ
ラムに組み込まれた構成要素なので、同一の製品識別子
を有する。アダプタ62Gは、異なる製品の一部なの
で、独自の製品識別子を有する。アダプタ62Aおよび
64Aは、異なる資源アダプタ出口識別子を有する。こ
の例では、資源アダプタ62Gは、アダプタ56Aには
解読不能であって、アダプタ56Aに詳細エラー情報を
返すための従来技術の機能を有する、エラー・ブロック
を生成する。
51)、アダプタ62A、62Gおよび64Aが、同期
点マネジャ60に登録される(ステップ653)。同期
点マネジャ60は、登録オブジェクト162A、162
Bおよび162Cを生成し、参加する資源(共用ファイ
ル資源マネジャ63A、SQL資源マネジャ63Gおよ
びシステム50B内の保護された会話のパートナ)の識
別子を入れる。また、この登録情報は、資源アダプタ出
口ルーチン名、資源および保護された会話の製品識別
子、および各資源のエラー・ブロックの必要な長さを含
む。資源アダプタ出口ルーチン名は、この例のシステム
50A内のシステム制御プログラムなどの製品が、2タ
イプの資源を所有する時に必要である。製品識別子と資
源アダプタ出口ルーチン名は共に、参加する資源のタイ
プ、たとえば共用ファイル資源マネジャ、SQL資源マ
ネジャ、または保護会話マネジャを識別する。1実行環
境内の同一タイプの資源の資源アダプタはすべて、シス
テム50Aのページング・セットを縮小するために、同
一のプールからのエラー・ブロックを使用する(図解は
図31を参照されたい)。ある資源がステップ653
(図29)で、他のタイプの資源と同一のサイズのエラ
ー・ブロックを要求する場合、そのエラー・ブロック・
プールがこれら2つの資源によって共用される。
について、資源アダプタ出口ルーチンを呼び出すための
パラメータのリストが、同期点マネジャ60によって作
成される。このリストは、その資源のエラー・ブロック
のアドレスと、使用可能なエラー情報の長さを含む。登
録エントリ内に使用可能なエラー情報の長さを置いて
も、エラーが発生しない場合には、システム50Aのペ
ージング・セットは影響を受けない。
マネジャ60からのコミットを要求する(図29のステ
ップ654)。アプリケーション56Aが、この同期点
中にエラーが発生する場合に共用ファイル資源マネジャ
63Aからの詳細な情報(システム50A内の共用ファ
イル資源マネジャの従来技術の機能)を望む場合、アプ
リケーション56Aは、詳細なエラー情報のコピーを記
憶するための、その実行環境内のデータ域のアドレス
を、エラー・データ・アドレスとしてこのCommit動詞と
同時に送る(図29のステップ654)。このデータ
は、資源マネジャ63Aがエラーまたは警告を報告する
場合に使用される。同期点マネジャ60は、共用ファイ
ル資源アダプタ62Aの代わりにこの動詞を受け取り、
エラー・データ・アドレスは、同期点マネジャ60によ
ってセーブされる。同期点の完了時に、すべてのエラー
と警告(図29のエラー・ブロック66Aに記憶されて
いる)は、アプリケーション56Aのエラー・データ域
(図示せず)に移される。したがって、共用ファイル資
源マネジャの従来技術のエラー・パス・バック・アーキ
テクチャとの互換性が保たれている。
ジャ60は、各資源アダプタ(図32の62A、62G
および64A)に、登録オブジェクト162Aないし1
62Cにセーブされたそのエラー・ブロック(オブジェ
クト66Aないし66C)のアドレスを渡す。登録オブ
ジェクト162Aないし162Cは、資源アダプタが登
録された時、各資源アダプタごとに作成されている(ス
テップ653)。障害がない場合、ステップ654から
のコミットが完了し、その後同期点マネジャ60は、更
新がコミット済みであることをアプリケーション56A
に報告する(ステップ657)。
検出した場合には(図30のステップ670)、そのア
ダプタ62A、62Gまたは64Aは、エラー・ブロッ
ク66Aないし66C(図29)を、設計上必要なもの
をすべて記憶するための場所として使用して、詳細なエ
ラー情報を入れ、入出力パラメータである使用可能なエ
ラーの長さを更新する。資源アダプタ出口ルーチンは、
2段階コミット手順中に何回も呼び出すことができるの
で、必要に応じてエラー・ブロックにエラー情報を付加
できる。たとえば、3つの警告と1つの重大なエラーが
あってもよい。資源アダプタ出口ルーチンは、それ自体
で使用可能なエラーの長さを管理する(ステップ67
2)。
ルーチンから、共通のフォーマットの単一の戻りコード
を受け取り、2段階コミット手順の論理を続行する(ス
テップ673)。このとき、同期点マネジャ60は、エ
ラー・ブロック66Aないし66Cの内容を知らず、こ
れに関心を持つこともない。2段階コミット手順の論理
がエラーまたは警告を指摘した場合、同期点マネジャ
は、統合された戻りコードをアプリケーション56Aに
返す(図29のステップ657および図30のステップ
674)。
ション56Aは、同期点マネジャ60から提供されるル
ーチンを呼び出すことによって、詳細なエラー・ブロッ
クを要求する(図30のステップ676)。これに応答
して、同期点マネジャ60内部のエラー・ブロック・マ
ネジャ(図32の機能690)が、空でないエラー・ブ
ロックを探し、これをアプリケーション56Aのバッフ
ァに移動する。他の出力パラメータは、このエラー・ブ
ロックの所有者の製品識別子と資源アダプタ出口ルーチ
ン名である。次に、アプリケーション56Aは、この製
品識別子を検査する。報告を行った製品がシステム50
A内のシステム制御プログラムである場合(図30の判
断ブロック678)、アプリケーション56Aは資源ア
ダプタ出口ルーチン名を検査して、2つのシステム制御
プログラム・アダプタの区別を行う。これで、エラー・
ブロックでその資源名と障害の原因を探すことができる
(ステップ680Aまたは680B)。エラー・ブロッ
クの読取りを助けるためのシステム50A内のシステム
制御プログラムから、共用ファイル資源マネジャと保護
された会話のための、マッピング・マクロが提供され
る。また、エラー・ブロックを都合の良い形であるパラ
メータ・リストに再フォーマットするために、各アダプ
タからルーチン(図32の対話693)が提供される。
共用ファイル資源マネジャを使用する既存のアプリケー
ションは、エラー・パス・バック方法が変更されていな
いので、変更不要である。保護された会話は新規である
ので、通信を使用する既存のアプリケーションに関する
互換性の目的には反しない。
30の判断ブロック681)、説明のため、エラー・ブ
ロックが、現在アプリケーション56Aが理解できる形
ではないと仮定すると、このエラー・ブロックを解読し
なければならない。したがって、アプリケーション56
Aは、アプリケーション56Aが理解できる形でエラー
のタイプを識別するよう資源アダプタ62Gに要求する
(ステップ682)。これに応答して(ステップ68
3)、SQL資源アダプタ62Gは、アプリケーション
56Aの使用するルーチンに非常に類似してはいるが、
資源アダプタ用に特殊化されたルーチンを使って、同期
点マネジャからエラー・ブロックを読み取る。SQL資
源アダプタ62Gとアプリケーション56Aは一義的な
トークンを与えられ、その結果、これらの双方が、混乱
することなく同一のエラー・ブロック内を巡回できるこ
とに留意されたい。SQL資源アダプタ62Gは、エラ
ー・ブロック66C(図29)内のデータを再フォーマ
ットして、アプリケーション56Aと互換性をもつ形に
変換し(図30のステップ684)、その後、この再フ
ォーマットされた詳細なエラー情報をアプリケーション
56Aに送る(ステップ685)。この例では、既存の
SQL資源アダプタがエラー情報の調整式処理に参加す
るには、些細な内部的な変更しか必要でない、すなわ
ち、同期点マネジャ60にエラー・ブロックを要求しな
ければならないことに留意されたい。アプリケーション
56Aが1つの資源しか更新しない場合、既存のアプリ
ケーションは変更を必要としないので、SQL資源アダ
プタのエラー・パス・バック・インタフェースの外見が
保存される。アプリケーション56Aが、新しい機能で
ある調整された同期点を使用していることを示す追加の
エラー・コードは、非互換性とはみなされない。
のエラー・ブロックがあるか否かを決定するために、同
期点マネジャ60に照会を行う(図30のステップ67
6)。そうである場合(判断ブロック677)、ステッ
プ678ないし685を繰り返して、同期点マネジャ6
0から1つまたは複数の追加のエラー・ブロックを得
る。これ以上エラー・ブロックがない場合、判断ブロッ
ク677から図29のステップ688に進み、ここでア
プリケーション56Aは処理を継続して、異なる機能を
続行するか、あるいは障害の矯正を試みる。
順のための資源の登録」で述べたように、次の同期点ま
でエラー・ブロックを保存する。
交換 アプリケーション56(図2)が同期点要求を発行する
時、すべての保護された資源に対する変更をコミットす
るために、2段階コミット手順が開始される。保護され
た資源には、資源マネジャによって管理されるデータベ
ースなどの保護された資源、ならびに分散パートナ・ア
プリケーションを表す保護された会話と称する特殊な分
類の資源が含まれる。「保護された資源の調整式同期点
管理」で述べたように、2段階コミット手順の第1段階
は、コミットのための資源の準備である。第1段階の間
にすべての資源マネジャがコミットに同意すると、第2
段階で実際のコミットを行う。第1段階の間に準備でき
ない資源がある場合、すべての資源は、第2段階の間に
その変更をコミットする代わりにバックアウトするよう
命じられる。すべての資源データの変更は、それらが実
際にコミットされるまで、バックアウトの対象となる。
点のための回復ファシリティ」に記載するように、障害
のために同期点が完了できない時に同期点を完了させる
ための回復手順をサポートするには、その以前に同期点
情報が、持久記憶装置内にある回復ファシリティ・ログ
72および資源マネジャ・ログ800に記憶され、保持
されていることが必要である。ロギングは、各同期点マ
ネジャ60ならびに参加する各資源マネジャ63によっ
て行われる。ログに記録される情報には、ロギングを行
う同期点マネジャまたは資源マネジャからみた同期点の
現在の状態、既知の同期点参加者の同期点ログに関連す
る現在の名前、および、同期点マネジャの場合には、同
期点障害からの回復の際に同期点参加者との会話を確立
するのに必要な情報が含まれる。
は、その他の同期点情報とは分離または区分してロギン
グされる。このログ名情報は、ログ名ログ72A2(図
19)に記録され、残りの情報は、同期点ログ72A1
に記録される。
に障害が発生し、そのログを再初期設定する必要が生
じ、実際に新しいログを開始する時は、そのログに新し
い名前が割り当てられる。これが発生した時は、同期点
に参加する他の同期点マネジャおよび資源マネジャが、
新しいログの所有者および維持者と共に、そのログが再
初期設定されたこと、および新しい名前が有効であるこ
とを知らされることが重要である。
同期点ログを有することは、自動的再同期化のために不
可欠である。すなわち、再同期化の時点でのログは、同
期点中に使用されたものと同一のログでなければならな
い。いずれかのログが置換されまたは損傷を受けた場
合、再同期化は正常に進行できない。すべてのログが正
しいことを保証するために、各同期点マネジャおよび参
加する資源のログ名に関して同期点以前に同意が行われ
る。これはログ名交換と称する手順によって行われる。
再同期化の開始直前にもう1つのログ名交換があり、そ
の結果、すべての参加者のログ名が同期点開始時と同一
であると決定され、ログの再初期設定を行った参加者が
ないとわかるので、再同期を続行して、障害を発生した
同期点を回復することができる。この手順を省くと、無
効な同期点ログ情報のために、回復処理に障害が生じた
り、回復処理から誤った結果が生ずる可能性がある。
(たとえば、システム50A内の分散アプリケーション
環境52Aおよび52B)間での保護された会話の最適
化としては、ログ名を交換する必要はない。というの
は、同期点マネジャ60Aおよび60Bが、それぞれ同
一の回復ファシリティ・ログ70Aおよび回復ファシリ
ティ・ログ72Aを共用しているからである。共通の回
復ファシリティ・ログ72Aが存在する時は、(ログ名
交換による)ログ同期化のステップは、不要であり、省
略してよい。同期点マネジャのロギングは、サポートさ
れる同期点マネジャ60と同一のシステム内に常駐する
共通の回復ファシリティ70によって行われる。システ
ム50A内の同期点マネジャ60A、60B、60Cは
すべて、共通の回復ファシリティ70Aを共用し、回復
ファシリティ・ログ72A内のログの、同一のサポート
対(同期点およびログ名)を共用している。
D、50Fと、そのそれぞれの中にある回復ファシリテ
ィと、これらのシステム間の通信が示されている。アプ
リケーション環境52A、52B、52D、52F、5
2Gは、それぞれ調整式の資源回復のために同期点マネ
ジャ60A、60B、60D、60F、60Gを使用す
る、アプリケーション・プログラム56A、56B、5
6D、56F、56G(図示せず)を含む。同期点マネ
ジャは、そのシステム内の回復ファシリティを使用し
て、同期点と、障害を発生した同期点からの回復に必要
なログ名ログとを管理する。たとえば、アプリケーショ
ン環境52Aおよび52B内の同期点マネジャは、回復
ファシリティ70Aを使用してログ72Aに記録する。
資源マネジャ63A、63B、63D、63E、63
F、63Gは、それぞれそれ自体の同期点と、ログ名ロ
グ800A、800B、800D、800E、800
F、800Gを維持する。図示の同期点の範囲は、実線
と矢印で示されている。同期点はいずれの参加者でも開
始でき、かつ同期点の範囲は動的であるが、図を簡単に
するためにこの図は静的なものである。この図の静的な
場合では、同期点は、アプリケーション環境の間で、5
2Bから52Dへ、さらに52Fへと、関連する同期点
マネジャおよび保護会話アダプタ(図示せず)を介し、
通信の実線801および802を経て流れ、またアプリ
ケーション環境52A、52B、52D、52F、52
Gから、関連する同期点マネジャおよび保護会話アダプ
タを介し、それぞれ通信の実線803A−1、803A
−2、803B、803D、803E、803F、80
3Gを経て、資源マネジャ63A、63B、63D、6
3E、63F、63Gへ流れる。点線は、同期点以前の
同意の際と、障害を発生した同期点を回復するための再
同期化の際に使用される通信経路を示す。資源マネジャ
にとって、この点線で示された通信は、起点側アプリケ
ーション環境のシステムの資源マネジャと回復ファシリ
ティの間に存在し、たとえば、資源マネジャ63Eから
は、70Dにではなく70Aに向かう。
いる。第1の範囲は、単一のアプリケーション環境52
A(および同期点マネジャ)を含み、2つの資源マネジ
ャ63Aおよび63Eを使用する。第2の同期点の範囲
は、3つのアプリケーション環境52B、52Dおよび
52Fを含み、これらはそれぞれ、様々な参加する資源
マネジャ(52Bには63B、52Dには63Dと63
E、52Fには63Fと63G)を含む。これを図34
の同期点ツリーに示す。
1、図22の流れ図は、システム50Aとシステム50
Dの間の保護された会話を使用するログ名交換の処理を
実例によって示す図である。アプリケーション56A
は、アプリケーション56Dとの保護された会話を開始
する(図20のステップ831)。アプリケーション5
6Aはシステム50A内のアプリケーション環境52A
で実行中であり、アプリケーション56Dはシステム5
0D内のアプリケーション環境52Dで実行中である。
会話の開始には、経路(システム識別子、この例では
“B”)と、パートナ・アプリケーションの資源識別子
を指定することが含まれる。この経路はシステム50D
を識別し、この資源識別子は目的のアプリケーション5
6Dを識別する。資源識別子については、本節で後で詳
しく説明する。システム制御プログラムは、アプリケー
ションの資源マネジャとして働くファシリティを含み、
これはアプリケーション用のアプリケーション資源識別
子の確立をサポートし、これらの識別子が会話開始に使
用された際にこれを認識し、その後、実行環境内でアプ
リケーションを活動状態にし、またすでに活動状態であ
る場合には、新規の会話をその活動状態のアプリケーシ
ョンに経路指定する。したがって、アプリケーション用
の会話の経路指定には経路(システム識別子)と資源識
別子を使用する。その際に、経路は、それぞれシステム
を代表する通信ファシリティの解釈に従ってシステム間
の経路指定を行い、資源識別子は、アプリケーション資
源用の資源マネジャとして働くシステム制御プログラム
の解釈に従って、システム内の実行環境内のアプリケー
ションへの経路指定またはそのアプリケーションの活動
化を行う。
ティ57Aは、その交換ログ名状況テーブル(ELS
T)208Aを探索して、現経路である経路B用のエン
トリを求める(図20のステップ833)。交換ログ名
状態テーブルの経路B用のエントリは、状況0によっ
て、システム50Aが最後に開始されて以降にこの経路
上には保護された会話が発生していないことを示す。し
たがって(図20の判断ステップ834)、交換ログ名
状態テーブルの経路B用のエントリ208Aが、状況1
に変更され(図20のステップ836)、会話開始メッ
セージ505(図19)が代行受信され、この会話は、
通信ファシリティ57Aによって中断される(図20の
ステップ837)。次に、通信ファシリティ57A(図
19)は、ローカルの回復ファシリティ70Aへの制御
経路上にメッセージ200(図19)を送って、この会
話開始が通信ファシリティ57Aに受諾されないうち
に、経路Bに対してログ名交換を初期設定すべきである
と指示する(図20のステップ838)。
ジを受け取り(図21のステップ850)、その後、E
LST207Aの経路B用のエントリを状況1にセット
して、経路B用のログ名交換が進行中であることを示す
(図21のステップ851)。次に、回復ファシリティ
70A(図19)は、通信経路B上で保護されない会話
を開始する(図19のメッセージ202)。この会話は
「保護されていない」ので、通信ファシリティによる代
行受信の可能性はない。というのは、保護された会話だ
けが、ログ名交換手順を強制するために代行受信がある
かどうか監視されるからである。システム50Aからシ
ステム50Dへの通信ファシリティを介する経路指定
は、上記と同様である。
nversation_recovery(保護会話回復)と称する、グロ
ーバルに予約された資源識別子も使用する。この資源識
別子を使用すると、識別された目的システム50Dの回
復ファシリティ70Dへの経路指定が可能になる。回復
ファシリティ70Aおよび70Dはそれぞれ、初期設定
の際に、システム制御プログラムに対して、“protecte
d_conversation_recovery”と称するグローバル資源に
対するローカル資源マネジャとしてそれ自体を識別す
る。この結果、システム50D用のシステム制御プログ
ラムは、protected_conversation_recovery資源識別子
を有する会話を、ローカルの回復ファシリティ70Dに
経路指定し、また回復ファシリティ70Dは、この会話
を開始するのに使用されたprotected_conversation_rec
overy資源識別子に基づいて、この会話の目的が、別の
回復ファシリティ70Aとのログ名交換であると判定す
る。この会話の初期メッセージ202(図19)は、ロ
グ72Aのログ名、ならびにそのログ名が「新規」であ
るか否か、すなわち、「旧」ログに関連する重大な障害
または喪失の結果としてそのログ名が新規のログを反映
するように変更されたか否かの標識を含む(図21のス
テップ852)。現在の例では、このログは新規ではな
いと仮定する。回復ファシリティ70Aは、メッセージ
202(図19)に対する応答を待つ。
に沿って回復ファシリティ70Aから送られたログ名情
報を受け取った後に(図22のステップ870)、経路
Bに関するELST207Dを状況1にセットし、ロー
カル通信ファシリティ57Dは、メッセージ203(図
19)を介して、やはり経路Bに関するELST208
Dを状況1に変更するよう通知される(図22のステッ
プ871)。図20のステップ841、図20のステッ
プ842、図20のステップ843および図20のステ
ップ846は、通信ファシリティ内のELSTを変更す
るステップを示す。回復ファシリティ70Dは、メッセ
ージ202(図19)から、回復ファシリティ70Aの
ログ名が新規でなく(図22の判断ステップ872)、
それ自体のログも新規ではない(図22の判断ステップ
876)と判定し、最後に、メッセージ202(図1
9)内のログ名が、回復ファシリティ70Dのログ名ロ
グ72D2の経路Bに関するエントリに記憶されたログ
名と一致すると判定する。したがって、ELST207
Dは、経路Bに関して状況2にセットされ、ローカル通
信ファシリティ57Dは、メッセージ203(図19)
を介して、やはり経路Bに関するELST208Dを状
況2にセットするよう通知される(図22のステップ8
79、図20のステップ841および図20のステップ
842)。その後、回復ファシリティ70Dは、回復フ
ァシリティ70Aに正常に応答して(図19のメッセー
ジ206)、そのログ72Dのログ名とそれが新規であ
るか否かの標識を送る(図22のステップ882)。
答を受け取り(図21の判断ステップ853)、回復フ
ァシリティ70Aのログ72Aが新規ではなく(図21
の判断ステップ857)、メッセージ206(図19)
によれば回復ファシリティ70Dのログ72Dが新規で
はないので(図21の判断ステップ858)、回復ファ
シリティ70Aは、回復ファシリティ70Dからメッセ
ージ206(図19)中で送られたログ72Dの名前
と、ログ72A2の経路Bに関するエントリに記憶され
たログ名の突合せに成功し(図21の判断ステップ85
9)、したがって、ELST207Aの経路Bに関する
エントリを状況2にセットし、メッセージ204(図1
9)を介して、ローカル通信ファシリティ57Aに、E
LST208Aを状況2にセットするよう通知する(図
21のステップ862)。その後、回復ファシリティ7
0Aは、経路B上の回復ファシリティ70Dとの会話の
正常終了を行って(図21のステップ863)、回復フ
ァシリティ70Dが、正常に完了できるようにする(図
22の判断ステップ883と図22のステップ88
6)。通信ファシリティ57Aが、経路Bの状況をEL
ST208Aに記入するよう伝えるメッセージ204
(図19)を受け取ると(図20のステップ841と図
20のステップ842)、代行受信され中断された経路
B上の会話505は、その初期設定を完了できるように
なる(図20の判断ステップ843、図20のステップ
845および図20のステップ846)。この完了によ
って、この会話の中断状態が解消され、この会話は、そ
の宛先である通信ファシリティ57Dに向かって流れる
ことができるようになる。目的の通信ファシリティ57
Dで保護会話到着事象(図20のステップ832)があ
り、その後、ELST208D内の経路エントリを検索
して、状況が2であることが示され(図20の判断ステ
ップ834)、この会話開始が、アプリケーション56
Dに正常に流れることができるようになる(図20のス
テップ839)。
常な場合の流れが完了する。いくつかの追加の場合も図
示されている。図20のステップ834と図20のステ
ップ835は、この経路用のログ名交換がすでに進行中
であることを示す1の状況が確立されると、同一の経路
上の追加の会話も中断されることを示している。
ージ202(図19)中で送られたログ名と経路Bに関
してログ72D2に記憶されたログ名が一致しないこと
を見つけた場合(図22の判断ステップ877)、メッ
セージ206(図19)中でエラーが戻され(図22の
ステップ880)、ELST207Dは、経路Bに関し
て状況0にセットされ、通信ファシリティ57Dは、メ
ッセージ203(図19)を介して、同様にそのELS
T208Dを変更するよう通知される(図20のステッ
プ841、図20のステップ842および図22のステ
ップ881)。
断ステップ872)、ログ72Dも新規である(図22
の判断ステップ873)ことを示すメッセージ202
(図19)を、回復ファシリティ70Dが受け取った場
合、ログ72Aの新規のログ名が、経路Bに関するログ
72D2に記憶され(図22のステップ878)、前記
と同様に正常な完了が継続する(図22のステップ87
9、図22のステップ882など)。
判断ステップ872)、ログ72Dは新規でない(図2
2の判断ステップ873)ことを示すメッセージ202
(図19)を、回復ファシリティ70Dが受け取り、か
つ同期点ログ72D1から、経路Bに関して未解決の同
期点回復(未処理の再同期化)が存在すると判定された
(図22の判断ステップ874)場合には、システム5
0Dの操作員に対してエラー・メッセージが生成され
(図22のステップ875)、メッセージ206(図1
9)中で、回復ファシリティ70Aにエラーが戻され
(図22のステップ880)、ELST207Dは状況
0に変更され、ローカル通信ファシリティは、メッセー
ジ203(図19)を介して、ELST208Dを状況
0に変更するよう通知され(図22のステップ881、
図20のステップ841、図20のステップ842)、
その後、リターンする(図22のステップ882)。
ティ70Dからのメッセージ206(図19)中でエラ
ー応答を検出し(図21の判断ステップ853)、かつ
未処理の再同期化が存在するとログ72A1で示される
(図21の判断ステップ854)場合には、システム5
0Aの操作員にメッセージが送られ(図21のステップ
855)、ELST207Aおよび208Aは、状況0
に変更される(図21のステップ856)。ELST2
08Aは、通信ファシリティ57Aに対するメッセージ
204(図19)を介して状況0に変更される(図20
のステップ841と図20のステップ842)。この結
果、代行受信された会話を開始したアプリケーション5
6Aにエラーが戻され、会話は拒絶される(図20のス
テップ844)。未処理の再同期化がない場合は(図2
1の判断ステップ854)、操作員にメッセージは送ら
れない(図21の判断ステップ854)。
206(図19)中で、新規のログ名が回復ファシリテ
ィ70Aに戻されると(図21の判断ステップ85
7)、このログ名はログ72A2の経路Bに関するエン
トリに記憶され(図21のステップ861)、2のEL
ST状況が経路Bに関してセットされ(図21のステッ
プ862)、通信ファシリティ57Aは、この会話を中
断から解放する(図20のステップ841、図20の判
断ステップ843および図20のステップ845)。
06(図19)中で戻されたログ名が、経路Bに関して
ログ72A2に記憶された名前と一致しないことを回復
ファシリティ70Aが検出するか(図21の判断ステッ
プ858および859)、あるいはログ72D2に対し
て新規のログ名が戻され(図21の判断ステップ85
8)、経路Bに関して必要な未処理の再同期化が存在す
るとログ72A1から回復ファシリティ70Aが決定し
た(図21の判断ステップ860)場合は、回復ファシ
リティ70Aは、メッセージ202および206(図1
9)をサポートした会話を異常終了させることによっ
て、回復ファシリティ70Dに重大なエラーが存在する
ことを知らせ(図21のステップ864)、システム5
0Aの操作員に対するメッセージを生成し(図21のス
テップ865)、ELST207Aの状況をリセット
し、通信ファシリティ57Aに対するメッセージ204
(図19)を介して、ELST208Aの状況をもリセ
ットする(図21のステップ866)。この結果、代行
受信された会話を開始したアプリケーション56Aにエ
ラーが戻され、会話は拒絶される(図20のステップ8
44)。
70Dは、回復ファシリティ70Aに応答(図22のス
テップ882)した後であっても、会話の異常終了を通
じて回復ファシリティ70Aから送られるエラー(図2
1のステップ864)を検出することができる(図22
の判断ステップ883)。それが発生した時、ELST
207Dの経路Bのエントリと、通信ファシリティ57
Dへのメッセージ203(図19)(および図20のス
テップ841と図20のステップ842)を介してEL
ST208Dの経路Bのエントリとが、状況0にリセッ
トされ(図22のステップ884)、ログ72D2の経
路Bに関するログ名エントリが消去され(図22のステ
ップ885)、以前のステップ878(図22)を否定
する。
に示されるように、各通信ファシリティは、各経路に対
する会話の代行受信(状況2以外)、ログ名交換の開始
(状況0)および正常な会話の流れ(状況2)を制御す
る。各回復ファシリティが維持するELST207Aお
よび207Dも同様であるが、任意選択の最適化であ
る。ELST207Aおよび207Dを用いると、通信
ファシリティのELSTの更新が実際には不要である時
に、ローカル通信ファシリティに対する更新要求のメッ
セージが回避できる。これについては後でさらに説明す
る。
つが障害を発生した時に必要な処理が示されている。通
信ファシリティ57A、回復ファシリティ70Aまたは
それらの間の通信経路に障害があるものと仮定する。こ
のような障害は、通信ファシリティ57A内のELST
208Aおよび回復ファシリティ内70AのELST2
07Aを状況0にリセットさせる。このことが重要なの
は、そうしないと、このような障害によって、ログ障害
も発生していた可能性がマスクされ得るためである。こ
の可能性のゆえに、交換ログ名状況テーブルのエントリ
の状況を0にすることによって、すべての同期点同意が
リセットされる。アプリケーション環境52Aまたは5
2Dの障害は、これらのアプリケーション環境がログ名
交換処理に直接影響しないので、ログ名交換状況テーブ
ルのリセットを起こさないことに留意されたい。アプリ
ケーション環境はシステム・ファシリティよりも障害を
発生しやすいので、このことは重要である。同様に、共
通の論理経路(図示せず)を共用する複数のアプリケー
ション環境のうちの1つの障害は、その経路を使用する
他のアプリケーションの処理には影響を与えない。
ァシリティ70Aまたはそれらの間の制御経路の障害の
後に、アプリケーション56Dが、アプリケーション環
境52A内のアプリケーション56Aに対する経路Bに
沿った会話を開始するものと仮定する。通信ファシリテ
ィ57D内の交換ログ名状況テーブルは、経路Bの状況
が2であり、通信ファシリティ57D内のテーブルが、
システム50Aに障害が発生した際にはリセットされな
かったことを示しているので、この会話は、通信ファシ
リティ57Dによって代行受信されない。ところが、こ
の会話が通信ファシリティ57Aまで達すると、保護会
話到着事象があり(図20のステップ832)、ELS
T208Aを検索すると、状況が0であることが示され
(図20の判断ステップ834)、通信ファシリティ5
7Aはこの会話の経路指定を代行受信し(図20のステ
ップ836と図20のステップ837)、したがって通
信ファシリティ57Aは、回復ファシリティ70Aに対
するメッセージ200(図19)によって、ログ名交換
を要求する(図20のステップ838)。これによっ
て、前述のログ名交換処理が繰り返される。このログ名
交換がその交換処理中に回復ファシリティ70D中で受
け取られた時、回復ファシリティ70D内の交換ログ名
状況テーブルは、経路Bのエントリの状況が2であるこ
とを示す。したがって、回復ファシリティ70Dは、通
信ファシリティ57Dに、経路Bに関して交換ログ名状
況テーブルを変更するよう通知することはしない。この
ような交換は不要である。この点が、このログ名交換処
理における、上述の障害発生前の処理との唯一の相違点
である。ログ名交換処理が完了した後に、回復ファシリ
ティ70Aは、メッセージ204(図19)を介して通
信ファシリティ57Aに、経路Bの状況を0から2に変
更するよう通知する。その後、通信ファシリティ57A
は、経路Bに沿った会話を解放し、この会話がアプリケ
ーション52Aに流れるようになる。
0Aが、メッセージ202(図19)を介して経路B上
のログ名交換を開始したことに留意されたい。しかし、
その代わりに、通信ファシリティ57Dが保護された会
話を最初に代行受信する通信ファシリティであった場合
には、回復ファシリティ70Dが、メッセージ206
(図19)で示されるログ名交換処理を開始する。保護
された会話のために同一の経路を使用する、同一のシス
テム50A内のすべてのアプリケーション環境に対して
同期点以前の同意を満足するには、単一のログ名交換で
十分なことにも留意されたい。共通のログ名交換状況テ
ーブル208Aに記録することによって、これが可能に
なる。さらに、同一のシステム内にあるすべてのアプリ
ケーション環境が同一のログ72を共用するので、保護
された会話に関係するシステム50Aおよび50Dのそ
れぞれにアプリケーション環境が複数存在する時でも、
同期点以前の同意の要件を満足するには、上述の単一の
ログ名交換処理で十分であることに留意されたい。ま
た、保護された会話が、アプリケーション環境52Aか
らそれと同一のシステム50A内にあるアプリケーショ
ン環境52Bに向けて開始される時は、アプリケーショ
ン環境52Aおよび52Bが同一のログ72Aを共用
し、ログ名交換が不要であるので、通信ファシリティ5
7Aはこの会話を代行受信しない。
準は、IBMコーポレーションの刊行物“System Netwo
rk Architecture LU 6.2 Reference: Peer Protocols,
SC31-6808, Chapter 5.3 Presentation Services - Syn
c Point Verbs”に記載のタイプのものでよい。本節で
述べたログ名交換は、交換の実行、制御および最適化の
ための処理を対象とするのであって、交換用の体系的プ
ロトコルを対象としてはいない。
ファイルやデータベースなどの保護された資源の資源マ
ネジャとの間でも必要である。同一のシステム内で会話
が行われる時(会話が共通の同期点ログを共用するの
で)ログ名交換が不要である、保護された会話とは違っ
て、資源マネジャはそれ自体の同期点ログを維持するの
で、参加する資源マネジャが開始側のアプリケーション
と同一のシステム内にある場合であっても、それらの資
源マネジャにはログ名交換が必要である。上記のSystem
Network Architecture LU6.2に記載の保護された会話
とログ名交換を確立するための通信プロトコルが使用で
きる、保護された会話とは違って、保護された資源は、
これらの機能のために、保護されない会話と専用のメッ
セージ・プロトコルを使用する。また、保護された資源
では、通信ファシリティを代行受信機能として用いるこ
とによって資源マネジャに対する初期の通信を集中的に
代行受信することが、あらゆる場合に実用的なわけでは
ない。これらの通信が必ずしも通信ファシリティを介し
て進行するわけではないからである。この1例が、アプ
リケーション環境52Aと同一のシステム50A内にあ
る資源マネジャ63A(図2)と、その資源を使用する
アプリケーション56Aの場合である。この状況では、
通信ファシリティを通過するのに資源との会話は不要で
あるが、その代わりに会話マネジャ53Aまたは他のロ
ーカルなファシリティを介した会話をサポートする。も
う1つの理由は、資源マネジャがその資源のユーザとの
会話の方法を完全に変更する必要なしにSystem Network
Architecture LU 6.2の通信プロトコルに適合できるよ
うに、資源マネジャのサポートに柔軟性を与えることで
ある。同期点障害からの自動的な回復処理には、上述の
保護された会話の場合と同様に、様々な参加者のログの
名前がその同期点が始まる前と同一であることが必要で
ある。
するログ名交換を示す図である。この実施例では、シス
テム50Aは、アプリケーション環境52A、関連する
資源アダプタ62A、回復ファシリティ70Aおよび共
通の資源回復のログ72Aを含む。資源マネジャはロー
カルでもリモートでもよいが、この図はローカルの場合
である。以下で詳細に説明するように、リモート資源マ
ネジャの場合の処理は、システム間通信の完了に通信フ
ァシリティが使用される点を除いて、基本的に同一であ
る。ローカルであれリモートであれ、保護された会話
は、通信には必ず通信ファシリティを使用して、同期点
以前の同意のためのログ名交換を開始するための共通の
代行受信点を提供するのに対して、資源マネジャは、図
のように、ローカルの場合には通信ファシリティの使用
を回避することができ、同期点以前のログ名交換を開始
するための上記の集中的代行受信点はない。
は、資源マネジャ63Aと関連づけられており、開始側
の回復ファシリティ70Aのログ72Aの名前を記憶す
る。また、ログ800A内の同期点ログ800A1は、
資源マネジャ63Aと関連づけられており、同期点手順
における、その保護された資源の状態を記憶する。以下
で詳細に説明するように、図23は、同期点マネジャと
参加する資源マネジャの間での適時のログ名交換と、ロ
グ72Aおよび800Aの一方または両方の再初期設定
を強制する障害によってもたらされたログ名の変更を認
識する能力とを保証するのに必要な、不可欠の要素を示
す図である。アプリケーション56Aが、資源アダプタ
62Aを介して資源マネジャ63Aに要求を送った時
(図26のステップ221)、資源アダプタ62Aは、
同期点マネジャ60Aを呼び出して、下記のものを要求
する(ステップ222)。1.回復ファシリティのログ
72Aのログ名。2.資源マネジャ63Aによる初期の
ログ名交換のために回復ファシリティ70Aとの会話を
確立するのに必要な、回復ファシリティ70Aの資源識
別子log_name_log。この識別子は、回復ファシリティ7
0Aを一義的に識別し、また回復ファシリティ70A
が、入りログ名交換会話を、以下で説明するように、接
続のために資源識別子sync_point_logを使用する同期点
マネジャの会話などの他の会話から区別できるようにす
る。その後、同期点マネジャ60Aは、資源識別子sync
_point_logを使用して、ローカル回復ファシリティ70
Aとの会話を確立する(図26のステップ223)。
るのに使用され、より具体的には、そのシステム内の現
在の実行環境内の資源のマネジャへの会話を完了するた
めに使用される。ある資源のマネジャは、その初期設定
時に、システム制御プログラム・ファシリティを使っ
て、資源をシステムに対して識別する。システム制御プ
ログラムは、強制的にこれらの資源識別子を一義的なも
のにする。図2の資源マネジャ63に加えて、他のファ
シリティも資源マネジャとして活動できる。その1例が
回復ファシリティ70であり、この回復ファシリティ7
0のログは、回復ファシリティ70がその資源識別子を
有する資源であると見なされる。資源には4つのタイプ
があり、そのそれぞれが、資源識別子のタイプによって
識別される。これらのうちの第1のものは、基本的に総
称的であり、どんな資源も含むように拡張することがで
きる。その他のものは、明確に資源回復用に定義されて
いる。 1.資源識別子objectによって識別される、object(オ
ブジェクト)資源。これは資源マネジャ63によって管
理されるオブジェクト78の集合である。これは、総称
的資源マネジャとその資源の場合であり、この資源は、
データ・ファイル、待ち行列、記憶装置またはアプリケ
ーションからなる集合を含むあらゆる資源に拡張するこ
とができる。このタイプの資源識別子は、その資源のマ
ネジャ63の所有する資源を、たとえばファイル・オー
プン、アプリケーションの起動など何らかの形で使用す
るために、資源マネジャとの会話を確立するのに使用さ
れる。 2.資源識別子object_recoveryによって識別されるobj
ect_recovery(オブジェクト回復)資源。これは、資源
マネジャのログ800であり、障害を発生した同期点手
順から回復する際の回復ファシリティ70との協力の手
順をサポートする。この識別子は、障害を発生した同期
点から回復する時点で、その資源のマネジャ63との会
話を確立して、自動的回復の一部としてログ名を交換
し、その同期点を完了するために、回復ファシリティ7
0が使用する。 3.資源識別子sync_point_logによって識別されるsync
_point_log(同期点ログ)資源。これは回復ファシリテ
ィ70Aによって管理されるログ72A(図19および
図23)と、ログ72Aの保守をサポートする1組の手
順である。この識別子は、同期点の状況に関するログ情
報を提供するために、同期点マネジャ60(図2)が、
その回復ファシリティ70との会話を確立するのに使用
する。 4.資源識別子log_name_logによって識別されるlog_na
me_log(ログ名ログ)資源。これは、回復ファシリティ
70Aによって管理されるログ名ログ72A2(図2
3)と、ログ名ログ72A2の保守をサポートする1組
の手順である。この識別子は、適当な回復ファシリティ
70Aとの会話を確立して、その回復ファシリティ70
Aとログ名を交換するために、資源マネジャ63Aが使
用する。
た後に、同期点マネジャ60Aは、資源アダプタ62A
が要求した回復情報を得る。この回復情報は、同期点マ
ネジャ60Aによって資源アダプタ62Aに戻され(図
26のステップ224)、要求を行っている他の資源ア
ダプタにを解放するために、同期点マネジャ60Aがこ
れを保持する。次に、資源アダプタ62A(図23)
は、同期点マネジャ60A(図23)に、下記の同期点
回復情報をも提供する(図26のステップ225)。 1.同期点中に障害が発生した場合に、資源マネジャ6
3Aに接続するために回復ファシリティ70A(図2
3)が使用することのできる、資源識別子object_recov
ery。この資源識別子object_recoveryを使用すると、資
源マネジャは、それぞれその処理に異なるプログラムを
必要とする、資源アダプタ62Aからの入り会話と回復
ファシリティ70Aからの入り会話を区別できるように
なる。全資源マネジャ用の標準のobject_recovery資源
識別子を確立するのではなくて、資源アダプタ62Aを
介して資源マネジャ63Aにそれ自体の資源識別子obje
ct_recoveryを提供する能力を与えることによって、回
復ファシリティ70Aは、この資源マネジャ63Aまた
は他のいずれかの資源マネジャの使用する他の資源識別
子との衝突を回避して、すべての資源マネジャが同期点
処理に参加するための、一般化された非破壊的なインタ
フェースを維持する。 2.同期点障害が存在する時、その同期点に参加する資
源マネジャ63Aを識別し、ログ名ログ72A2のそれ
用のエントリを見つけるために、回復ファシリティ70
Aが使用できる資源識別子object。この識別子は、同期
点の管理、同期点障害の場合の同期点のロギング、およ
び障害を発生した同期点からの回復のために、資源マネ
ジャを一義的に識別する。
ーション56Aの最初の要求に従って、資源アダプタ6
2Aは、それ自体の資源識別子objectを使用して、資源
マネジャ63Aへの会話を初期設定し、回復ファシリテ
ィ70Aの資源識別子log_name_logと、同期点マネジャ
から取得したログ72Aの現在の名前とを含む、回復情
報を渡す(図26のステップ226)。
ァシリティ70Aが1つだけ示されているが、複数のシ
ステム内にあるそれぞれそれ自体の回復ファシリティを
備えた複数のアプリケーションが資源を使用することが
あるので、単一の資源マネジャで複数の回復ファシリテ
ィを扱うことができる。これが図33に示されている。
図33において、資源マネジャ63Eは、システム50
A内のアプリケーション52Aとシステム50D内のア
プリケーション52Dの両方によって使用され、したが
って2つの回復ファシリティ70Aおよび70Dからの
ログ名情報を必要とする。
るために、資源マネジャ63Aは、ログ名ログ800A
2(図23)に、各回復ファシリティのログ72の名前
用のエントリを必要とする。これらの各ログ名はそれぞ
れ、1つまたは複数のアプリケーション56と同期点マ
ネジャ60を介して資源を使用するシステム50の1つ
を表す。参加する資源マネジャ63A用のログ名ログ8
00A2(図23)は、関連する回復ファシリティ70
のそれぞれについて、下記の情報を含む。 1.関連する各回復ファシリティ70(図23の場合は
回復ファシリティ70A)を識別する資源識別子log_na
me_log。 2.回復ファシリティ70のログ名(図23の場合、ロ
グ72Aの名前)。 3.ログ名が成功裡に交換済みであることを示すexchan
ge_done(交換終了)フラグ。exchange_doneフラグは、
論理的にはログ名ログ800A2(図23)の一部であ
るにもかかわらず、それに関連する資源マネジャが初期
設定されるごとに論理的にリセットされるので、これを
持久記憶装置に書き込む必要はない。このフラグの目的
は、特定の回復ファシリティ70Aのあるシステム50
A内で動作中の資源アダプタ62Aからの最初の会話を
除き、その回復ファシリティ70Aに関するログ名交換
を避けることである。1つのシステム内に、すべてが同
一の回復ファシリティのサービスを受け、それぞれが同
一のまたは異なる資源マネジャとの会話を有する資源ア
ダプタを備える、多数のアプリケーション環境が存在す
ることがある。資源マネジャがログ名交換を開始する必
要があるのは、同一の回復ファシリティに関連する資源
アダプタの1つとの会話の最初のインスタンスの際だけ
である。フラグexchange_doneがセットされると、それ
以後の交換が防止される。
始する時を決定するために、資源マネジャ63A(図2
3)が実行するアルゴリズムが示されている。資源識別
子objectを最初に受け取った時(ステップ226)、資
源マネジャ63Aは、ログ名ログ800A2を検索し
て、資源アダプタ62A(図23)から渡された回復情
報に含まれる資源識別子log_name_logによって識別され
る回復ファシリティ70A用のエントリがあるか否かを
判定する(図26のステップ230)。この資源マネジ
ャは、ログ名ログ800A2(図23)を検索するの
に、資源アダプタから受け取った資源識別子log_name_l
ogを使用する。エントリがない場合、資源マネジャ63
Aはログ名交換を開始する(図26のステップ23
2)。ステップ230で、回復ファシリティ70A(図
23)用のエントリが見つかった場合、資源マネジャ6
3Aは、フラグexchange_doneがセットされているか否
かを判定する(図26のステップ234)。フラグexch
ange_doneは、ログ名交換が成功した時にセットされ、
資源マネジャが異常終了するかまたは正常に遮断される
まで、セットされたままである。回復ファシリティとの
会話を開始するのに失敗したために、資源マネジャがロ
グ名を交換できない場合には、資源マネジャは、その資
源アダプタによって開始された会話を打ち切る。フラグ
exchange_doneがセットされていない場合、資源マネジ
ャ63A(図23)は、ステップ232(図26)でロ
グ名交換を開始する。しかし、フラグexchange_doneが
セットされている場合には、資源マネジャ63A(図2
3)は、資源アダプタ62Aから送られたログ名を、前
記のエントリ内のログ名と比較する(図26のステップ
236)。これら2つのログ名が同一である場合には、
資源マネジャはログ名交換を開始しないが(図26のス
テップ242)、異なる場合には、資源マネジャ63A
(図23)は、ステップ232(図26)でログ名交換
を開始する。前述のアルゴリズムは、資源マネジャがい
ずれかの回復ファシリティに関連する資源アダプタと初
めて通信する際に、その回復ファシリティに関してログ
名が交換されることを保証する。また、このアルゴリズ
ムは、その後に回復ファシリティ70A(図23)用の
ログ名が変更される時、ログ名が交換されることを保証
する。後者の場合、資源マネジャ63Aが資源アダプタ
から回復ファシリティのログ72Aの新しい名前を得る
場合であってもこのログ名交換は必要である。というの
は、回復ファシリティ70Aのログ名ログを資源マネジ
ャ63Aのログ名ログと同期させなければならず、回復
ファシリティ70Aに資源マネジャのログ800Aのロ
グ名を与えることが必要だからである。
ャ63A(図23)と回復ファシリティ70Aの間での
ログ名交換は、図27にさらに詳しく示されており、以
下のステップを含む(ログ72Aがそのログであると仮
定する) 1.図27のステップ243。資源マネジャ63A(図
23)が、資源アダプタ62Aから得た資源識別子log_
name_logを使用して、回復ファシリティ70Aとの会話
250を開始する。 2.図27のステップ243。資源マネジャ63A(図
23)が、回復ファシリティ70Aに資源マネジャ63
Aを一義的に識別するobject資源識別子を送る。 3.図27のステップ244。資源マネジャ63A(図
23)が、回復ファシリティ70Aにログ800Aのロ
グ名を送る。 4.図27のステップ245。回復ファシリティ70A
(図23)が、資源マネジャ800Aのログ名で、ログ
名ログ72A2を更新する。 5.図27のステップ246。回復ファシリティ70A
(図23)が、資源マネジャ63Aに応答を戻して、ロ
グ72Aのログ名を与える。 6.図27のステップ247。資源マネジャ63A(図
23)が、ログ72Aの名前でログ名ログ800A2を
更新する。 7.図27のステップ248。資源マネジャ63A(図
23)が、ログ名ログ800A2内のフラグexchange_d
oneをセットする。
期点マネジャ60Aから同期点を要求する時、同期点マ
ネジャ60Aは、上記の資源識別子object_recoveryと
資源識別子objectを回復ファシリティ70Aに送り、そ
こではこれらの識別子がその同期点処理の状態を記述す
る情報と共に同期点ログ72A1に記憶される。同期点
中に障害が発生した場合、回復ファシリティ70Aが活
動化されて、同期点手順を完了するのに必要な動作を行
う。障害を発生している同期点に資源が参加していた場
合、関連する回復ファシリティの同期点ログのエントリ
内の回復情報を使用して、回復を達成するためにそれら
の資源とコンタクトすることが可能になる。たとえば、
アプリケーション56Aが2段階コミット動作中にダウ
ンした場合、回復ファシリティ70Aが、活動化された
後に、資源マネジャ63Aとログ名を交換する。この第
2の交換で、この同期点の開始以降にログ名が変化して
いないことが示された場合には、回復ファシリティ70
Aは、この同期点の回復を続行できることを知る。この
交換でログ名が一致しない場合は、自動的回復に必要な
ログ情報が失われており、したがって自動的回復を試み
てはならないことを示している。回復ファシリティ70
Aは、第2のログ名交換を開始し、資源マネジャ63A
に、この障害前の資源マネジャ63Aの状態または段階
がどうであったかを尋ねる。上述したように、最初のロ
グ名交換が資源マネジャによって開始されるのに対し
て、障害発生後に必要なログ名交換は、下記のように回
復ファシリティ70Aによって開始される。 1.障害を発生している同期点に関連する同期点ログ7
2A1内に回復情報がある各資源について、回復ファシ
リティ70Aは、同期点ログ72A1のエントリ内で見
つかった資源識別子objectを、ログ名ログ72A2のエ
ントリに適用する検索の引数として使用し、その資源の
ログ名を得ることによって、その資源のログ名ログのエ
ントリを識別する。これを図25に示す。 2.回復ファシリティは、この同期点ログのエントリ内
で見つかった資源識別子object_recoveryを使用して、
資源マネジャ63Aへの会話252(図23)を確立す
る。 3.回復ファシリティ70Aは、それ自体のログ名、資
源識別子log_name_log(回復ファシリティ70Aの一義
的識別子)、およびこの資源のログ名を、会話252を
使って資源マネジャ63Aに送る。
下のステップを実行する。 1.資源マネジャ63Aは、回復ファシリティ70Aか
らの会話が、資源識別子object_recoveryを含んでいる
ので、その会話が同期点回復の目的を意図したものであ
ることを認識する。 2.資源マネジャ63Aは、回復ファシリティ70Aか
ら送られた資源識別子log_name_logを使用して、ログ名
ログ800A2内の、回復ファシリティ70Aに関連す
るエントリを検査する。 3.資源マネジャ63Aは、回復ファシリティ70Aか
ら送られた資源のログ名が、それ自体のログ800Aの
ログ名と対応することを確認する。 4.資源マネジャ63Aは、ログ名ログ800A2内で
回復ファシリティ70Aに関連するエントリを見つけら
れない場合、会話252上で回復ファシリティ70Aに
エラー信号を戻す。 5.資源マネジャ63Aは、上記の検査ステップのいず
れかが失敗した場合、会話252上で回復ファシリティ
70Aにエラー信号を送る。
出されると、回復ファシリティ70Aの自動的同期点障
害回復手順の継続が阻止される。このようなエラー状態
は、1つまたは複数の参加するログの障害が、この同期
点障害と同時に発生したことを示す。あるログの喪失
は、そのログ内のすべての情報が失われ、新規のログ名
が割り当てられることを意味する。このような障害に
は、障害を発生している同期点を解決するため、手動の
介入およびヒューリスティックな判断が必要である。こ
のようなエラー状態を検出することが、同期点障害の後
に実施されるログ名交換処理の主目的である。
3Aの場合と同様に、図24には、システム50Dの資
源マネジャ63Eが、資源マネジャ63Eによって管理
される資源を使用するシステム50Aのアプリケーショ
ン環境52Aおよびアプリケーション56Aに対してリ
モートである場合の、ログ名交換が示されている。リモ
ート資源マネジャ63Eとローカルなアプリケーション
56Aおよび回復ファシリティ70Aの間の通信は、シ
ステム制御プログラムによって提供されるシステム間通
信サポートではなくて、システム間通信ファシリティ5
7Aおよび57Dを介して行われる。同期点マネジャ6
0Aは、回復ファシリティ70Aを使用して、同期点
と、障害を発生している同期点からの回復に必要なログ
名ログ72Aとを管理する。資源マネジャ63Eは、そ
れ自体の資源マネジャ・ログ800Eを維持する。同期
点以前の同意の時点と、障害を発生している同期点を回
復するための再同期化の時点で使用される通信経路は、
資源マネジャ63Eとシステム50Aの回復ファシリテ
ィ70Aの間にある。システム50Dの回復ファシリテ
ィ70D(図示せず)は、この場合には使用されない。
というのは、起点側の同期点マネジャ、アプリケーショ
ンおよび関連する回復ファシリティが、システム50D
に対してローカルではなく、リモートなシステム50A
内にあるからである。資源マネジャがローカルの場合と
リモートの場合でのログ名交換処理の唯一の相違点は、
リモート資源マネジャ63Eと資源アダプタ62Aまた
は回復ファシリティ70Aの間での通信が、ローカル・
システム制御プログラムのシステム間通信サービスでは
なく、通信ファシリティ57Aまたは57Dを介して行
われる点である。それ以外は、このログ名交換の処理
は、図23を参照しながら説明した上記の処理と同一で
ある。通信ファシリティ57Aおよび57Dは、リモー
ト・ログとログ名を交換する時期の決定には参加しな
い。すなわち、これらの通信ファシリティは、図19の
保護された会話の場合のような、会話の代行受信は行わ
ない。
点のための回復ファシリティ図2に示した回復ファシリ
ティ70Aは、障害に出会った同期点を完了させるのに
使用する。ほとんどの場合、回復(再同期化)は、回復
ファシリティ70Aによって自動的に実行される。回復
ファシリティ70Aは、障害を認識した後に、ローカル
同期点マネジャ60Aの代理として働いて、その同期点
の参加者への代替のまたは再取得された通信を用いて、
その同期点を正常に完了させる。障害には、障害を発生
している同期点マネジャ60A、同期点マネジャ60A
とその回復ファシリティ70Aの間の通信の障害、アプ
リケーション・パートナ56Dまたは資源マネジャ63
の障害またはそれらとの通信の障害、および回復ファシ
リティ70Aの障害が含まれる。
は、IBMコーポレーション刊行物の“System Network
Architecture LU 6.2 Reference: Peer Protocols, SC
31-6808, Chapter 5.3 Presentation Services - Sync
Point verbs”に記載のタイプのものとすることができ
る。
内の、アプリケーション実行環境52A、52Bおよび
52Cと、参加する同期点アプリケーションにサービス
し、同期点回復のために、共通の回復ファシリティ・ロ
グ72Aを使用する。通常、複数のシステムが通信ファ
シリティ57を介して互いに相互接続されており、した
がって、複数の回復ファシリティ70を回復処理に使用
することができる。
50Fに関係する、様々な回復状況を示す図である。各
アプリケーション実行環境52A、52B、52D、5
2F、52Gは、資源回復を調整するためにそれぞれ同
期点マネジャ60A、60B、60D、60F、60G
(図示せず)を使用するアプリケーション56A、56
B、56D、56F、56G(図示せず)を実行する。
各同期点マネジャは、そのシステム内の回復ファシリテ
ィを使用して、同期点と、障害を発生している同期点か
らの回復に必要なログ名ログとを管理する。たとえば、
アプリケーション環境52Aおよび52B内の同期点マ
ネジャは、回復ファシリティ70Aを使用して、同期点
回復情報を回復ファシリティ・ログ72Aに書き込む。
資源マネジャ63A、63B、63D、63E、63
F、63Gは、それぞれ、それ自体の同期点と、ログ名
ログ800A、800B、800D、800E、800
F、800Gとを管理する。この例では、同期点の範囲
が矢印付きの実線で示されている。同期点はいずれの参
加者によって開始されることもでき、同期点の範囲は動
的であるが、図を簡単にするためにこの図は静的なもの
である。図の静的な場合では、同期点は、アプリケーシ
ョン環境52Bから52Dへさらに52Fへと、関連す
る同期点マネジャおよび保護会話アダプタ(図示せず)
を介し、実線の通信経路801および802を経て流
れ、またアプリケーション環境52A、52B、52
D、52F、52Gから、関連する同期点マネジャおよ
び保護会話アダプタを介し、それぞれ実線の通信経路8
03A−1、803A−2、803B、803D、80
3E、803F、803Gを経て、資源マネジャ63
A、63B、63D、63E、63F、63Gへと流れ
る。
いる。第1の範囲には、同期点マネジャ60Aを含む単
一のアプリケーション環境52Aが含まれ、2つの資源
マネジャ63Aおよび63Eを使用する。第2の同期点
の範囲には、3つのアプリケーション環境52B、52
Dおよび52Fが含まれ、これらはそれぞれ、様々な参
加資源マネジャ(52Bには63B、52Dには63D
と63E、52Fには63Fと63G)を含む。これを
図34の同期点ツリーに示す。第3の同期点の範囲に
は、アプリケーション環境52Gと資源マネジャ63G
が含まれる。
点と、障害を発生している同期点の回復のための再同期
化の時点で使用される通信経路を示す(前記の「保護さ
れた資源を回復するためのログ名の交換」を参照された
い)。資源マネジャでは、同期点以前の同意および再同
期化の経路は、その資源マネジャと、起点側アプリケー
ション環境(すなわち、その資源マネジャが管理する資
源を使用、たとえば更新する側)のシステムの回復ファ
シリティの間にあり、たとえば、アプリケーション環境
52Aが起点側である(資源マネジャ63Eの管理する
資源を使用する)時は、経路804A−2を介して資源
マネジャ63Eと回復ファシリティ70Aの間にあり、
アプリケーション環境52Dが起点側である時は、経路
804Dを介して資源マネジャ63Eと回復ファシリテ
ィ70Dの間にある。
ード式に伝播して、図34に示された同期点ツリーを形
成する。アプリケーション56B、56Dおよび56F
は、それぞれ保護会話アダプタ64B、64Dおよび6
4F(図示せず)によって管理される保護された会話8
01および802を介して、互いに通信する。アプリケ
ーション56B、56Dおよび56Fは、それぞれ資源
アダプタ62B、62D、62F(図示せず)を使用
し、これらの資源アダプタは、それぞれ保護されない会
話803B、803D、803E、803G、803F
を使用して、資源マネジャ63B、63D、63E、6
3G、63Fと通信する。このツリーには、同期点開始
側のアプリケーション56Bとそれに参加する資源マネ
ジャ63Bおよび分散アプリケーション56D、分散ア
プリケーション56Dに参加する資源マネジャ63E、
63Dおよび分散アプリケーション56F、分散アプリ
ケーション56Fに参加する資源マネジャ63Gおよび
63Fが含まれる。
たとえば72Dが、同期点マネジャ60Dによって(図
示されない回復ファシリティ70Dを介して)、同期点
ツリー内でその直前にある環境52B内のアプリケーシ
ョン56Bと、直接参加者であることが同期点マネジャ
60Dにわかっている、資源マネジャ63E、63Dお
よびアプリケーション環境52F内のアプリケーション
56Fとに関する情報と共に維持されるが、その他の同
期点参加者63B、63Gまたは63Fに関しては、同
期点ログ72D内に何も維持されない。
流れ図298である。この図は、回復ファシリティ70
の2つの部分、同期点以前の回復同意(ステップ29
9、300、301および302)と同期点障害からの
回復(ステップ303ないし306)を表している。
者の間で、その同期点に関連するログの一致と、それら
のそれぞれのログ72の現在のレベルとに関する同意が
なければならない(前述の「保護された資源を回復する
ためのログ名の交換」を参照されたい)。この同期点以
前の回復同意は、同期点障害の場合にその同期点障害か
ら回復するのに使用されるログが、その同期点が開始さ
れる前と同一のものであり、同一のレベルであることを
保証するのに重要である。同期点以前の回復同意の時点
(上述のログ名の交換)から同期点障害の発生までの間
に、1つまたは複数の参加者のログに障害があって、新
規のログを用いて開始しなければならない場合には、こ
の障害を発生したログに関連する自動的回復手順は失敗
する。
グ名をログ72に記録すると、同期点障害の場合に、こ
の情報を妥当性検査に使用できるようになる。これらの
交換は、特定の経路上で通信が初めて確立されるのを検
出した時に開始される。通信はローカルにもリモートに
も開始され得るので、回復ファシリティ70は、出ログ
名交換が必要なローカル検出(ステップ299および3
00)と、入りログ名交換が必要なリモート検出(ステ
ップ301および302)の両方をサポートする。
の自動的回復を実現し、これには、回復手順を開始させ
る様々な事象が発生するステップ303、回復手順の初
期設定ステップ304、回復ドライバ処理と称する実際
の回復ステップ305、および回復手順終了ステップ3
06が含まれる。回復ファシリティ70は、複数の同期
点障害事象の非同期的処理を含む。
らの回復」の部分(ステップ303ないし306)をよ
り詳細に示す図である。下記の5種類の事象(ステップ
303)が、この回復手順を開始させる。 (1)同期点マネジャ60が、その1つまたは複数の同
期点参加者(たとえば、資源マネジャ63)との通信障
害に出会った時に同期点マネジャから要求を受け取った
結果として発生する、同期点要求事象311。この同期
点マネジャ60は、この同期点の活動をロギングするの
に使用するのと同一の経路を使って回復ファシリティ7
0に要求を送ることによって、明示的に回復手順を開始
する。この要求は、対応する同期点識別子を使った、障
害を発生している参加者の記述を含む。指定された各同
期点識別子ごとに1つの事象が発生する。 (2)同期点開始側を表す回復処理が、その参加者の1
つに回復要求を送る時に、ターゲット回復ファシリティ
70(障害を発生している同期点の参加者を表す回復フ
ァシリティ)で発生する、回復要求事象312。 (3)アプリケーション環境から回復ファシリティ70
にログ情報を送るのに使用される経路上の接続が断たれ
た時に、その回復ファシリティ70内で発生する、通信
障害事象313。障害を発生した経路を使用していたア
プリケーション環境に関して進行中の各同期点ごとに1
つの事象が発生する。 (4)回復ファシリティの終了に障害があり、その結
果、同期点のロギングを行えない時に発生する、回復フ
ァシリティ障害事象314。障害の時点で完了していな
い各同期点ごとに1つの事象が発生し、これらの事象
は、回復ファシリティが再始動される時に発生する。 (5)正常な自動的回復手順中に長い遅延または重大な
障害に出会った同期点障害を修復するのに用いられる管
理コマンドの結果として生じる、回復管理要求事象31
5。この要求は、通常なら自動的回復プロトコルを介し
て入手可能な応答状態情報を、手動で供給する。適当な
応答状態情報は、同期点のログ・レコードを手動で調べ
てオフラインで決定する。適当な応答データ(状態情
報)は、システム管理者が、同期点のログ・レコードを
手動で調べて決定する。
04で、受け取った各回復事象に対する非同期的サブプ
ロセスが開始される。参加ドライバ・サブプロセス(ス
テップ317)が、一貫した解決策に関する同意を得る
ために、通信を開始し、障害を発生している同期点の下
流側の各参加者からの応答を受け入れる。この通信で
は、参加ドライバを用いて、回復サーバのログ名と、co
mmitやback outなどの同期点状態とを含むメッセージを
送り、その後、送られた回復サーバのログ名に対する同
意または不同意の指示、参加者のログ名、およびcommit
tedやbacked outなどの同期点状態に対する応答を含
む、参加者からの応答を受け取る。参加ドライバは、こ
のようにして受け取った各応答メッセージに対して、応
答処理ドライバを呼び出す(ステップ318)。応答処
理ドライバは、この応答を分析し、必要なすべての行動
と記録を完了する。これには、その参加者のログ名をロ
グ72内に記録されたその参加者のログ名と突き合わせ
て、その参加者がこの同期点の開始以来ログ障害に出会
っていないことを検査することが必要である。さらに、
この同期点応答を回復ファシリティ・ログ72に記入す
ることも必要である。その後、応答処理ドライバは、参
加ドライバにリターンする。すべての応答を受け取って
処理した後に、開始側応答ドライバ(ステップ319)
が呼び出されて、応答を作成してこの同期点の開始側を
代理する回復ファシリティにそれを送り、当該の場合に
は、この回復ファシリティがこの同期点をその同期点の
開始側と共に解決できるようにする。開始側への応答
は、現回復ファシリティがその参加者から受け取った応
答に類似しており、現回復ファシリティのログ名と、そ
れ自体のすべての同期点参加者からの結果に基づくcomm
ittedやbacked outなどの応答同期点状態を含む。最後
に、回復終了サブプロセス(ステップ306)が、関係
するすべての処理を終了する。
を示す図である。回復制御構造340は、特定の回復事
象に関する情報を保持し、その事象の現処理の間ずっと
存在する。制御構造340は、関連する同期点に対する
すべての参加者の回復に共通する情報を保持する。ま
た、ログ72内の関連するエントリ342へのアンカ
と、参加者制御構造344のチェーンへのアンカを保持
し、各参加者制御構造344は、現在の回復状況とこの
回復参加者の経路識別子を保持する。同期点ログのエン
トリ342は、ローカルの同期点参加者に共通するヘッ
ダ情報348、ならびに直接開始側と各直接参加者とに
関する本体情報350を有する。最後に、この同期点ロ
グに関連する回復ファシリティに既知の、各同期点経路
に関する初期ログ名交換情報を保持する、ログ名ログ・
エントリ354がある。
流れによってさらに示す。一部のフィールドは、あらか
じめ説明が必要である。"Chain"(チェーン)フィール
ドは、同じタイプの構造を相互接続するのに使用され
る。
る。同期点が段階2に達すると、この状態によって、下
流側の参加者を駆動してその同期点を解決することが可
能になる。同期点が、障害を発生した時点で段階1であ
った場合には、回復要求事象の処理で、開始側回復ファ
シリティの指示に従って、この状態を変更することがで
きる。
イバ318によって、参加者からの応答状態を用いて更
新される。
下流側の同期点参加者を駆動する目的で、様々な回復事
象処理によってセットされる。
回復事象処理311ないし315によってRCS_PARTICIP
ANTS_STATEと共に初期設定されるが、ある状況の下で
は、すなわち、開始側への応答が、ヒューリスティック
応答として知られる単方向性の決定から生じた、参加者
からの異常かつ予期されない応答を反映するためのもの
である場合には、応答処理ドライバ318によっても更
新される。このフィールドは、開始側に戻される状態を
形成するために開始側応答ドライバ319が使用する。
事象の起点側に応答するのに使用できる。
参加者に関連する経路である。これは、参加者にとって
SPL_RECOVERY_PATH_IDと同一である。
シリティに必要な、参加者または開始側に達する経路で
ある。
報を、ローカル回復ファシリティの同期点ログに供給す
るために、アプリケーション実行環境内の同期点処理が
使用する経路である。
の直接開始側に対して、応答を生成すべきであることを
示す。RCS_RETURN_TO_CALLERは、待機標識(以下で説明
する)を使用する時、同期点回復要求からの同期リター
ンを制御するために使用する。RCS_ERASE_LOGは、回復
管理要求がPURGE(パージ)オプションを含んでおり、
処理の完了時に同期点ログのエントリを消去させること
を記録するために使用する。SPL_INITIATORは、同期点
ログのエントリの本体の特定のサブエントリ内の情報
が、この同期点の開始側または参加者に関するものであ
ることを示す。
に呼び出すべき機能を決定するために、サブプロセス開
始サービスが使用する。
別子であり、同期点ツリー内のノードである。同期点ロ
グの各エントリは、独自の同期点識別子を有する。
処理を識別するためにタイマ待機サービスがセットする
もので、この時限待機間隔が終了した時にリセットされ
る。これは、特定のプロセスに対する時限待機を早めに
終了させるために、再開サービスを呼び出すのに使用さ
れる。
話の状況を記録するのに使用される。これがとり得る値
は4つあり、RESTART(再始動)、CONNECTED(接続済
み)、RETRY(再試行)およびRESPONDED(応答済み)で
ある。
る。潜在的な同期点通信に関係する各経路ごとに1つず
つ記録される。
の同じステップに対応する)によってトリガされ、回復
ファシリティ70の活動化中に同期点通信が初めて開始
される時に回復ファシリティ70によって実行される、
処理ステップ300を示す流れ図である。この処理で
は、ローカル回復ファシリティと、同期点通信のターゲ
ットに関連する回復ファシリティの間でログ名を交換す
るための処理を開始する(ステップ359)。
ータ(経路識別子)を提供する(ステップ361)。ロ
グ名ログは、ログ名の交換に使用される経路に関連する
ログ名を検索するのに使用される(ステップ362)。
このログ名交換の際には、予期されるターゲット・ログ
名が、ローカル回復ファシリティのログ名と共に送られ
る。このログ名交換の要求が送られ(ステップ363な
いし365)、その応答が処理される(ステップ36
6)。この交換に成功すると、ログ名ログは、新規のま
たは変更されたターゲット・ログ名で更新される。次に
回復ファシリティは、この経路から切断され(ステップ
367)、最初の通信サービスを呼び出して、この交換
が成功であったことを記録し、この処理された経路に対
する将来の交換事象を抑止し、あるいは交換が不成功で
あったことを記録して、通信の中断の継続を保証し、ロ
グ名交換の完了を試みる(ステップ368)。
ステップに対応する)で事象によってトリガされ、入り
ログ名交換要求の到着の結果として起こる、ステップ3
02の詳細を示す流れ図である。開始(ステップ37
0)の後に、ログ名と経路識別子を受け取り(ステップ
371)、それに応じてログ名ログが更新される(ステ
ップ371ないし373)。その経路に関連する中断
(タイマ待機)中の回復処理が存在する場合(ステップ
374)、回復ファシリティ70は、再開サービスを呼
び出して、各回復処理にその処理を再開させる。ログ名
交換応答(ステップ374A)は、ローカルのログ名
と、受け取った交換データに対する同意または不同意の
指示を含む。この応答は起点側に送られ(ステップ37
5)、交換に成功した場合には、最初の通信サービスを
呼び出して(ステップ376)、これ以降のその経路で
のログ名交換を抑止する。
動状態の同期点からの明示的要求事象(図36のステッ
プ311に対応するステップ311)に対する手順を示
す流れ図である。これは、アプリケーション環境52内
で部分的な障害が発生して、同期点からの回復が必要と
なるが、そのアプリケーションまたは同期点は終了させ
る必要のない場合に発生する。アプリケーション環境5
2内の同期点マネジャからの要求は、この同期点識別子
と、障害を発生している同期点を完了するのに使用され
る指示(コミットまたはバックアウト)を提供する。こ
れに加えて、障害を発生した各同期点参加者について、
回復経路識別子が与えられる。必要な処置は、以下で詳
細に説明するように、同期的(待機標識が与えられる)
または非同期的(待機標識が与えられない)に完了する
ことができる。
て、一致するSPL_SYNCPOINT_IDをもつエントリを探す
(ステップ381)ことを必要とする、手順(ステップ
380)を開始する事象(ステップ379)である。そ
れが見つかると、その同期点ログのエントリへのアンカ
を備える回復制御構造が作成され、この要求中で渡され
た指令に合わせてRCS_PARTICIPANTS_STATEが設定される
(ステップ382)。これに加えて、フラグRCS_RESPON
D_TO_INITIATORをセットすると、この同期点の開始側を
代理する回復ファシリティに応答を送ることが抑止さ
れ、待機標識が渡されている場合には、フラグRCS_RETU
RN_TO_CALLERがセットされ、回復処理が完了するまでこ
の要求に対する応答を遅らせる。待機標識がない場合
は、回復処理が開始した後に、開始側要求への応答があ
る。次に、与えられた経路識別子で表される各参加者ご
とに代理制御構造が作成され(ステップ383)、PCS_
STATUSがRESTARTに初期設定される。代理制御構造のチ
ェーンは、回復制御構造にアンカされる。次に、回復初
期設定を呼び出して(ステップ384)、回復制御構造
を渡す。この初期設定から戻る時、呼出し側への応答が
ある(ステップ385)。待機標識が使用されていた時
は、呼出し側は完了を知らされる。そうでない場合は、
この通知は、完了、または要求の処理が開始された(後
で完了する)との指示のいずれかである。
接開始側を代理する回復ファシリティから回復要求を受
け取ったことによって開始された事象(ステップ31
2)から生じる手順を示す流れ図である。これは、手順
(ステップ390)を開始して(ステップ388)、受
取サービスを呼び出し(ステップ391)、入り要求に
関連する経路識別子、障害を発生している同期点の同期
点識別子(その同期点内のローカル・ノードも識別す
る)、起点側の同期点ログに関連するログ名、開始側の
回復ファシリティが現回復ファシリティの同期点ログの
名前と一致すると予想しているログ名、およびこの障害
を解決するのに使用される指示(状態)を得る。
エントリを見つけるのに使用される(ステップ39
2)。次に、起点側のログ名を用いてLL_LOGNAMEを検査
し、渡された予期されるログ名を用いてローカルの同期
点ログの名前を検査する(ステップ393)。次に、同
期点ログを探索して、同期点識別子が一致するエントリ
を探す(ステップ394)。それが見つかると、その同
期点ログのエントリへのアンカを備えた回復制御構造が
作成され、この要求中で渡された指示に合わせてRCS_PA
RTICIPANT_STATEが設定される(ステップ395)。さ
らに、開始側への応答が適当であることを示すフラグRC
S_RESPOND_TO_INITIATORをセットし、RCS_PATH_IDを開
始側の入り経路の経路識別子に設定する。アプリケーシ
ョン環境52内の呼出し側同期点マネジャ60へのリタ
ーンを抑止するため、フラグRCS_RETURN_TO_CALLERをセ
ットする。最後に、回復初期設定を呼び出して(ステッ
プ396)、回復制御構造を渡す。
復ファシリティ70の間の経路に障害があって、同期点
のロギングが動作不能になる(ステップ313)時に行
われる処理(ステップ400)を示す流れ図である。処
理が開始された(ステップ399)後、同期点ログを探
索して、下記の両方の条件を満足するエントリを探す
(ステップ401)。 (1)SPL_SYNCPOINT_PATH_IDが障害を発生している経
路と一致する。 (2)SPL_SYNCPOINT_STATEが、この同期点を完了する
ために、同期点の直接参加者を駆動できることを示す。
これは、以下のいずれかによって示される。SPL_SYNCPO
INT_STATEが同期点段階1を示し、開始側の“prepare”
に対する応答がなかった場合、あるいはSPL_SYNCPOINT_
STATEが同期点段階2を示す場合。
点ログのエントリへのアンカを備えた回復制御構造が
(そのような各ログ・エントリごとに)作成される(ス
テップ402)。その際に、TOR_RESPONSE_STATEとRCS_
PARTICIPANTS_STATEは、共にSPL_SYNCPOINT_STATEから
導かれる。SPL_PARTICIPANT_STATEが、RCS_INITIATOR_R
ESPONSE_STATEの設定にも影響する場合がある。これ
は、たとえば参加者からの応答が、単方向の(ヒューリ
スティックな)行動を示していた時に起こる。さらに、
フラグRCS_RESPOND_TO_INITIATORをセットすると、この
同期点の開始側を代理する回復ファシリティに応答を送
ることが抑止され、フラグRCS_RETURN_TO_CALLERをセッ
トすると、戻るべき呼出し側の同期点マネジャが存在し
ないことを示す。この結果得られる回復制御構造が、相
互に連鎖される。最後に、回復初期設定を呼び出して
(ステップ403)、回復制御構造のチェーンを渡す。
発生した(ステップ314)場合に行われる処理(ステ
ップ408)を示す流れ図である。回復ファシリティ7
0が再始動される(ステップ407)時、ログ72を検
索して(ステップ411)、下記の条件を満足するすべ
てのエントリを探す。SPL_SYNCPOINT_STATEが、この同
期点を完了するために、同期点の直接参加者を駆動でき
ることを示していること。これは、以下のいずれかによ
って示される。SPL_SYNCPOINT_STATEが同期点段階1を
示し、開始側の“prepare”に対する応答がなかった場
合、あるいはSPL_SYNCPOINT_STATEが同期点段階2を示
す場合。
ログ・エントリごとにその同期点ログへのアンカを備え
た回復制御構造が作成される(ステップ412)。その
際に、RCS_INITIATOR_RESPONSE_STATEとRCS_PARTICIPAN
TS_STATEは、共にSPL_SYNCPOINT_STATEから導かれる。
場合によっては、SPL_PARTICIPANT_STATEが、RCS_INITI
ATOR_RESPONSE_STATEの設定にも影響を与える。これ
は、参加者からの応答が、たとえば単方向の(ヒューリ
スティックな)行動を示していた時に起こる。さらに、
フラグRCS_RESPOND_TO_INITIATORをセットすると、この
同期点の開始側を代理する回復ファシリティに応答を送
ることが抑止でき、フラグRCS_RETURN_TO_CALLERをセッ
トすると、戻るべき呼出し側の同期点マネジャが存在し
ないことを示す。この結果得られる回復制御構造が、相
互に連鎖される。最後に、回復初期設定を呼び出して
(ステップ403)、回復制御構造のチェーンを渡す。
5)のサポート(ステップ409)を示す図である。こ
のサポートは、下流側での解決のための同期点参加者と
の会話(参加者の場合)、または、同期点完了のために
その参加者を駆動する指示(状態)を与えるための同期
点開始側との会話(開始側の場合)を開始できなかった
ために動かなくなった自動的同期点回復の修復を、手動
で開始できるようにするものである。
代りをつとめ、その結果、下流側の参加者を駆動してい
る回復ファシリティ70は、実際にその参加者と通信す
ることなく回復を完了できるようになる。開始側の場
合、この要求は、開始側がローカルの回復ファシリティ
70と接続できないために発生し得ない、通常の回復処
理によって開始される回復要求事象(図41参照)の代
りをつとめる。後者の場合、この応答によって、ローカ
ルの回復ファシリティは、図41に示された事象なし
に、その参加者を駆動できるようになる。
(ステップ408)後に、回復制御構造を作成し(ステ
ップ414)、渡された指示に合わせてRCS_INITIATOR_
RESPONSE_STATEとRCS_PARTICIPANTS_STATEを設定して、
回復処理が開始した回復要求と等価な要求を形成する。
さらに、RCS_RESPOND_TO_INITIATORをオフにセットし
て、応答の生成を抑止し、RCS_RETURN_TO_CALLERをオフ
にセットして、処理の完了時に回復初期設定から戻るの
を抑止する。回復初期設定を呼び出して(ステップ41
5)、処理を開始させる。
回復処理がすでに存在していなければならない。この処
理は、タイマ待機中は中断され、各時間間隔の終わり
に、参加者との会話の初期設定が再試行される。これを
検査した後に(ステップ416)、渡された回復経路識
別子に関連する参加者の参加者制御構造を見つけ、この
参加者が実際に応答した場合と同様にPCS_STATUSをRESP
ONDEDに設定し(ステップ417)、渡された指示に合
わせてSPL_PARTICIPANT_STATEを設定する。その後、同
期点ログのエントリを更新する。次に、SPL_SUSPENDED_
PROCESS_IDを用いて再開サービスを呼び出し、中断され
たプロセスを再始動する(ステップ418)。いずれの
場合にも、起点側要求に対して、適当な置換が行われ、
回復処理が再び活動状態になっていることを示す応答が
行われる(ステップ419)。purgeオプションが渡さ
れた場合は、RCS_ERASE_LOGがオンになり、プロセスの
終了時に同期点ログのエントリが消去される。
04)に必要なステップを示す流れ図である。初期設定
(ステップ303)の後に、フラグRCS_RETURN_TO_CALL
ERに従って、参加ドライバが現在のプロセス内で呼び出
されたか(オン)、それとも別の並行プロセス内で呼び
出されたか(オフ)を判定する(ステップ421)。RC
S_RETURN_TO_CALLERがセットされている場合、参加ドラ
イバを呼び出して(ステップ422)、回復制御構造を
渡す。そうでない場合は、「参加ドライバ」を示すよう
にRCS_FUNCTION_IDを設定して、渡された各回復制御構
造ごとに、サブプロセス開始サービスを呼び出す(ステ
ップ423)。
の流れを示す流れ図である。参加ドライバの主な機能
は、関連する同期点ログが、その同期点の開始時と同一
レベルであることを保証し、その同期点を解決するため
の基礎となる同期点状態情報を提供するために、障害を
発生している同期点の参加者との通信を開始し、それら
の参加者から応答を得ることである。
0)の後に、現在のRCS_PARTICIPANTS_STATEに従って、
SPL_SYNCPOINT_STATEを設定する(ステップ431)。
この同期点の参加者に対する参加者制御構造が、まだ作
成されていない場合は、この時点でそれらの制御構造を
作成し、互いに連鎖し、現回復制御構造にアンカする。
PCS_PATH_IDは、各参加者のSPL_RECOVERY_PATH_IDから
得られる。SPL_PARTICIPANT_STATEがPCS_STATUSがRESPO
NDEDに設定されて、その特定の参加者に対する同期点が
解決されていると示さない限り、PCS_STATUSはRESTART
に初期設定される。
者に対するPCS_STATUSの値によって制御される。とり得
る値は以下の通りである。 (1)RESTART この参加者との会話が必要であるこ
とを示す。 (2)CONNECTED この参加者との会話の初期設定に成
功したことを示し、この参加者へ回復要求メッセージを
送らせる。 (3)RESPONDED この参加者への回復要求メッセージ
の送出が完了し、この参加者からの応答を得たことを示
す。応答処理ドライバを呼び出して(ステップ438な
いし439)、この応答を処理する。 (4)RETRY 接続(すなわち、会話の確立)(ス
テップ436ないし437)またはメッセージの送出
(ステップ440ないし441)の試みに失敗したこ
と、あるいはログ名が一致しなかったこと(ステップ4
40ないし441)を示す。参加者に関するすべてのフ
ラグPCS_STATUSが状況RESTARTおよびCONNECTEDよりも先
に進んでいるが、通信障害に出会ったものがある(他の
ものはRESPONDED)状態になった後に、現同期点の参加
ドライバは、時限間隔の間、実行を中断する。この中断
が完了した時、RETRYであったPCS_STATUSは、すべてRES
TARTに変更され、再接続が試みられる。
は、未処理の接続または送出のサービス要求のうちの最
初のものが完了するのを待って、制御をその経路識別子
および成否の指示と共に参加ドライバに戻すのに使用す
る。参加者に送られた回復要求(ステップ434ないし
435)には、送出側の回復ファシリティ70のログ名
と、参加者に関連する予期されるログ名が含まれる。参
加者の実際の状態と比較して、適当な回復行動を定義で
きるようにするために、RCS_PARTICIPANTS_STATEが送ら
れる。時限待機サービス(ステップ442〜443)
は、不成功であった会話の開始を再試行する前に、シス
テムで定義された時間間隔の間プロセスを遅延させるの
に使用する。この意図的な遅延は、すべての参加経路を
駆動し終えて、何らかの障害に出会った後だけ試みられ
る。時限待機完了(ステップ444)は、中断されたプ
ロセスを再始動させて、参加者との接続をもう1度試み
させる働きをする。すべての参加者が状況RESPONDEDに
達し、応答処理ドライバによる処理を完了した後、開始
側応答ドライバを呼び出して(ステップ445)、同期
点開始側を代理する回復処理への可能な応答を処理す
る。
に送られた回復要求に対する応答を処理するのに必要な
処理を示す示す流れ図である。応答処理ドライバ(ステ
ップ318)は、同期点識別子、経路識別子および参加
者から受け取った状態を渡される(ステップ450)。
次に、ログ名交換の応答が処理される(ステップ45
1)。ログ名が一致しない場合、流れは参加ドライバに
戻って(図36のステップ317)、時限待機の再試行
を起こさせるエラーを戻す。
見つけるのに使用される。その後、経路識別子を使用し
て、その同期点ログのエントリの本体内で、SPL_RECOVE
RY_PATH_IDに一致する参加者を見つける。次に、前記の
状態を用いて、SPL_PARTICIPANT_STATEを更新する(ス
テップ452)。
ば、単方向の(ヒューリスティックな)決定を反映する
など、参加者からの予期せぬ応答の結果として更新され
る場合がある(ステップ453)。最後に、切断サービ
スを呼び出して、現経路の接続を断つ(ステップ45
4)。
319)を示す流れ図である。まず、開始側応答ドライ
バが開始される(ステップ460)。RCS_RESPONSE_TO_
INITIATORがセットされていない場合(判断ブロック4
61)、応答する必要はない。したがって、同期点ログ
のエントリを消去するだけでよい(ステップ468)。
応答すべき開始側がない時(ステップ462)、すなわ
ち、回復ファシリティが同期点ツリーの最初のノードを
表している時も、応答は行わない。
側への応答の処理を求め、回復要求(図41に図示の事
象)がなく、その開始側に応答すべき既存の会話が存在
しない(判断ステップ479)時は、現回復ファシリテ
ィ70が代理する参加者が応答の準備ができていること
を、その開始側を代理する回復ファシリティに通知する
ために、その回復ファシリティとの上流向きの通信を試
みるのが適当である(ステップ464)。これは、ロー
カル回復ファシリティ70との通信の試みに以前に失敗
したために時限中断の状態になっているその開始側の回
復ファシリティがある時、すなわち、現在完了している
回復がローカル回復ファシリティ70の障害の結果生じ
た同期点障害から生じたものである(図43に図示の事
象)時に、最も効果的である。この上流向けの通信は、
時限中断を早めに打ち切り、したがって、同期点の解決
の遅延を最小にするという効果があるはずである。図3
9のステップ374が、(開始側を代理する)受信側回
復ファシリティの行動を示している。
らず、RCS_PATH_IDが設定されていない場合(判断ブロ
ック479)、回復中の同期点の同期点ログ・エントリ
の本体中から開始側のエントリを見つけ、それに関連す
るSPL_RECOVERY_PATH_IDを使って、SPL_RECOVERY_PATH_
IDに対する接続サービスを呼び出すことによって、上流
向けの通信が達成される。この会話を初期設定する試み
に失敗した時は、再試行は行われない(ステップ464
Aの判断経路“no”)。それは、この会話を完了し開始
側に通知するための任意選択の最適化手段だからであ
る。この会話が開始される場合(ステップ464Aの判
断経路“yes”)、図38のステップ364〜367に
従って、通常のログ名交換要求が送られ(ステップ46
4B)、その後、判断ステップ477を経て脱出する。
接続が完了していない場合は、回復終了を呼び出す(ス
テップ469)。
ロック465)時は、開始側への応答(ステップ466
および467)は行われない。そうでない場合は、RCS_
INITIATOR_RESPONSE_STATE(ステップ466)と応答サ
ービス(ステップ467)を使用して、開始側への正常
な応答が行われる。RCS_RESPOND_TO_INITIATORまたはRC
S_ERASE_LOGがオンである場合(判断ブロック47
7)、完了の前に、回復終了機能が呼び出される(ステ
ップ468)。
6)を示す流れ図である。この論理は、ステップ470
で開始した後、記憶域と制御構造をきれいにして(ステ
ップ471)、呼出し側に戻る(終了)か、またはサブ
プロセス終了サービスを呼び出して、現プロセスを完了
する(ステップ472)。
参加するアプリケーションの使用を最適化するために、
下記の非同期式再同期化の手順およびファシリティが提
供される。この手順に従えば、コミットを発行したアプ
リケーションが、再同期化中に遊休状態で待機する必要
がなくなるので、そのアプリケーションの実行の際の長
い遅延が回避される。そのアプリケーションは、その代
わりに、以下で詳細に説明するように、再同期化を待つ
間に他の有用な作業を行うことができる。同期点マネジ
ャと回復ファシリティは、デフォルトのアプリケーショ
ンまたはシステムがそれを要求する場合、この手順を実
行する。回復ファシリティ70は、非同期的再同期化
(進行中の再同期化)をサポートし、この非同期的再同
期化処理をサポートする体系的システム間通信の流れの
新規の拡張版をサポートする。たとえば、システム間通
信プロトコルは、“System Network Architecture LU
6.2 Reference: Peer Protocols, SC31-6808, Chapter
5.3Presentation Services - Sync Point verbs”によ
って定義されている。システム50内の体系的システム
間通信の拡張版には、Committed(最後の代理のみ)、F
orget、Backoutなどの流れに関して再同期化が進行中で
あることを示す追加の指示が含まれている。2つの異な
るシステムの回復ファシリティの間での初期交換中また
は再同期化中の交換ログ名のために定義されたデータ・
フィールド中に、この交換ログ名の送出側が進行中の再
同期化をサポートすることを示す標識がある。交換ログ
名の処理は、上記の「保護された資源を回復するための
ログ名の交換」に記述されている。このファシリティを
使用するためには、両方の回復ファシリティが進行中の
再同期化をサポートしなければならない。最後に、状態
比較データ・フィールド中に、再同期化が進行中である
ことをパートナに伝える標識がある。
理」および図2、図54、図3、図4および図5では、
2つのパートナ・アプリケーション56Aおよび56
D、それらのアプリケーション環境、それらの処理およ
び成功したコミット処理について記述し図示した。本節
では、非同期的再同期化をもたらすコミット処理中の障
害の説明を含むように上記の内容を拡張する。本明細書
に記載の非同期的再同期化処理は、保護された会話が同
一のシステム上にあるアプリケーション・パートナ間で
行われ、両方のアプリケーションが、たとえばVMオペ
レーティング・システム(“VM”はIBMコーポレー
ションの登録商標)の拡張バージョンの異なる仮想計算
機など、異なるアプリケーション環境内にある時にも適
用可能であることを理解されたい。また、他の実施例で
は、アプリケーション56Aまたはアプリケーション5
6Dが、異なるタイプの実行環境内で実行できることに
も留意されたい。
述べたように、アプリケーション56Aは、保護された
会話を介してアプリケーション56Dを開始する(図5
Aのステップ530)。保護会話アダプタ64Aおよび
64Dが、当該の同期点マネジャに登録される(図5A
のステップ532)。図50Aは、アプリケーション5
6Aが次に行う処理(図5Aのステップ533)を拡張
したものである。図50Aに示されるように、アプリケ
ーション56Aは、同期点マネジャ60Aに対して、
“set syncpoint options wait= no(同期点オプション
待機をnoにセット)”コールを発行して、同期点処理中
に障害が生じた場合に、アプリケーション56Aが、同
期的再同期化をいつまでも待つつもりがないことを示し
(ステップ900)、同期点マネジャ60Aは、このオ
プションを記録する(ステップ902)。アプリケーシ
ョン56Aがアプリケーション56Dにコンタクトして
何らかの作業を行うよう伝えた後に(図5Aのステップ
533)、アプリケーション56Dによって同様の処理
(図50Bのステップ904および906)が行われ
る。この実施例では、体系化デフォルトは、WAIT = yes
であることに留意されたい。ただし、要望に応じて、シ
ステム50Aおよびシステム50Dのデフォルト条件を
WAIT = noにすることも可能である。そのような場合、
アプリケーション56Aおよびアプリケーション56D
は、WAIT = noを望むならば、“set syncpoint options
(同時点オプション設定)”コールを発行する必要がな
い。“set syncpoint options”はローカル値である。
したがって、障害が検出された同期点マネジャ側で有効
な“syncpoint options”の値が、実際に使用される値
である。
管理」の記述と、図2および図5のステップ533A〜
546に従って進む。上記の詳細を要約すると、アプリ
ケーション56Aは、保護された会話を介してアプリケ
ーション56Dに要求を送って、アプリケーション56
Dにファイル78Dを更新させる。アプリケーション5
6Dは、アプリケーション56Aに回答して、アプリケ
ーション56Aにファイル78Aおよび78Bを更新さ
せる。アプリケーション56Aは、コミットを発行して
(図5Aのステップ534)、同期点マネジャ60Aに
保護会話アダプタ64Aを呼び出させて、保護会話アダ
プタ64Dへ段階1“prepare”コールを送らせる。こ
れにより、アプリケーション56Dは、コミット発行要
求を受け取る。アプリケーション56Dは、コミットを
発行し(ステップ537)、同期点マネジャ60Dは、
その段階1の処理を行い、保護会話アダプタ64Aに
“request commit”と回答するために保護会話アダプタ
64Dを呼び出す。この時、同期点マネジャ64Dの状
態は「不確定」である(その旨がそのログ72Dに記入
される)。保護会話アダプタ64Aは、同期点マネジャ
60Aに“request commit”と回答する。同期点マネジ
ャ60Aの他の資源も“request commit”と回答したの
で、同期点マネジャ60Aの状態は、現在“committe
d”であり、この状態をそのログ72Aに書き込む。次
に同期点マネジャ60Aは、その登録された資源にコン
タクトして、段階2の決定“committed”を渡す(図5
Bのステップ545)。次に、保護会話アダプタ64A
が、この段階2の決定“committed”を保護会話アダプ
タ64Dに送る(図5Bのステップ546)。ところ
が、この処理中に保護会話アダプタ64Aが、障害を発
見し、その結果、アプリケーション56Aとアプリケー
ション56Dの間の保護された会話のための、システム
50Aとシステム50Dの間の経路が使用不能になる。
保護会話アダプタ64Aは、同期点マネジャ60Aに
“resource failure(資源障害)”と回答する。これは
同期点マネジャ60Aの処理への割込みであり(図5B
のステップ550)、同期点マネジャ60Aに回復処理
を開始させる(図5Bのステップ557)。
例によって定義される。この実施例では、2段階コミッ
トの例は、「保護された資源の調整式同期点管理」で使
用したものである。回復処理は、同期点マネジャの段階
1または段階2の呼出しに対して、保護資源アダプタが
異常な回答をした場合に発生する。この異常な回答は、
システム障害、経路障害、プログラム障害または資源マ
ネジャ障害によって引き起こされる資源障害の結果であ
る。回復は、それを必要とする、障害を発生した保護さ
れた各資源ごとに独立に行われる。回復の目的は下記の
通りである。 1.保護された資源を、可能なら整合性のある状態に置
く。不可能なら、そのシステムの操作員に通知し、保護
された会話に障害が発生した場合には、その損傷を検出
したシステムに通知する。 2.ロックされた資源を他の用途に自由に使用できるよ
うに、ロック解除する。 3.回復ファシリティのログを更新して、そのLUWI
Dに関して保護されたすべての資源に同期点作業がこれ
以上は不要であると示す。
は、下記のものが含まれる。 1.回復ファシリティが動作しているシステムが障害を
発生した場合に、同期点の動作状況を表す、回復ファシ
リティのログ・レコードからのデータ構造が復元され
る。これらのデータ構造から、回復ファシリティ(他の
実施例では、1つのファシリティが同期点処理と回復処
理の両方を実行するので、回復ファシリティが同期点マ
ネジャと呼ばれることもある)は、それが回復を開始す
る責任を負う資源を決定する。この回復がシステム障害
なしに発生する場合には、この回復ファシリティによっ
て使用される同期点中に書かれたデータ構造がまだ無傷
なので、ログから情報を復元する必要はない。 2.回復を開始する責任を負う回復ファシリティ内のプ
ログラムが起動される。この実施例で保護された会話に
使用される会話の例では、これは、下記のことを意味す
る。保護された会話に関して、最初にこの同期点に関係
した、確認を必要とするタイプのシステムの回復ファシ
リティ内で実行中のパートナ回復プログラムとの保護さ
れない会話を確立する。(これには、活動化すべき2つ
のシステムの間に新規の経路が必要になることがあ
る。)パートナが、LUWIDの適当な記憶を有するこ
とを検査するためにログ名を交換する。両パートナのL
UWIDの状態(すなわち、commitまたはbackout)を
比較し調節する。回復完了時に回復ファシリティ・ログ
のエントリを消去し、その結果を両パートナの操作員に
通知する。 3.この2段階コミット手順に参加する他の資源マネジ
ャに対して、同様の回復方法が定義される。一般に、非
分散式保護資源マネジャに対する回復処理は、同期点サ
ポートを実施するオペレーティング・システムによって
定義される。保護された会話に対する回復処理は、シス
テム間通信アーキテクチャによって定義される。たとえ
ば、前者は、VMオペレーティング・システム(“V
M”はIBMコーポレーションの登録商標)の拡張バー
ジョンによって定義されるタイプでよく、後者は、“Sy
stem Network Architecture LU 6.2 Reference: Peer P
rotocols, SC31-6808, Chapter 5.3 Presentation Serv
ices - Sync Point verbs”で部分的に定義されるタイ
プのものでよい。
生した資源の識別子(この例の場合、この資源は保護さ
れた会話64Aである)と処理中のLUWIDを用いて
回復ファシリティ70Aを呼び出す。回復ファシリティ
70Aは、そのLUWIDのログ・エントリと保護され
た会話64Aのエントリを見つける(図4のステップ5
18)。回復ファシリティ70Aは、このエントリ中の
状態情報から、回復の判断を決定する(ステップ51
9)。上述の処理に基づけば、この判断は“Commit”で
ある。回復ファシリティ70Aは、回復すべき資源が保
護された会話であることを知っており、回復処理を開始
する。この回復処理は、その会話のための体系化された
回復方法と使用される2段階コミット・パラダイムとに
よってその処理が定義されるアプリケーションである。
この回復処理は、システム50D上の回復ファシリティ
70D内のパートナの回復処理のために、保護されない
会話を開始する(ステップ520)。この回復の試み
は、経路障害のために2つのシステム間で会話が開始で
きない(判断ブロック521のNO分岐)ので、失敗す
る。その後、回復ファシリティ70Aは、ログ・エント
リを検査して、アプリケーション56Aが、回復が完了
しないうちに、回復ファシリティ70Aが同期点マネジ
ャ60Aにリターンできることを意味する WAIT = Noを
要求したか否かを調べる。次いで、回復ファシリティ7
0Aは、後でアプリケーション56Aとは非同期的に回
復を完了することができる(ステップ524)。この情
報は、同期点マネジャ60Aが、その段階1のログ書込
み中に書き込んだものである。上述したように、アプリ
ケーション56Aは、“set syncpoint options wait =
no”コールを発行した。したがって、回復ファシリテ
ィ70Aは、同期点マネジャ60Aに回復の意図すなわ
ちコミットと、再同期(回復)がまだ進行中であるとの
指示を戻す(ステップ526)。同期点マネジャ60A
は、すでに他の保護された資源から“forget”を伝えら
れているので(図5Bのステップ545A)、LUWI
Dの値を1だけ更新し、アプリケーション56Aに、意
図した結果であるCommitと、すべての資源がコミットさ
れてはいないこととを示す戻りコード“RC= OK.LUW_OUT
COME_PENDING”を戻す(図5Bのステップ558)。こ
れは、このコミット処理がアプリケーション56Aとは
非同期的に完了されることを意味する。したがって、ア
プリケーション56Aはその後に他の作業の処理を継続
でき、再同期化を待って時間を浪費することがない。
D上の回復ファシリティ70Dを用いて、保護会話アダ
プタ64Aの回復の完了を成功させようと繰り返し試み
る(図4のステップ527)。回復を開始して最終的に
完了した時(判断ブロック521のYES分岐)、回復フ
ァシリティ70Aと回復ファシリティ70Dは共に、回
復が開始されたこと、およびそれが成功裡に完了したこ
とを示す操作員メッセージを書く(ステップ522)。
同期点マネジャ60Dも、その登録された資源である保
護会話アダプタ64Dを介して、障害を発生した会話に
ついて知らされている。同期点マネジャ60Dは、障害
を発生した資源、この場合は保護された会話64Dの識
別子とLUWIDとを用いて、その回復ファシリティ7
0Dにもコンタクトしていた。回復ファシリティ70D
は、同期点マネジャの「不確定」の状態に基づいて、回
復ファシリティ70Aによる回復のためにコンタクトさ
れるのを待たなければならなかったことを知っていた。
この回復が最終的に完了する時(判断ブロック523の
分岐YES)、回復ファシリティ70Dは同期点マネジャ
60Dにコミットの判断を戻す(ステップ523A)。
その後、同期点マネジャ60Dはその段階2の処理を実
行する。保護された会話が中断しているので、同期点マ
ネジャ60Dは続いて新規の一義的なLUWIDを得
る。その後、同期点マネジャ60Dはアプリケーション
56Dにコミットの結果を戻す。これで、アプリケーシ
ョン56Dはその処理を実行できるようになる。以前の
例では、同期点マネジャ60Aに対して保護会話アダプ
タ64Aによって代理される保護された会話ではなく、
ステップ545Aでファイル・マネジャ63Aで障害が
起こり得たことに留意されたい。この代替例では、回復
ファシリティ70Aは、オペレーティング・システムに
よって定義される保護されない会話用の回復方法に基づ
いて、回復ファシリティ70Dの代わりにファイル・マ
ネジャ63Aを用いて回復を開始することになる。
がって、同期点マネジャ60Aも)が、コミット要求の
開始側であった。ところが、図51は、アプリケーショ
ン56Aではなく、システム50Hにある別のアプリケ
ーション56Hがコミットを開始した(ステップ70
0)別の例を示す図である。アプリケーション56Hが
実行されるアプリケーション環境は、アプリケーション
56Aが実行される環境と類似していても異なっていて
もよい。ただし、両方のシステムおよびアプリケーショ
ン環境は、どちらも前述の通信と2段階コミット手順を
サポートする。システム50Aとシステム50Dは、図
2のそれと同一である。図51(およびそれに続く図5
2と図53)に示す例では、アプリケーション56H
は、システム50H内の同期点マネジャ60Hに対し
て、システム50H、システム50Aおよびシステム5
0D内の資源を使用するコミット要求(SYNCPT)を発行
した。このコミット要求に応答して、同期点マネジャ6
0Hは、段階1の“prepare”コールを用いて、その登
録された資源である保護会話アダプタ64Hを呼び出
す。次に、保護会話アダプタ64Hが、システム50A
内の保護会話アダプタ64Bに体系的システム間“prep
are”コールを送る(ステップ701)。前述したよう
に、この“prepare”信号は、2段階コミット手順の第
1段階の一部である。次に、保護会話アダプタ64Bが
アプリケーション56Aに“Take Syncpoint”の通知を
与え(ステップ704)、これに応答して、アプリケー
ション56Aが同期点マネジャ60Aに対してコミット
要求(SYNCPT)を発行する(ステップ706)。次に、
同期点マネジャ60Aが、段階1の“prepare”コール
を用いて保護会話アダプタ64Aを呼び出す。保護会話
アダプタ64Aは、システム50D内の保護会話アダプ
タ64Dに体系的システム間prepareコールを送る(ス
テップ708)。これに応答して、保護会話アダプタ6
4Dがアプリケーション56Dに“Take Syncpoint”通
知を与える(ステップ710)。これに応答して、アプ
リケーション56Dが同期点マネジャ60Dにコミット
(SYNCPT)要求を発行する(ステップ712)。同期点
マネジャ60Dは、その登録されたすべての資源に段階
1の“prepare”コールを発行する。同期点マネジャ6
0Dによってアクセスされるすべての資源がコミットの
準備ができた時、同期点マネジャ60Dは、“request
commit”の回答を用いて保護会話アダプタ64Dを呼び
出す。保護会話アダプタ64Dは、体系的システム間
“request commit”コールをこのコミット要求の開始
側、この場合には保護会話アダプタ64Aに送り、保護
会話アダプタ64Aは同期点マネジャ60Aに“reques
t commit”と回答する(ステップ714)。同期点マネ
ジャ60Aは、この要求と、その資源がすべて作動可能
である旨の通知とを受け取った後に、保護会話アダプタ
64Bに“request commit”と回答する。保護会話アダ
プタ64Bは、体系的システム間“request commit”コ
ールを、このコミット要求の開始側、この場合には開始
側の保護会話アダプタ64Hと同期点マネジャ60Hに
送る(ステップ716)。同期点マネジャ60Aの代理
として保護会話アダプタ64Hからのこの回答と、同期
点マネジャ60Hの資源がすべて作動可能である旨の通
知とを受け取った後に、同期点マネジャ60Hの段階2
の決定がコミットされる。同期点マネジャ60Hは、段
階2の決定“commit”を用いてすべての資源を呼び出
す。保護会話アダプタ64Hは、呼び出されると、体系
的システム間“commit”コールを保護会話アダプタ64
Bに送り、保護会話アダプタ64Bは同期点マネジャ6
0Aに“committed”と回答し、これがその段階2の決
定になる(ステップ718)。
問題がなかった。また、各アプリケーションが、ステッ
プ700、706および712で当該の同期点マネジャ
にコミット要求を発行した後に、各同期点マネジャが、
段階1の情報と状態をそれぞれ当該の回復ファシリティ
・ログにロギングすることに留意されたい。同様に、同
期点マネジャ60Aおよび60Dはそれぞれ、それに関
連する資源からすべての資源が作動可能である旨の通知
を受け取ると、それぞれ当該の回復ファシリティ・ログ
のエントリに“in doubt”とロギングする。1つまたは
複数の資源がコミットできない場合、ログ・エントリは
作成されないが、上流側の開始側に“backout”と回答
する前に、バックアウト処理が完了している。同様に、
同期点マネジャ60Hは、その登録されたすべての資源
から“request commit”を受け取ると、その回復ファシ
リティ・ログに“commit”の決定を書き込む。同期点マ
ネジャ60Aおよび60Dは、それぞれこのコミット判
断を受け取ると、その登録された資源にコンタクトする
前に、それぞれ当該の回復ファシリティ・ログにこのコ
ミット決定を書き込む。
“commit”決定を用いて、その登録されたすべての資源
を呼び出す。同期点マネジャ60Aが、“commit”コー
ルで保護会話アダプタ64Aを呼び出すと、保護会話ア
ダプタ64Aは、体系的システム間“commit”コールを
保護会話アダプタ64Dに送ることを試み、保護会話ア
ダプタ64Dは、同期点マネジャ60Dに“committe
d”と回答しなければならない。ところが、この例では
この送信は会話経路の障害のために成功しない(ステッ
プ720)。この障害に応答して、同期点マネジャ60
Aは、このLUWIDと保護された会話とのための回復
処理を求めて回復ファシリティ70Aにコンタクトす
る。上述したように、回復ファシリティ70Aは、回復
ファシリティ70Dを用いた回復の実行を1回試みる
(ステップ722)。この例では、通信経路の障害が持
続しているので、この試みも成功しない。次に、回復フ
ァシリティ70Aは、ログ・エントリを読み取って、非
同期的再同期化が必要なことを知る。そこで回復ファシ
リティ70Aは、同期点マネジャ70Aに、この失敗し
た回復の試みと、回復が非同期的に継続されることを通
知する。その後、同期点マネジャ60Aは、“forget,
resynchronization-in-progress(RIP)(忘却、進行中の
再同期化)”を用いて、保護会話アダプタ64Bを呼び
出す。保護会話アダプタ64Bは、体系的システム間
“forget, RIP”コールを保護会話アダプタ64Hに送
り、保護会話アダプタ64Hは同期点マネジャ60Hに
“forget, RIP”と回答する(ステップ726)。その
後、同期点マネジャ60Aは、アプリケーション56A
に戻りコード“RC = OK. LUW_OUTCOME_PENDING”を与え
て、commitの意図と、このコミット処理が非同期的に完
了されることを知らせる(ステップ724)。ステップ
726の“Forget, RIP”通知は、ステップ718に対
する肯定応答として働き、それによって同期点マネジャ
60Hは、ステップ700の同期点に関係する同期点情
報用のその回復ファシリティ・ログに“forget”の状態
を書き込む。というのは、この時、2段階コミット処理
がアプリケーション56Hの要求したコミットに関して
完了しているからである。同期点マネジャ60Hは、そ
の保護会話アダプタ64Hから“Forget, RIP”の指示
を受け取ると(このコミットに関係する他のすべての資
源からメッセージを受け取っていると仮定して)、アプ
リケーション56Hに戻りコード“RC = OK. LUW_OUTCO
ME_PENDING”を戻して、コミットの意図と、このコミッ
ト処理が非同期的に完了されることを知らせることがで
きる(ステップ728)。
D上の回復ファシリティ70Dを用いた回復処理の実行
を定期的に試み、同時にコミットの指令を試みる(ステ
ップ730)。上述したように、回復が完了した時、回
復ファシリティ70Dは段階2の“commit”決定で同期
点マネジャ60Dに回答する。同期点マネジャ60D
は、その段階2の処理を完了し、アプリケーション56
Dにこのコミット要求が成功裡に完了したことを意味す
る戻りコード“RC =OK. ALL_AGREED”を戻す(ステップ
732)。アプリケーション56H、56Aおよび56
Dは、いずれも他の処理を続行できる。回復ファシリテ
ィ70Aと回復ファシリティ70Dの間で回復処理が行
われる時は、回復の開始とその処理の結果を示すメッセ
ージが、操作員コンソールに送られることに留意された
い。
シリティ70Aから“FAILED ATTEMPT TO RESYNC(再同
期化の試みに失敗した)”通知を受け取った時、ログ7
2A内のログ・エントリ内のLUWIDの状態を“Forg
et, RIP”に更新することにも留意されたい。システム
50Aは、後で、このLUWIDに含まれる保護された
会話を搬送していたシステム50Aとシステム50Hの
間の会話経路上に次の正常な流れが到着した時に、この
LUWIDに“forget”の状態を書き込む。これが“im
plied forget(暗黙の忘却)”動作である。同期点マネ
ジャ60Aが“Forget, RIP”の状態を書き込んだ後、
“implied forget”を受け取る前に、システム50Aと
システム50Hの間の会話経路(これを介して、進行中
の再同期化の通知を受け取ったコミット手順に関係して
いた保護された会話が流れていた)が働かなくなる障害
が生じた場合、システム50AのLUWIDのログ・エ
ントリが、使用される2段階コミット・パラダイムによ
って定義される正常な回復手順によって消去される。た
だし、これには、以前に定義した比較状態データ流れ中
で、新規の進行中の再同期化の標識が送られることが必
要となる。“implied forget”が受け取られ、それによ
ってシステム50Aが回復ファシリティ・ログ72Aに
“forget”の状態を書き込む場合は、回復ファシリティ
70Dでの回復が完了しない限り、回復ファシリティ7
0Aはこの回復レコードを実際に忘却させない。
で、前述の非同期的再同期化(進行中の再同期化)機能
をサポートする同期点マネジャは、これをサポートしな
い他の同期点マネジャと通信できることにも留意された
い。同期点処理をサポートするシステムが最初に互いに
通信する時は、両方のシステムに使用される通信体系と
2段階コミット手順とによって定義される初期ケイパビ
リティ交換の際に、これらのシステムが前述の進行中の
再同期化機能をサポートするか否かが決定される。コミ
ット要求の開始側、図51の上記の例では同期点マネジ
ャ60Hが、進行中の再同期化をサポートしない場合に
は、カスケード式の開始側(このコミット要求を受け取
る同期点マネジャ、上記の例では同期点マネジャ60
A)は、このコミット要求を開始した同期点マネジャ
(上記の例では同期点マネジャ60H)に、同期点要求
の意図(コミットまたはバックアウト)を送り返すが、
再同期化が後で非同期的に行われるとの指示は送り返さ
ない。ローカル・アプリケーションは、故障停止が発生
し(上記の例ではアプリケーション56A)、同期点マ
ネジャが進行中の再同期化をサポートする(上記の例で
は同期点マネジャ60A)場合、この進行中の再同期化
通知を受け取る。
で詳細に示すようにバックアウトを発行する場合の進行
中の再同期化の機能を示す図である。ステップ700〜
714は、図51と同一である。ただし、同期点マネジ
ャ60Hは、ステップ716で同期点マネジャ60Aか
ら保護会話アダプタ64Hを介して回答“request comm
it”を受け取った後に、その保護された資源のうちの1
つまたは複数が動作不能であるために、バックアウトす
ることを決定する。そこで、同期点マネジャ60Hは、
段階2の決定“backout”を用いてその登録された資源
を呼び出す。この決定“backout”が、同期点マネジャ
60Aに与えられる(保護会話アダプタ64Hが、体系
的システム間backoutコールを保護会話アダプタ64B
に送り、保護会話アダプタ64Bが、同期点マネジャ6
0Aに“backout”と回答する)(ステップ740)。
同期点マネジャ60Aは、段階2の決定“backout”で
その登録された資源を呼び出す。保護会話アダプタ64
Aは、ステップ742で、保護会話アダプタ64Dを介
して同期点マネジャ60Dにシステム間backoutコール
を送ろうと試みる。ところがこの例では、通信経路障害
またはその他のタイプの障害のために、ステップ742
は失敗する。これに応答して、同期点マネジャ60A
は、ステップ744で、LUWIDと障害を発生した資
源の識別子とを用いて回復ファシリティ70Aを呼び出
し、システム50D上の回復ファシリティ70Dを用い
た回復処理を実行させる。しかし、この例では、この回
復の試みも失敗する。回復ファシリティ70Aは、同期
点マネジャ60Aに、この回復の試みに失敗したが、非
同期的に回復処理を完了すると回答する。他の保護され
た資源からの通知を受けた後に、同期点マネジャ60A
は、その回復ファシリティのログ72Aに、“backout,
rip”の状態を書き込む。その後、同期点マネジャ60
Aは、“backout, rip”の回答を用いて保護会話アダプ
タ64Bを呼び出す。体系的システム間backoutコール
に基づいて、保護会話アダプタ64Bは、保護会話アダ
プタ64Hからの元の段階2の“backout”コールに対
してエラー回答を送る(ステップ748)。その後、保
護会話アダプタ64Bは、保護会話アダプタ64Hに、
体系的システム間“backout, rip”コールを送る(ステ
ップ750)。保護会話アダプタ64Hは、この“back
out, rip”の指示を受け取った後に、体系的システム間
肯定応答を送り(ステップ752)、同期点マネジャ6
0Hに“backout, rip”と回答する(ステップ75
2)。同期点マネジャ60Hは、他の資源からの回答を
得た後に、アプリケーション56Hに、バックアウトが
保留中であることを通知する戻りコード“RC = Backou
t, LUW_OUTCOME_PENDING”を戻して、アプリケーション
56Hが他の有用な作業を行ってもよいと知らせる(ス
テップ754)。保護会話アダプタ64Bは、保護会話
アダプタ64Hから“backout, rip”コールに対する肯
定応答(ステップ748および750に対する応答)を
得ると、同期点マネジャ60Aに“ok”と回答する。そ
の後同期点マネジャ60Aは、回復ファシリティのログ
72A内のこのLUWID用のログエントリに“forge
t”の状態を書き込み、アプリケーション56Aに戻り
コード“RC = Backout, LUW_OUTCOME_PENDING”を戻す
(ステップ746)。この戻りコードは、このコミット
要求の意図された結果がバックアウトであるが、すべて
の資源がバックアウトしたわけではないことを意味す
る。ここでアプリケーション56Aは、その処理を続行
できる。回復ファシリティのログ72A内のLUWID
エントリは、上述の“implied forget”としてシステム
50Aによって忘却される。この“forget”が書き込ま
れる時、このLUWID内の障害を発生した資源がまだ
回復されていない場合は、回復が行われるまでそのLU
WIDエントリは実際には忘却されない。その間に、回
復ファシリティ70Aは、システム50D内の回復ファ
シリティ70Dを用いて非同期的に回復の試みを続ける
(ステップ756)。回復が完了した時、同期点マネジ
ャ60Dは、バックアウトの通知を受け、その段階2の
処理を完了する。その後同期点マネジャ60Dはアプリ
ケーション56Dに、すべての資源がバックアウトされ
たことを意味する戻りコード“RC = BACK OUT. ALL_AGR
EED”を戻す(ステップ758)。アプリケーション5
6H、56Aおよび56Dは、いずれも他の処理を続行
できる。回復ファシリティ70Aと回復ファシリティ7
0Dの間で回復処理が行われる際に、回復の開始とその
処理の結果を示すメッセージが操作員コンソールに送ら
れることに留意されたい。
で詳細に示すようにバックアウトを発行する場合の進行
中の再同期化の機能を示す図である。ステップ700〜
714は、図52と同一である。ただし、同期点マネジ
ャ60Aは、ステップ714で回答“request commit”
を受け取った後、同期点マネジャ60Aに関連する資源
のうちの1つまたは複数がコミット不能であるため、段
階2の“backout”コールを用いてその登録された資源
を呼び出す(ステップ759)。保護会話アダプタ64
Aは、保護会話アダプタ64Dに体系的システム間“ba
ckout”コールを送ろうと試みる(ステップ760)。
ところが、ステップ760に示されるように、通信経路
障害またはその他の障害のため、この“backout”コー
ルを保護会話アダプタ64Dは受け取らない。同期点マ
ネジャ60Aは、LUWIDと障害を発生した資源の識
別子とを用いて回復ファシリティ70Aを呼び出し、回
復処理を実行するよう求める。回復ファシリティ70A
は、システム50D内の回復ファシリティ70Dを用い
て、回復処理を実行しようと試みる(ステップ74
4)。通信経路の障害が持続しているので、ステップ7
44も失敗し、その結果、同期点マネジャ60Aは、図
52を参照して上述したステップ746の信号を送る。
ステップ750〜758も、図52と同一である。
障害のために、同期点マネジャ60Aがバックアウトを
発行する場合の進行中の再同期化の機能を示す図であ
る。ステップ700〜706は、図52と同一である。
ただし、同期点マネジャ60Aは、ステップ706でコ
ミット要求を受け取った後に、段階1の“prepare”コ
ールを用いてその登録された資源を呼び出す。保護会話
アダプタ64Aは、保護会話アダプタ64Dに体系的シ
ステム間“prepare”コールを送ろうと試みる(ステッ
プ708A)。ところが、ステップ708Aに示される
ように、通信経路の障害またはその他の障害のために、
この“prepare”コールを保護会話アダプタ64Dは受
け取らない。同期点マネジャ60Aは、段階2のbackou
tコールを用いてそのローカルな登録された資源を呼び
出す(ステップ763)。その後同期点マネジャ60A
は、LUWIDと障害を発生した資源の識別子とを用い
て回復ファシリティ70Aを呼び出し、回復処理を実行
するよう求める。回復ファシリティ70Aは、システム
50D内の回復ファシリティ70Dを用いて回復処理を
実行しようと試みる(ステップ744)。通信経路の障
害が持続しているので、ステップ744も失敗し、その
結果、同期点マネジャ60Aは、図52を参照して上述
したステップ746の信号を送る。ステップ750〜7
56は、図52と同一である。同期点マネジャ60Aに
よって行われる処理とは非同期的に、アプリケーション
56Dが、以前(アプリケーション56Aがアプリケー
ション56Dを開始した時)に確立されたアプリケーシ
ョン56Aとの保護された会話上で経路障害の指示を受
け取る(ステップ761)。この経路障害のため、保護
会話アダプタ64Dは保護会話アダプタ64Aからprep
areコールを受け取れなかった。この経路障害は、保護
された会話に対して発生したので、アプリケーション5
6Dはバックアウト要求を発行しなければならない。ア
プリケーション56Dは、バックアウト要求を発行し
(ステップ762)、最終的に、すべての資源がバック
アウトされたことを示す戻りコードを受け取る(ステッ
プ764)。この時点で、アプリケーション56H、5
6Aおよび56Dは、いずれも他の処理を続行できる。
その間に、回復ファシリティ70Aは、システム50D
内の回復ファシリティ70Dを用いて非同期的に回復の
試みを続ける(ステップ756)。回復処理が回復ファ
シリティ70Aと回復ファシリティ70Dの間で行われ
る際に、回復の開始とその処理の結果を示すメッセージ
が操作員コンソールに送られることに留意されたい。
およびシステムが開示された。ただし、本発明の範囲を
逸脱することなく、多数の変更および置換が可能であ
る。したがって、本発明の開示は、例示的なものであっ
て、限定的なものではなく、本発明の範囲を決定するに
は、頭記の特許請求の範囲を参照すべきである。
たは作業要求のうちの1つまたは複数を発行できる、ユ
ーザ・プログラムまたはサービス・プログラムまたは資
源マネジャと統合された作業分散機能。
ーション、ミニ・コンピュータ、メインフレーム・コン
ピュータまたはその他のタイプのコンピュータあるいは
それらの任意の組合せにおいて、アプリケーション、シ
ステム・ファシリティ(回復ファシリティ、通信ファシ
リティなど)、資源マネジャまたはその他のプログラム
あるいはそれらの任意の組合せを実行するための、何ら
かの計算手段。
バックアウト手順の対象となる会話。
くはバックアウト手順の対象となる資源。
バックアウト手順の回復の責任を負うファシリティ。
るいはその両方の、コミットまたはバックアウトを調整 または同期あるいはその両方を行うための手順。通常、
2段階コミット手順は、保護された会話を介して、複数
の資源または単一の資源を原子的にコミットまたはバッ
クアウトするのに使用される。たとえば、2段階コミッ
ト手順には、ポーリングまたは準備段階と、バックアウ
トまたはコミット段階を含めることができる。
能を組み込んだ、従来技術によるコンピュータ・システ
ムのブロック図である。
ータ・システムを含むコンピュータ・ネットワークのブ
ロック図である。各システムは、共通の回復ファシリテ
ィとログで複数の実行環境をサポートする。
ンによって使用される資源に関する、2段階コミット手
順の流れ図である。
発生する時に実施される、回復処理の流れ図である。
護された会話によって接続された、2つの分散アプリケ
ーション環境内で実行されるパートナ・アプリケーショ
ンによって使用される資源に関する、2段階コミット手
順の流れ図である。
護された会話によって接続された、2つの分散アプリケ
ーション環境内で実行されるパートナ・アプリケーショ
ンによって使用される資源に関する、2段階コミット手
順の流れ図である。
を定義する複数の作業ユニットと、図2の複数のシステ
ムにまたがるコミット範囲とを示す、ブロック図であ
る。
容易にするための、図2の1つのアプリケーション環境
による、ローカル作業ユニットとグローバルな作業論理
ユニットの使用を示す、流れ図である。
を容易にするための、図2のもう1つの関連するアプリ
ケーション環境による、ローカル作業ユニットとグロー
バルな作業論理ユニットの使用を示す、流れ図である。
を容易にするための、図2のもう1つの関連するアプリ
ケーション環境による、ローカル作業ユニットとグロー
バルな作業論理ユニットの使用を示す、流れ図である。
トにおける、保護された会話のタイミング図である。
的な登録を示す、ブロック図である。
ミット手順用の資源を登録する手順と、そのコミット手
順のステップとを示す、流れ図である。
登録を示す、ブロック図である。
の時間の流れを示す図である。
録情報を変更し、資源を登録解除する手順を示す、流れ
図である。
点マネジャが、資源の登録を解除するのに使用する手順
を示す、流れ図である。
処理と、1段階コミット処理か2段階コミット処理かを
選択する際に同期点マネジャが行う最適化とを示す、流
れ図である。
プリケーション・プログラムを示す、流れ図である。
別のシステム内のパートナ・アプリケーションの間で保
護された会話が行われる時に、障害を発生したコミット
手順の回復をサポートするためのログ名交換に用いる構
成要素と手順を示す、ブロック図である。
後の会話事象のための図19に関連する処理の流れ図で
ある。
ティにある経路用のログ名を交換するよう要求した時
に、その結果として生じる、回復ファシリティによる、
図19に関連する処理の流れ図である。
ティにある経路用のログ名を交換するよう要求した時
に、その結果として生じる、回復ファシリティによる、
図19に関連する処理の流れ図である。
受け取った結果として生じる、回復ファシリティによ
る、図19に関連する処理の流れ図である。
を用いログ名交換のための構成要素と手順を示す、ブロ
ック図である。
用するログ名交換のための構成要素と手順を示す、ブロ
ック図である。
ック図である。
理を示す、流れ図である。
間でログ名を交換するための処理を示す、流れ図であ
る。
シリティを活動化する能力を示す、ブロック図である。
・フラグおよび情報をアプリケーション・プログラムに
渡す際の、図2の資源アダプタと同期点マネジャの参加
を示す、ブロック図である。
・プログラムにエラー情報を渡す手順を示す、流れ図で
ある。
29に関連するエラー・ブロックが使用するページを共
用するための、制御ブロック構造を示す図である。
管理に参加する、図2の構成要素のブロック図である。
よび異なるシステムに常駐する資源マネジャと、コミッ
ト処理中に使用される通信経路ならびに同期点回復処理
のために使用される経路を組み込んだ、複数のシステム
・コミット範囲にわたるコミット・サイクルを含む、3
つのシステムを示す、ブロック図である。
3つの参加するアプリケーションおよびアプリケーショ
ン環境とそれらが使用する資源マネジャとを示す、ブロ
ック図である。
順と同期点障害からの回復の手順を示す、高水準の流れ
図である。
ティの手順をより詳細に示す、流れ図である。
手順を制御するのに必要な制御構造とを示す、ブロック
図である。
を示す流れ図である。
を示す流れ図である。
である。
である。
である。
である。
である。
である。
図である。
図である。
である。
図である。
図である。
である。
アプリケーション56Aおよびアプリケーション56D
が非同期的再同期化を要求する様子を示すブロック図で
ある。
アプリケーション56Aおよびアプリケーション56D
が非同期的再同期化を要求する様子を示すブロック図で
ある。
行中の再同期化のステップを示す、流れ図である。
ックアウト指令に関係する、非同期的な進行中の再同期
化のステップを示す、流れ図である。
ックアウト指令に関係する、非同期的な進行中の再同期
化のステップを示す、流れ図である。
epareコールに関係する、非同期的な進行中の再同期化
のステップを示す、流れ図である。
の実施例のブロック図である。
の実施例のブロック図である。
Claims (20)
- 【請求項1】資源を必要とする作業動作をアプリケーシ
ョンから要求するステップと、 前記作業動作のためのコミット手順の実施を試みるステ
ップと、障害のため前記コミット手順が完了しなかった場合に 、
前記アプリケーションが実行を継続でき、前記障害から
の回復を待つ必要がないことを前記アプリケーションに
通知するステップと、 前記アプリケーションが実行を継続している間に、前記
アプリケーションとは非同期的に前記資源に対する前記
コミット手順を再同期化するステップとを含む、コミッ
ト手順の再同期化方法。 - 【請求項2】前記再同期化するステップが、前記コミッ
ト手順を完了するステップを含む、請求項1に記載の方
法。 - 【請求項3】前記作業動作が、別のアプリケーションと
の保護された会話である、請求項1に記載の方法。 - 【請求項4】前記コミット手順が2段階である、請求項
3に記載の方法。 - 【請求項5】前記資源がデータ貯蔵場所である、請求項
1に記載の方法。 - 【請求項6】前記アプリケーションが異なるプロセッサ
上で実行され、前記障害が前記プロセッサ間の通信の障
害である、請求項3に記載の方法。 - 【請求項7】前記再同期化するステップが、前記プロセ
ッサ間の通信を回復するステップを含む、請求項6に記
載の方法。 - 【請求項8】前記再同期化するステップが、前記プロセ
ッサの一方にサービスする回復ファシリティと前記プロ
セッサの他方にサービスする別の回復ファシリティの間
で通信を行うステップを含む、請求項7に記載の方法。 - 【請求項9】前記再同期化するステップの前に、所定の
回数だけ同期的再同期化を試みるステップを含む、請求
項1に記載の方法。 - 【請求項10】前記アプリケーションが再同期化を要求
する、請求項1に記載の方法。 - 【請求項11】さらに、同期的再同期化のためにのみ前
記作業要求に関係する別のアプリケーションによる選択
を記録し、それによって、コミット手順の障害が発生し
た時、再同期化の行われている間、前記別のアプリケー
ションを待たせるステップを含む、請求項10に記載の
方法。 - 【請求項12】前記再同期化するステップが、前記資源
との通信を回復するステップを含む、請求項5に記載の
方法。 - 【請求項13】前記アプリケーションの一方が、第1の
実計算機内の第1の仮想計算機内で実行され、他方のア
プリケーションが、第2の実計算機内の第2の仮想計算
機内で実行される、請求項3に記載の方法。 - 【請求項14】アプリケーションを実行するための第1
の実行環境と、 前記アプリケーションのためにコミット手順を実施する
手段と、 前記コミット手順が完了前に障害を発生した場合に、前
記アプリケーションに実行を継続するよう通知して、そ
れによって前記アプリケーションが前記コミット手順の
完了を待つ必要をなくする、通知手段と、完了していないコミット手順を、前記アプリケーション
とは非同期的に再同期化する 手段とを含むコンピュータ
・システム - 【請求項15】前記再同期化する手段が前記コミット手
順を完了させる、請求項14に記載のコンピュータ・シ
ステム。 - 【請求項16】さらに、第2のアプリケーションのため
の第2の実行環境と、 前記第1のアプリケーションと前記第2のアプリケーシ
ョンの間で保護された会話を行う手段とを含み、 前記コミット手順が前記の保護された会話のためのもの
である、 請求項14に記載のコンピュータ・システム。 - 【請求項17】前記コミット手順が2段階である、請求
項16に記載のコンピュータ・システム。 - 【請求項18】前記障害が、前記第1の実行環境と前記
第2の実行環境の間の通信の障害であり、前記再同期化する 手段が、前記障害に応答して、前記第
1の実行環境にサービスする回復ファシリティと、前記
第2の実行環境にサービスする第2の回復ファシリティ
または前記第1の実行環境によってアクセスされる資源
マネジャとの間で通信を再確立するための手段を含む、 請求項17に記載のコンピュータ・システム。 - 【請求項19】前記第1の実行環境が第1のプロセッサ
内にあり、前記第2の実行環境が第2のプロセッサ内に
あり、 さらに、前記第1のプロセッサにサービスする第1の回
復ファシリティと、 前記第2のプロセッサにサービスする第2の回復ファシ
リティを含み、 前記再同期化する手段が、少なくともその一部分が前記
第1および第2の回復ファシリティ内に含まれる、 請求項17に記載のコンピュータ・システム。 - 【請求項20】さらに、前記再同期化する手段を含む、
前記実行環境にサービスする、回復ファシリティを含
む、請求項14に記載のコンピュータ・システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US525429 | 1990-05-16 | ||
US07/525,429 US5319773A (en) | 1990-05-16 | 1990-05-16 | Asynchronous resynchronization of a commit procedure |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04229333A JPH04229333A (ja) | 1992-08-18 |
JPH0831043B2 true JPH0831043B2 (ja) | 1996-03-27 |
Family
ID=24093219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3088997A Expired - Fee Related JPH0831043B2 (ja) | 1990-05-16 | 1991-03-29 | コミット手順の非同期的再同期化実行装置および方法 |
Country Status (6)
Country | Link |
---|---|
US (2) | US5319773A (ja) |
EP (1) | EP0457112B1 (ja) |
JP (1) | JPH0831043B2 (ja) |
BR (1) | BR9102018A (ja) |
CA (1) | CA2040322C (ja) |
DE (1) | DE69132065D1 (ja) |
Families Citing this family (152)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5319773A (en) * | 1990-05-16 | 1994-06-07 | International Business Machines Corporation | Asynchronous resynchronization of a commit procedure |
GB2256514B (en) * | 1991-05-21 | 1994-11-16 | Digital Equipment Corp | Commitment ordering for guaranteeing serializability across distributed transactions |
US5701480A (en) * | 1991-10-17 | 1997-12-23 | Digital Equipment Corporation | Distributed multi-version commitment ordering protocols for guaranteeing serializability during transaction processing |
US5504899A (en) * | 1991-10-17 | 1996-04-02 | Digital Equipment Corporation | Guaranteeing global serializability by applying commitment ordering selectively to global transactions |
US5432926A (en) | 1992-12-04 | 1995-07-11 | International Business Machines Corporation | Method and apparatus for improving database reliability and response time in a distributed transaction processing system |
GB2276737A (en) * | 1993-03-30 | 1994-10-05 | Ibm | Fault-tolerant transaction-oriented data processing |
EP0673523B1 (en) * | 1993-10-08 | 1999-02-10 | International Business Machines Corporation | Message transmission across a network |
JP3593366B2 (ja) * | 1994-09-19 | 2004-11-24 | 株式会社日立製作所 | デ−タベ−ス管理方法 |
JP3441807B2 (ja) * | 1994-09-19 | 2003-09-02 | 株式会社日立製作所 | B木インデクスの管理方法およびシステム |
US5734817A (en) * | 1995-03-01 | 1998-03-31 | Unisys Corporation | Method for making a data base available to a user program during data base recovery |
GB2301686A (en) * | 1995-06-03 | 1996-12-11 | Ibm | Transaction synchronisation procedure in a routing node |
GB2301909A (en) * | 1995-06-07 | 1996-12-18 | Ibm | Reduction of logging in distributed transaction processing systems |
GB2303474A (en) * | 1995-07-19 | 1997-02-19 | Ibm | Optimized synchronisation procedure |
US5870757A (en) * | 1995-09-11 | 1999-02-09 | Sun Microsystems, Inc. | Single transaction technique for a journaling file system of a computer operating system |
US6122642A (en) * | 1996-01-18 | 2000-09-19 | Sabre Inc. | System for propagating, retrieving and using transaction processing facility airline computerized reservation system data on a relational database processing platform |
US6714945B1 (en) | 1995-11-17 | 2004-03-30 | Sabre Inc. | System, method, and article of manufacture for propagating transaction processing facility based data and for providing the propagated data to a variety of clients |
US5655072A (en) * | 1996-04-12 | 1997-08-05 | Samsung Information Systems America | Method and apparatus for testing a sytem component with test checkpointing |
US5727142A (en) * | 1996-05-03 | 1998-03-10 | International Business Machines Corporation | Method for a non-disruptive host connection switch after detection of an error condition or during a host outage or failure |
US5857204A (en) * | 1996-07-02 | 1999-01-05 | Ab Initio Software Corporation | Restoring the state of a set of files |
US5835698A (en) * | 1996-09-20 | 1998-11-10 | Novell, Inc. | Unilaterally-controlled, time-insensitive, data-link recovery apparatus and method |
US6745350B1 (en) * | 1997-01-03 | 2004-06-01 | Ncr Corporation | Automated failure recovery service |
US6105147A (en) * | 1997-04-16 | 2000-08-15 | Compaq Computer Corporation | Using process pairs as transaction-coordinated resource managers |
US6061714A (en) * | 1997-05-07 | 2000-05-09 | International Business Machines Corporation | Persistent cache synchronization and start up system |
US6058388A (en) * | 1997-06-16 | 2000-05-02 | Compaq Computer Corporation | Implementation of escrow-locking scalar quantities via process-pair resource managers |
US6128615A (en) * | 1997-06-17 | 2000-10-03 | Compaq Computer Corporation | Process-pair resource manager implementation of object bags |
GB2335516A (en) * | 1998-03-18 | 1999-09-22 | Ibm | Failure recovery in distributed transaction avoids heuristic damage |
US6959323B1 (en) * | 1998-08-27 | 2005-10-25 | Lucent Technologies Inc. | Scalable atomic multicast |
US8631066B2 (en) * | 1998-09-10 | 2014-01-14 | Vmware, Inc. | Mechanism for providing virtual machines for use by multiple users |
US6263433B1 (en) | 1998-09-30 | 2001-07-17 | Ncr Corporation | Provision of continuous database service and scalable query performance using active redundant copies |
US6202149B1 (en) | 1998-09-30 | 2001-03-13 | Ncr Corporation | Automated application fail-over for coordinating applications with DBMS availability |
US7159005B1 (en) | 1998-10-16 | 2007-01-02 | International Business Machines Corporation | Methods, systems and computer program products for restartable multiplexed file transfers |
US6279041B1 (en) | 1998-11-13 | 2001-08-21 | International Business Machines Corporation | Methods, systems and computer program products for differencing data communications using a message queue |
US6401136B1 (en) | 1998-11-13 | 2002-06-04 | International Business Machines Corporation | Methods, systems and computer program products for synchronization of queue-to-queue communications |
US6330686B1 (en) * | 1998-11-30 | 2001-12-11 | International Business Machines Corp. | Handling protected conversation messages across IMS restart in shared queues environment |
US6321238B1 (en) | 1998-12-28 | 2001-11-20 | Oracle Corporation | Hybrid shared nothing/shared disk database system |
US7640325B1 (en) | 1999-07-09 | 2009-12-29 | Lsi Corporation | Methods and apparatus for issuing updates to multiple management entities |
US6584499B1 (en) | 1999-07-09 | 2003-06-24 | Lsi Logic Corporation | Methods and apparatus for performing mass operations on a plurality of managed devices on a network |
US6769022B1 (en) | 1999-07-09 | 2004-07-27 | Lsi Logic Corporation | Methods and apparatus for managing heterogeneous storage devices |
US6480955B1 (en) | 1999-07-09 | 2002-11-12 | Lsi Logic Corporation | Methods and apparatus for committing configuration changes to managed devices prior to completion of the configuration change |
US6480901B1 (en) | 1999-07-09 | 2002-11-12 | Lsi Logic Corporation | System for monitoring and managing devices on a network from a management station via a proxy server that provides protocol converter |
US7206805B1 (en) * | 1999-09-09 | 2007-04-17 | Oracle International Corporation | Asynchronous transcription object management system |
JP4237354B2 (ja) * | 1999-09-29 | 2009-03-11 | 株式会社東芝 | トランザクション処理方法及びトランザクション処理システム |
US6643797B1 (en) * | 1999-12-14 | 2003-11-04 | Microsoft Corporation | Single I/O session to commit a single transaction |
US6873987B1 (en) | 2000-05-31 | 2005-03-29 | International Business Machines Corporation | Method, system and program products for recovering from failures within a shared nothing distributed computing environment |
US7260590B1 (en) * | 2000-12-06 | 2007-08-21 | Cisco Technology, Inc. | Streamed database archival process with background synchronization |
US7571215B2 (en) * | 2001-07-16 | 2009-08-04 | Bea Systems, Inc. | Data replication protocol |
AU2002355086B2 (en) * | 2001-07-16 | 2008-10-16 | Oracle International Corporation | Data replication protocol |
US20030023898A1 (en) * | 2001-07-16 | 2003-01-30 | Jacobs Dean Bernard | Layered architecture for data replication |
US6918013B2 (en) * | 2001-07-16 | 2005-07-12 | Bea Systems, Inc. | System and method for flushing bean cache |
US7702791B2 (en) * | 2001-07-16 | 2010-04-20 | Bea Systems, Inc. | Hardware load-balancing apparatus for session replication |
US7409420B2 (en) * | 2001-07-16 | 2008-08-05 | Bea Systems, Inc. | Method and apparatus for session replication and failover |
US20030046230A1 (en) * | 2001-08-30 | 2003-03-06 | Jacobs Dean Bernard | Method for maintaining account consistency |
US7028030B2 (en) * | 2001-08-30 | 2006-04-11 | Bea Systems, Inc. | Cluster caching with concurrency checking |
US6826601B2 (en) | 2001-09-06 | 2004-11-30 | Bea Systems, Inc. | Exactly one cache framework |
US7113980B2 (en) * | 2001-09-06 | 2006-09-26 | Bea Systems, Inc. | Exactly once JMS communication |
US7020684B2 (en) * | 2002-01-18 | 2006-03-28 | Bea Systems, Inc. | System and method for optimistic caching |
US6978278B2 (en) * | 2002-01-18 | 2005-12-20 | Bea Systems, Inc. | System and method for heterogeneous caching |
US6898587B2 (en) * | 2002-01-18 | 2005-05-24 | Bea Systems, Inc. | System and method for performing commutative operations in data access systems |
US7120704B2 (en) * | 2002-01-31 | 2006-10-10 | International Business Machines Corporation | Method and system for workload balancing in a network of computer systems |
US7930704B2 (en) * | 2002-02-06 | 2011-04-19 | Oracle International Corporation | J2EE component extension architecture |
US7403996B2 (en) * | 2002-02-21 | 2008-07-22 | Bea Systems, Inc. | Systems and methods for migratable services |
US20030163761A1 (en) * | 2002-02-21 | 2003-08-28 | Michael Chen | System and method for message driven bean service migration |
US7178050B2 (en) * | 2002-02-22 | 2007-02-13 | Bea Systems, Inc. | System for highly available transaction recovery for transaction processing systems |
WO2003073206A2 (en) * | 2002-02-22 | 2003-09-04 | Bea Systems, Inc. | System and method for using a data replication service to manage a configuration repository |
US7152181B2 (en) * | 2002-02-22 | 2006-12-19 | Bea Systems, Inc. | Method for highly available transaction recovery for transaction processing systems |
US7076480B2 (en) * | 2002-07-01 | 2006-07-11 | Softbase Systems, Inc. | Dynamic adjustment of commit frequency |
US20040010502A1 (en) * | 2002-07-12 | 2004-01-15 | Bomfim Joanes Depaula | In-memory database for high performance, parallel transaction processing |
US7506342B2 (en) * | 2002-07-23 | 2009-03-17 | Bea Systems, Inc. | System and method for implementing J2EE connector architecture |
US7698434B2 (en) * | 2002-08-29 | 2010-04-13 | Bea Systems, Inc. | J2EE connector architecture |
US20050015340A1 (en) * | 2003-06-27 | 2005-01-20 | Oracle International Corporation | Method and apparatus for supporting service enablers via service request handholding |
US6845384B2 (en) | 2003-08-01 | 2005-01-18 | Oracle International Corporation | One-phase commit in a shared-nothing database system |
US8234517B2 (en) * | 2003-08-01 | 2012-07-31 | Oracle International Corporation | Parallel recovery by non-failed nodes |
US7277897B2 (en) * | 2003-08-01 | 2007-10-02 | Oracle International Corporation | Dynamic reassignment of data ownership |
US7139772B2 (en) * | 2003-08-01 | 2006-11-21 | Oracle International Corporation | Ownership reassignment in a shared-nothing database system |
US7120651B2 (en) * | 2003-08-01 | 2006-10-10 | Oracle International Corporation | Maintaining a shared cache that has partitions allocated among multiple nodes and a data-to-partition mapping |
US20050066235A1 (en) * | 2003-09-24 | 2005-03-24 | International Business Machines Corporation | Automated fault finding in repository management program code |
US7484215B2 (en) * | 2003-10-30 | 2009-01-27 | International Business Machines Corporation | Method, system and program product for processing a transaction |
US7660824B2 (en) * | 2004-05-20 | 2010-02-09 | Bea Systems, Inc. | System and method for performing batch configuration changes |
US8458703B2 (en) * | 2008-06-26 | 2013-06-04 | Oracle International Corporation | Application requesting management function based on metadata for managing enabler or dependency |
US9038082B2 (en) | 2004-05-28 | 2015-05-19 | Oracle International Corporation | Resource abstraction via enabler and metadata |
US8321498B2 (en) * | 2005-03-01 | 2012-11-27 | Oracle International Corporation | Policy interface description framework |
US8966498B2 (en) * | 2008-01-24 | 2015-02-24 | Oracle International Corporation | Integrating operational and business support systems with a service delivery platform |
US9565297B2 (en) | 2004-05-28 | 2017-02-07 | Oracle International Corporation | True convergence with end to end identity management |
US9245236B2 (en) * | 2006-02-16 | 2016-01-26 | Oracle International Corporation | Factorization of concerns to build a SDP (service delivery platform) |
JP4500318B2 (ja) * | 2004-11-29 | 2010-07-14 | 富士通株式会社 | 分散トランザクション処理方法、装置、及びプログラム |
US20060116912A1 (en) * | 2004-12-01 | 2006-06-01 | Oracle International Corporation | Managing account-holder information using policies |
US7716260B2 (en) * | 2004-12-16 | 2010-05-11 | Oracle International Corporation | Techniques for transaction semantics for a database server performing file operations |
US7716377B2 (en) * | 2005-05-25 | 2010-05-11 | Harris Steven T | Clustering server providing virtual machine data sharing |
US7865684B2 (en) * | 2005-06-27 | 2011-01-04 | Ab Initio Technology Llc | Managing message queues |
US7809675B2 (en) * | 2005-06-29 | 2010-10-05 | Oracle International Corporation | Sharing state information among a plurality of file operation servers |
US7814065B2 (en) | 2005-08-16 | 2010-10-12 | Oracle International Corporation | Affinity-based recovery/failover in a cluster environment |
TWI416901B (zh) | 2005-11-30 | 2013-11-21 | Ibm | 故障容忍之異動處理系統 |
US8914493B2 (en) | 2008-03-10 | 2014-12-16 | Oracle International Corporation | Presence-based event driven architecture |
JP5277961B2 (ja) * | 2006-10-13 | 2013-08-28 | 日本電気株式会社 | 情報処理装置及びその故障隠蔽方法 |
US7653664B2 (en) * | 2006-11-03 | 2010-01-26 | Microsoft Corporation | Anchor for database synchronization excluding uncommitted transaction modifications |
US8214503B2 (en) * | 2007-03-23 | 2012-07-03 | Oracle International Corporation | Factoring out dialog control and call control |
US8539097B2 (en) * | 2007-11-14 | 2013-09-17 | Oracle International Corporation | Intelligent message processing |
US8161171B2 (en) | 2007-11-20 | 2012-04-17 | Oracle International Corporation | Session initiation protocol-based internet protocol television |
US9654515B2 (en) * | 2008-01-23 | 2017-05-16 | Oracle International Corporation | Service oriented architecture-based SCIM platform |
US8589338B2 (en) * | 2008-01-24 | 2013-11-19 | Oracle International Corporation | Service-oriented architecture (SOA) management of data repository |
US8401022B2 (en) * | 2008-02-08 | 2013-03-19 | Oracle International Corporation | Pragmatic approaches to IMS |
US8789168B2 (en) * | 2008-05-12 | 2014-07-22 | Microsoft Corporation | Media streams from containers processed by hosted code |
US10819530B2 (en) * | 2008-08-21 | 2020-10-27 | Oracle International Corporation | Charging enabler |
US20100174734A1 (en) * | 2009-01-02 | 2010-07-08 | Microsoft Corporation | Asynchronous database updates between collaborative applications and search utilities |
CH700243A1 (de) | 2009-01-12 | 2010-07-15 | Ferag Ag | Computergesteuertes fördersystem und förderverfahren. |
US8879547B2 (en) | 2009-06-02 | 2014-11-04 | Oracle International Corporation | Telephony application services |
US8510334B2 (en) * | 2009-11-05 | 2013-08-13 | Oracle International Corporation | Lock manager on disk |
US8583830B2 (en) * | 2009-11-19 | 2013-11-12 | Oracle International Corporation | Inter-working with a walled garden floor-controlled system |
US20110125913A1 (en) * | 2009-11-20 | 2011-05-26 | Oracle International Corporation | Interface for Communication Session Continuation |
US8533773B2 (en) * | 2009-11-20 | 2013-09-10 | Oracle International Corporation | Methods and systems for implementing service level consolidated user information management |
US20110125909A1 (en) * | 2009-11-20 | 2011-05-26 | Oracle International Corporation | In-Session Continuation of a Streaming Media Session |
US9269060B2 (en) * | 2009-11-20 | 2016-02-23 | Oracle International Corporation | Methods and systems for generating metadata describing dependencies for composable elements |
US9509790B2 (en) * | 2009-12-16 | 2016-11-29 | Oracle International Corporation | Global presence |
US9503407B2 (en) * | 2009-12-16 | 2016-11-22 | Oracle International Corporation | Message forwarding |
CN102279855A (zh) * | 2010-06-10 | 2011-12-14 | 三星电子(中国)研发中心 | 一种数据库处理事务的装置及方法 |
US8782434B1 (en) | 2010-07-15 | 2014-07-15 | The Research Foundation For The State University Of New York | System and method for validating program execution at run-time |
US9710865B1 (en) | 2011-08-15 | 2017-07-18 | Amazon Technologies, Inc. | Coordinating distributed order execution |
CN102708175B (zh) * | 2012-05-07 | 2014-04-30 | 北京航空航天大学 | 一种针对数据库连接意外中断的自动重连方法及其装置 |
US9122873B2 (en) | 2012-09-14 | 2015-09-01 | The Research Foundation For The State University Of New York | Continuous run-time validation of program execution: a practical approach |
US9069782B2 (en) | 2012-10-01 | 2015-06-30 | The Research Foundation For The State University Of New York | System and method for security and privacy aware virtual machine checkpointing |
US10459892B2 (en) | 2014-04-23 | 2019-10-29 | Qumulo, Inc. | Filesystem hierarchical aggregate metrics |
US9836480B2 (en) | 2015-01-12 | 2017-12-05 | Qumulo, Inc. | Filesystem capacity and performance metrics and visualizations |
US11132336B2 (en) | 2015-01-12 | 2021-09-28 | Qumulo, Inc. | Filesystem hierarchical capacity quantity and aggregate metrics |
US10095729B2 (en) | 2016-12-09 | 2018-10-09 | Qumulo, Inc. | Managing storage quotas in a shared storage system |
US10831509B2 (en) | 2017-02-23 | 2020-11-10 | Ab Initio Technology Llc | Dynamic execution of parameterized applications for the processing of keyed network data streams |
US11947978B2 (en) | 2017-02-23 | 2024-04-02 | Ab Initio Technology Llc | Dynamic execution of parameterized applications for the processing of keyed network data streams |
US10318401B2 (en) | 2017-04-20 | 2019-06-11 | Qumulo, Inc. | Triggering the increased collection and distribution of monitoring information in a distributed processing system |
US11360936B2 (en) | 2018-06-08 | 2022-06-14 | Qumulo, Inc. | Managing per object snapshot coverage in filesystems |
US10534758B1 (en) | 2018-12-20 | 2020-01-14 | Qumulo, Inc. | File system cache tiers |
US10614033B1 (en) | 2019-01-30 | 2020-04-07 | Qumulo, Inc. | Client aware pre-fetch policy scoring system |
US11151092B2 (en) | 2019-01-30 | 2021-10-19 | Qumulo, Inc. | Data replication in distributed file systems |
US10725977B1 (en) | 2019-10-21 | 2020-07-28 | Qumulo, Inc. | Managing file system state during replication jobs |
US10795796B1 (en) | 2020-01-24 | 2020-10-06 | Qumulo, Inc. | Predictive performance analysis for file systems |
US10860372B1 (en) | 2020-01-24 | 2020-12-08 | Qumulo, Inc. | Managing throughput fairness and quality of service in file systems |
US11151001B2 (en) | 2020-01-28 | 2021-10-19 | Qumulo, Inc. | Recovery checkpoints for distributed file systems |
US10860414B1 (en) | 2020-01-31 | 2020-12-08 | Qumulo, Inc. | Change notification in distributed file systems |
US10936538B1 (en) | 2020-03-30 | 2021-03-02 | Qumulo, Inc. | Fair sampling of alternate data stream metrics for file systems |
US10936551B1 (en) | 2020-03-30 | 2021-03-02 | Qumulo, Inc. | Aggregating alternate data stream metrics for file systems |
US11775481B2 (en) | 2020-09-30 | 2023-10-03 | Qumulo, Inc. | User interfaces for managing distributed file systems |
US11157458B1 (en) | 2021-01-28 | 2021-10-26 | Qumulo, Inc. | Replicating files in distributed file systems using object-based data storage |
US11461241B2 (en) | 2021-03-03 | 2022-10-04 | Qumulo, Inc. | Storage tier management for file systems |
US11132126B1 (en) | 2021-03-16 | 2021-09-28 | Qumulo, Inc. | Backup services for distributed file systems in cloud computing environments |
US11567660B2 (en) | 2021-03-16 | 2023-01-31 | Qumulo, Inc. | Managing cloud storage for distributed file systems |
US11669255B2 (en) | 2021-06-30 | 2023-06-06 | Qumulo, Inc. | Distributed resource caching by reallocation of storage caching using tokens and agents with non-depleted cache allocations |
US11294604B1 (en) | 2021-10-22 | 2022-04-05 | Qumulo, Inc. | Serverless disk drives based on cloud storage |
US11354273B1 (en) | 2021-11-18 | 2022-06-07 | Qumulo, Inc. | Managing usable storage space in distributed file systems |
US11599508B1 (en) | 2022-01-31 | 2023-03-07 | Qumulo, Inc. | Integrating distributed file systems with object stores |
US11722150B1 (en) | 2022-09-28 | 2023-08-08 | Qumulo, Inc. | Error resistant write-ahead log |
US11729269B1 (en) | 2022-10-26 | 2023-08-15 | Qumulo, Inc. | Bandwidth management in distributed file systems |
US11966592B1 (en) | 2022-11-29 | 2024-04-23 | Qumulo, Inc. | In-place erasure code transcoding for distributed file systems |
US11934660B1 (en) | 2023-11-07 | 2024-03-19 | Qumulo, Inc. | Tiered data storage with ephemeral and persistent tiers |
US11921677B1 (en) | 2023-11-07 | 2024-03-05 | Qumulo, Inc. | Sharing namespaces across file system clusters |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4224664A (en) * | 1976-05-07 | 1980-09-23 | Honeywell Information Systems Inc. | Apparatus for detecting when the activity of one process in relation to a common piece of information interferes with any other process in a multiprogramming/multiprocessing computer system |
US4205374A (en) * | 1978-10-19 | 1980-05-27 | International Business Machines Corporation | Method and means for CPU recovery of non-logged data from a storage subsystem subject to selective resets |
FR2469751A1 (fr) * | 1979-11-07 | 1981-05-22 | Philips Data Syst | Processeur d'intercommunication du systeme utilise dans un systeme de traitement de donnees reparti |
US4445176A (en) * | 1979-12-28 | 1984-04-24 | International Business Machines Corporation | Block transfers of information in data processing networks |
FR2476349A1 (fr) * | 1980-02-15 | 1981-08-21 | Philips Ind Commerciale | Systeme de traitement de donnees reparti |
US4399504A (en) * | 1980-10-06 | 1983-08-16 | International Business Machines Corporation | Method and means for the sharing of data resources in a multiprocessing, multiprogramming environment |
US4480304A (en) * | 1980-10-06 | 1984-10-30 | International Business Machines Corporation | Method and means for the retention of locks across system, subsystem, and communication failures in a multiprocessing, multiprogramming, shared data environment |
EP0063186B1 (en) * | 1981-03-16 | 1986-01-22 | International Business Machines Corporation | Improvements to digital data processing apparatus |
US4412285A (en) * | 1981-04-01 | 1983-10-25 | Teradata Corporation | Multiprocessor intercommunication system and method |
US4489379A (en) * | 1982-01-25 | 1984-12-18 | International Business Machines Corporation | Distributed data processing in ring-structured networks architected for full duplex peer-to-peer operation of processing stations and uninterruptible transfer of long data records between stations |
US4498145A (en) * | 1982-06-30 | 1985-02-05 | International Business Machines Corporation | Method for assuring atomicity of multi-row update operations in a database system |
US4648031A (en) * | 1982-06-21 | 1987-03-03 | International Business Machines Corporation | Method and apparatus for restarting a computing system |
US4507751A (en) * | 1982-06-21 | 1985-03-26 | International Business Machines Corporation | Method and apparatus for logging journal data using a log write ahead data set |
US4500960A (en) * | 1982-06-28 | 1985-02-19 | At&T Bell Laboratories | Geographically distributed multiprocessor time-shared communication processing system |
US4614841A (en) * | 1982-06-29 | 1986-09-30 | At&T Bell Laboratories | Geographically distributed multiprocessor time-shared communication processing system |
US4503535A (en) * | 1982-06-30 | 1985-03-05 | Intel Corporation | Apparatus for recovery from failures in a multiprocessing system |
US4697266A (en) * | 1983-03-14 | 1987-09-29 | Unisys Corp. | Asynchronous checkpointing system for error recovery |
US4529842A (en) * | 1983-05-02 | 1985-07-16 | At&T Bell Laboratories | Automatic fault recovery arrangement |
US4688035A (en) * | 1983-11-28 | 1987-08-18 | International Business Machines Corp. | End user data stream syntax |
US4718005A (en) * | 1984-05-03 | 1988-01-05 | International Business Machines Corporation | Distributed control of alias name usage in networks |
US4644468A (en) * | 1984-07-20 | 1987-02-17 | International Business Machines Corp. | Name usage support through distributed processing networks linked by bridges and/or gateways |
US4752910A (en) * | 1984-10-30 | 1988-06-21 | Prime Computer, Inc. | Method and apparatus for continuous after-imaging |
US4665520A (en) * | 1985-02-01 | 1987-05-12 | International Business Machines Corporation | Optimistic recovery in a distributed processing system |
US4754395A (en) * | 1985-05-06 | 1988-06-28 | Computer X, Inc. | Network interface module with minimized data paths |
US4694396A (en) * | 1985-05-06 | 1987-09-15 | Computer X, Inc. | Method of inter-process communication in a distributed data processing system |
US4703481A (en) * | 1985-08-16 | 1987-10-27 | Hewlett-Packard Company | Method and apparatus for fault recovery within a computing system |
US4714995A (en) * | 1985-09-13 | 1987-12-22 | Trw Inc. | Computer integration system |
US4710926A (en) * | 1985-12-27 | 1987-12-01 | American Telephone And Telegraph Company, At&T Bell Laboratories | Fault recovery in a distributed processing system |
US4751702A (en) * | 1986-02-10 | 1988-06-14 | International Business Machines Corporation | Improving availability of a restartable staged storage data base system that uses logging facilities |
US4736369A (en) * | 1986-06-13 | 1988-04-05 | International Business Machines Corp. | Adaptive session-level pacing |
US4819156A (en) * | 1986-06-13 | 1989-04-04 | International Business Machines Corporation | Database index journaling for enhanced recovery |
US4878167A (en) * | 1986-06-30 | 1989-10-31 | International Business Machines Corporation | Method for managing reuse of hard log space by mapping log data during state changes and discarding the log data |
US4780821A (en) * | 1986-07-29 | 1988-10-25 | International Business Machines Corp. | Method for multiple programs management within a network having a server computer and a plurality of remote computers |
US4819159A (en) * | 1986-08-29 | 1989-04-04 | Tolerant Systems, Inc. | Distributed multiprocess transaction processing system and method |
US4768150A (en) * | 1986-09-17 | 1988-08-30 | International Business Machines Corporation | Application program interface to networking functions |
US4816990A (en) * | 1986-11-05 | 1989-03-28 | Stratus Computer, Inc. | Method and apparatus for fault-tolerant computer system having expandable processor section |
US5165031A (en) * | 1990-05-16 | 1992-11-17 | International Business Machines Corporation | Coordinated handling of error codes and information describing errors in a commit procedure |
US5276876A (en) * | 1990-05-16 | 1994-01-04 | International Business Machines Corporation | Registration of resources for commit procedures |
US5319773A (en) * | 1990-05-16 | 1994-06-07 | International Business Machines Corporation | Asynchronous resynchronization of a commit procedure |
-
1990
- 1990-05-16 US US07/525,429 patent/US5319773A/en not_active Expired - Lifetime
-
1991
- 1991-03-29 JP JP3088997A patent/JPH0831043B2/ja not_active Expired - Fee Related
- 1991-04-12 CA CA002040322A patent/CA2040322C/en not_active Expired - Fee Related
- 1991-05-02 DE DE69132065T patent/DE69132065D1/de not_active Expired - Lifetime
- 1991-05-02 EP EP91107112A patent/EP0457112B1/en not_active Expired - Lifetime
- 1991-05-16 BR BR919102018A patent/BR9102018A/pt unknown
-
1992
- 1992-10-19 US US07/963,889 patent/US5613060A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0457112B1 (en) | 2000-03-22 |
EP0457112A2 (en) | 1991-11-21 |
BR9102018A (pt) | 1991-12-24 |
CA2040322A1 (en) | 1991-11-17 |
JPH04229333A (ja) | 1992-08-18 |
DE69132065D1 (de) | 2000-04-27 |
US5613060A (en) | 1997-03-18 |
US5319773A (en) | 1994-06-07 |
CA2040322C (en) | 1995-10-10 |
EP0457112A3 (en) | 1993-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2691081B2 (ja) | コンピュータ・ネットワーク | |
JP2691080B2 (ja) | 同期点回復手段を有するコンピュータ装置 | |
JP3293839B2 (ja) | 作業ユニットに合わせてコミット範囲を調整するコンピュータ・システム | |
JP3268534B2 (ja) | 保護された資源の同期点管理を行うコンピュータ・システム | |
JPH0831043B2 (ja) | コミット手順の非同期的再同期化実行装置および方法 | |
JPH087690B2 (ja) | コミット手順におけるエラー・コードおよびエラー記述情報の処理装置および方法 | |
JPH087691B2 (ja) | コンピュータ・システム及びアプリケーションプログラム実行方法 | |
JPH04229335A (ja) | コミット手順の最適化方法 | |
US6868442B1 (en) | Methods and apparatus for processing administrative requests of a distributed network application executing in a clustered computing environment | |
US6081826A (en) | System using environment manager with resource table in each computer for managing distributed computing resources managed for each application | |
US5377350A (en) | System for cooperative communication between local object managers to provide verification for the performance of remote calls by object messages | |
US7392421B1 (en) | Framework for managing clustering and replication | |
US6959337B2 (en) | Networked system for assuring synchronous access to critical facilities | |
JPH10187519A (ja) | 分配システムの競合を防止する方法 | |
JPH06202996A (ja) | 加入者分散2相コミット・プロトコルの拡張機能 | |
US6226694B1 (en) | Achieving consistency and synchronization among multiple data stores that cooperate within a single system in the absence of transaction monitoring | |
JP2002117010A (ja) | クラスタ化コンピュータ・システム内のグループのメンバによって受信されたマージ要求を処理する装置及びその方法 | |
JP3525933B2 (ja) | 経路指定ノードにおける同期化プロシージャ | |
US20060123069A1 (en) | Method and system for deferred synchronisation of data | |
JP2000047986A (ja) | トランザクション処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090110 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 6 Free format text: PAYMENT UNTIL: 20090110 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100110 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110110 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 9 Free format text: PAYMENT UNTIL: 20120110 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 10 Free format text: PAYMENT UNTIL: 20130110 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140110 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |