JPH07295871A

JPH07295871A - データベース・アクセス効率の向上方法及びシステム

Info

Publication number: JPH07295871A
Application number: JP7023143A
Authority: JP
Inventors: Shii Azagiyuri Aran; アラン・シー・アザギュリ; Doreb Danny; ダニー・ドレブ; Goft German; ジャーマン・ゴフト; M Marburg John; ジョン・エム・マーバーグ; G Lanweiler James; ジェイムス・ジー・ランワイラー; Satran Jullian; ジュリアン・サトラン
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1994-04-15
Filing date: 1995-02-10
Publication date: 1995-11-10
Anticipated expiration: 2019-12-15
Also published as: US5796999A; JP3600293B2

Abstract

(57)【要約】【目的】分散データ処理システム内でのデータベー
ス・アクセス効率を向上させる方法とシステムを提供す
る。【構成】分散データ処理システム内の１つまたは複
数のロケーションで実施される回復可能なデータベース
・システムにおいて、プライマリ・データベースとレプ
リカ・データベースとの間に維持される複数の多様な整
合性レベルが指定される。ユーザは各レプリカに適した
整合性レベルを選択できる。プライマリ・データベース
内のレコードに対するアップデートがあると、各レプリ
カ内の対応するレコードに対するアップデートは、各レ
プリカに対して選択された整合性レベルに一致する方法
で行われる。これにより、プライマリ・データベースと
完全に整合性のあるレプリカが提供できる。あるいは、
完全に整合性のあるデータを必要としないアプリケーシ
ョンには、第２のレプリカを提供し、アクセス効率を向
上させることができる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、改善されたデータベー
ス・アクセス制御の方法に関し、具体的には、プライマ
リ・データベースと１つまたは複数のレプリカ・データ
ベースとの間の整合性を保つ改善された方法とシステム
に関する。より具体的には、本発明は、回復力のある
（resilient）データベース・システムにおいて、ユー
ザが、複数のレプリカ・データベースに付ける多様な整
合性レベルを選択出来る、改善された方法とシステムに
関する。

【０００２】

【従来の技術】多目的のマルチプロセッシング・コンピ
ューティング・システムは、典型的には、通信網によっ
て相互接続された複数のノードを含む。そのようなシス
テムでは、各ノードは、データ処理装置、データ記憶装
置、および、複数の通信ポートを含むことができる。デ
ータ処理装置は、複数のオペレーテイングシステムの要
素の制御の下でのマルチプログラミング・モードで実行
している場合があり、この場合、データ処理装置は、複
数のノードとみなされる。典型的には、データ記憶装置
は、データファイル、オペレーティング・システムとそ
の情報管理要素、および、ユーザのアプリケーション・
プログラムをストアしている。

【０００３】データは、企業にとっての重要な側面から
ビジネスを抽出した情報である。そのようなシステムで
のチャレンジは、ビジネスニーズに合った使用可能性、
パフォーマンスおよび費用でエンドユーザがデータにア
クセスできる方法で、システムのデータ記憶と通信資源
を使用することである。データへのアクセスは、データ
の整合性と完全性を確実にするために制御されなければ
ならない。分散データ処理システム環境でのデータアク
セスの付加的な特徴は、地理的および時間的親和性であ
る。

【０００４】分散されたデータの構造の基礎は地理的親
和性である。或るデータ項目へのアクセスは、地理的に
まとまる傾向がある。データのダイナミックな複製方法
の基礎は時間的親和性である。最近アクセスされたデー
タ項目は、最近アクセスされなかったデータ項目より
も、近い将来においてアクセスされる可能性が高い。或
るデータ項目に対するアクセスがまとまる傾向があるノ
ードは、親和性ノードと呼ばれる。或るデータ項目に対
する親和性ノードは前もってわからず、また、そのノー
ドは時間によって変化する。

【０００５】分散データ技術は、データのある場所（デ
ータロケーション）、データ共有（データシェアリン
グ）の度合い、通信網全体にわたって提供されるデータ
ベース制御の度合い、および、データアクセスの型の属
性にしたがって分類することができる。データロケーシ
ョンは、集中管理、分割化、または、複製化に分けられ
る。データシェアリングの度合いは、集中化、非集中
化、または、分散化に分けられる。データベース管理の
制御は、ユーザ提供のもの（分散データ）、または、シ
ステム提供のもの（分散データベース）に分けられる。
データアクセスは、トランザクション処理型、機能処理
型、または、データ処理型に分けられる。

【０００６】歴史的には、集中管理型がデータベース記
憶とアクセスを管理するために使用されてきた。そのよ
うな処理手法においては、データ管理とアプリケーショ
ン処理が集中管理される。単一のデータベース・マネー
ジャーが使用され、ユーザを中央システムに接続するた
めにテレプロセッシング通信網が使用される。集中処理
手法の変形として、処理の或るものが、通信網の中のノ
ードに分散される。しかし、データは集中管理される。

【０００７】データベースの集中管理手法の利点は、以
下の通りである。（１）データベースの整合性が単一の
データベース・マネージャーによって確実にできるこ
と、（２）すべてのアプリケーション・プログラムが単
一のアプリケーション・プログラミング・インターフェ
ースにしたがって作成することができ、すべてのデータ
が１つのロケーションにストアされているので、アプリ
ケーション・プログラムはデータロケーションを承知し
ていなくてもよいこと、（３）集中データ処理環境での
データ管理の問題を解決できる多くの有効なツールがあ
ること、（４）単一システムは、操作し、維持し、制御
するのがより容易であること。

【０００８】しかし、データベースの集中処理手法に
は、いくつかの不利な点がある。すなわち、（１）ある
企業にとっては通信コストが高くつき、アプリケーショ
ン・プログラムの性能が通信遅延のためにさがること、
（２）データ使用可能性が通信網あるいは中央システム
の不安定性によって悪くなることがあり、これらの問題
はバックアップ・システムや通信網に冗長度を持たせる
ことによって解決されねばならないこと、（３）ある企
業にとっては、単一の中央処理システムの処理能力がす
でに限界に達していること。

【０００９】分散データ処理システムのノードにデータ
を分散するには、一般的に２つの手法がある。これらの
手法とは、分割化と静的複製化である。分割データ手法
にはデータベースのプライマリ・コピーがないが、複製
化手法にはデータベースのプライマリ・コピーがある。

【００１０】分割データベース手法は、データベースを
明確な区画に分割し、これらが、ノードに分散される。
したがって、あるデータ項目は、１つのノードにだけ存
在する。各ロケーションは、そのロケーションでデータ
を管理するデータベース・マネージャーを持つ。データ
分散マネジャーはアプリケーション・プログラムのデー
タ・リクエストを受け、データがそのロケーションすな
わちローカルに存在する場合はそのリクエストをローカ
ルリクエストにマップし、データが別のロケーションに
ある場合は、そのリクエストをリモートリクエストにマ
ップする。

【００１１】分割された分散データベースでは、リクエ
ストされたデータがローカルに存在する場合には、良い
データ使用可能性とアクセス性能が得られる。さらに、
各データ項目が単一のデータベース・マネージャーによ
って管理されるので、データベースの整合性が容易に得
られる。よい分割アルゴリズムが前もってわかり、それ
が存在し、且つ、安定したものであるならば、これらの
結果を得ることができる。

【００１２】上述した分割されたデータベースでは、複
数のロケーションでデータを変更するプログラムのため
に、システムが、通信網全体にわたる回復処理を提供し
なければならない。

【００１３】分割されたデータベース・システムには、
また、以下の不利な点がある。（１）分割アルゴリズム
がデータアクセス・パターンに一致しない場合には、デ
ータの使用可能性と性能が落ちること、（２）アプリケ
ーション・プログラムが、データロケーション、あるい
は、少くともデータ分割アルゴリズムを承知していなけ
ればならず、また、データロケーションによってデータ
ベースを異なった方法でアクセスしなければならないこ
と、（３）データベース分割アルゴリズムを変更するこ
とは、データロケーションが各ノードのアプリケーショ
ン・プログラムの中、エクシット、または、デクラレー
ションに反映されているので、非常に難しいこと、
（４）各ノードにおける既存データの再配置とアルゴリ
ズムの変更は通信網全体にわたって同期して行われねば
ならず、したがって、最適な性能とデータの使用可能性
を維持するのに必要な分割アルゴリズムを調整すること
ができない場合があること、（５）分割されたデータベ
ース全体にわたって或るデータ項目を均一にアクセスす
るか、または、全データベースをアクセスしなければな
らないプログラムは性能とデータ使用可能性の低下を蒙
ること。

【００１４】データを分散するための静的複製手法は、
中央ノードを含むか、または、含まない手法を含む。前
者の場合、中央ロケーションはデータベースのプライマ
リ・コピーをストアし、各ロケーションはデータベース
・マネジャーとデータベースのコピーを持つ。静的複製
手法の典型的な使用方法では、プライマリ・データベー
スがコピーされて各レプリカ・ロケーションすなわちノ
ードに送られ、各ノードでのローカル処理のためにデー
タが使用できるようになる。各レプリカ・ロケーション
で行われたデータ変更は、プライマリ・データベースに
対して後で処理を行うために集められる。アプリケーシ
ョン・プログラムが処理を行う間をぬって、ローカルで
行われたデータ変更が中央ロケーションに送られ、プラ
イマリ・データベースに対してアップデートが行われ
る。レプリカ・データベースを管理するこの手法は複数
回のアップデートを防ぐ手法を何も持たないので、プラ
イマリ・データベースに対する各アップデートを手作業
で発見して解決するか、あるいは、そのような複数回の
アップデートが起こらないようにアプリケーション・プ
ログラムを何らかの方法で制限しなければならない。プ
ライマリ・データベースがレプリカ・コピーのアップデ
ートに一致するようにした後、新しいコピーがレプリカ
・ロケーションに送られ、全プロセスが再び開始され
る。

【００１５】プライマリ・コピーを中央ロケーションに
持つ静的複製の主要な利点は、すべてのデータがローカ
ルにアクセス可能であるので、高いデータ使用可能性と
良い応答時間が得られる。しかし、この方法には以下の
不利な点がある。（１）システムが複数回のアップデー
トを防ぐことができないのでデータベースの整合性を保
つことが難しく、静的レプリカのために実行可能なデー
タベース処理が厳しく制限されること、（２）システム
が、アプリケーション・プログラムのアクセスが必要と
する最新データを保証できないこと、（３）オペレーシ
ョン上の特別なプロシージャが、レプリカ・データの変
更を集めプライマリ・データベースをアップデートする
ために必要になり、このプロシージャを実行することは
高くつき、また、エラーを起こし易いこと、（４）デー
タのアップデートの間にはデータ伝送のために不必要に
大きいバンド幅を必要とし、確認のための十分大きなウ
ィンドウを提供することは多くのアプリケーションでは
実行不可能であり、レプリカがオペレーションの合間の
狭いウィンドウの中だけで送られるので、確認プロシー
ジャの間は、データベースが使用できなくなる可能性が
大きいこと。さらに、１つあるいは複数のノードが動作
不可能になった場合、予定されたウィンドウの中で確認
プロシージャが行えなくなる。

【００１６】上述した静的複製の基本的な手法に関し
て、多くのさまざまな手法が文献に記載されている。た
とえば、複数回のアップデートが起こらないようにアプ
リケーション・プログラムを設計することができるし、
あるいは、レプリカは読み取りアクセスだけに制限する
こともできる。あるいは、アプリケーション・プログラ
ム自身が、後でプライマリ・ロケーションに送るために
アップデートを集め、プライマリ・ロケーションにおい
て、データベース・マネージャのログからこの情報を探
り出すようにすることもできる。レプリカ・ロケーショ
ンでは、全面的なレプリカまたは部分的なレプリカだけ
を形成することもできる。レプリカ・データベース全体
あるいは、保持されているデータへの変更のみを送るよ
うにすることができる。トランザクションによって行わ
れた変更を種々のノードに送り、トランザクション終了
処理の１部としてアクノレッジメントを受領することに
よって、レプリカの同期性を常に保つようにすることが
できる。そのような同期手法によって静的複製の整合性
の問題を解決するができる。しかし、これらの手法で
は、そのようなシステムの性能と使用可能性の利益の多
くを失う。

【００１７】米国特許4,007,450号には、各ノードが他
のノードと或る種のデータセットを共有し、中央ロケー
ションには絶えず同期されるレプリカだけがあるがプラ
イマリ・コピーがない、分散データ制御システムが記載
されている。各ノードは、他のノードのいずれかがアッ
プデートしようとしていないかぎり、共有されたどのデ
ータセットをもアップデートするように作動し、複数の
ノードがアップデートしようとしているときには、高い
プライオリティーを持つノードがアップデートを行う。
各ノードはそのメモリに、共有された各データセットの
ノードロケーションと、共有された各データセットに対
して各ノードが持つアップデート・プライオリティーを
ストアしている。或るノードでデータセットがアップデ
ートされるとき、レプリカを持っているすべてのノード
にそのアップデートが送られる。上記のような手法は、
静的複製の整合性問題を解決することはできるが、性能
と使用可能性の利益の多くが失われる。

【００１８】米国特許4,432,057号には、分散マルチプ
ロセシング・データベース・システムにおける資源の活
用を制御するための分散システム制御の下での、データ
のダイナミックな複製方法が記載されている。このシス
テムでは、指定された現在性（currency）を持つデータ
へのアクセスリクエストが許され、アップデートされた
データの確認が、各ノードにおいて実行される制御プロ
シージャを使用することによって選択的に行われる。こ
の場合、各ノードは、他ノードにおける共有データ項目
のステータスに関するそのノードの見方をあらわし各ノ
ードにファイルされているステータス・アンド・コント
ロール（status and control message:SAC）メッセージ
を使用する。このシステムでは、各データベース・リク
エストはインターセプトされ、ローカル・コピーが現在
性に対する要求を満たすかどうかが判断される。現在性
が満たされない場合、そのリクエストを実行する前に、
関連するノードと交渉を行うことが必要である。したが
って、レプリカ・データベースの現在性は、アクセス・
パターンに従ってダイナミックに変わる。

【００１９】上記のことから、データ処理システムの１
つまたは複数のロケーションにおいて複製されるジャー
ナルされたデータベースを含む回復力のあるデータベー
ス・システムで使用し、それにより、各レプリカ・デー
タベース内で維持される整合性レベルを、任意に且つ選
択的に割り当てることができる方法とシステムの必要性
があることがわかる。

【００２０】

【発明が解決しようとする課題】本発明の目的は、分散
データ処理システム内のデータベース・アクセス制御の
ための改善された方法を提供することである。

【００２１】さらに、本発明の目的は、分散データ処理
システム内のプライマリ・データベースと１つまたは複
数のレプリカ・データベースとの間の整合性を維持する
ための改善された方法とシステムを提供することであ
る。

【００２２】さらに、本発明の目的は、分散データ処理
システム内の回復可能なデータベース内部の複数のレプ
リカ・データベースに付す多様な整合性レベルをユーザ
が選ぶことができる、改善された方法とシステムを提供
することである。

【００２３】

【課題を解決するための手段】上述の課題を達成する方
法を以下に述べる。分散データ処理システム内の１つま
たは複数のロケーションで実施されるジャーナルされた
データベースを含む回復可能なデータベース・システム
において、プライマリ・データベースとレプリカ・デー
タベースとの間で維持される整合性レベルをそれぞれ記
述する複数の多様な整合性レベルが指定される。ユーザ
は、各レプリカ・データベースのための具体的な整合性
レベルを選択することができる。その後、プライマリ・
データベースの中のレコードをアップデートすると、そ
のアップデートを使って、各レプリカ・データベース内
の対応するレコードに対して、そのレプリカ・データベ
ースに選択された整合性レベルと整合のとれる方法でア
ップデートが始まる。このようにして、プライマリ・デ
ータベースが故障した場合にもスムーズに切り替えが行
えるように、プライマリ・データベースと完全に整合性
のあるレプリカ・データベースを提供することもできる
し、また、完全に整合性のあるデータを必要としないア
プリケーションの照会に応答するためには第２のレプリ
カ・データベースを提供し、これにより、そのデータベ
ースに対するアクセスの効率を大きく向上させることも
できる。

【００２４】

【実施例】図１に、本発明の方法とシステムを実施する
のに使用できる、分散データ処理システム８の概略図を
示す。分散データ処理システム８は、ローカルエリア・
ネットワーク（以下ＬＡＮという）１０および３２のよ
うな複数のＬＡＮを持ち、各ＬＡＮはコンピュータ１２
および３０のような複数の個々のコンピュータを持つこ
とが望ましい。もちろん、当業者には明らかなように、
各ネットワークには、ホストプロセサに接続された複数
のインテリジェント・ワークステーションを使用するこ
ともできる。

【００２５】このようなデータ処理システムによく見ら
れるように、各コンピューターは記憶装置１４および印
刷出力装置１６を接続することができる。記憶装置１４
は、本発明の方法とシステムにしたがい、分散データ処
理システム８のユーザによって定期的にアクセスされ処
理されるプライマリ・データベースまたはそのレプリカ
をストアするために使用される。公知の方法によって、
そのようなプライマリ・データベースまたはそのレプリ
カは記憶装置１４にストアされ、データベースを維持し
アップデートする責任を持つリソース・マネジャーまた
はライブラリ・サービスと関連づけられる。

【００２６】図１はさらに、分散データ処理システム８
が、メインフレーム・コンピュータ１８のような複数の
メインフレーム・コンピュータを含み、それらが通信リ
ンク２２によってＬＡＮ１０に接続されていることを示
す。また、メインフレーム・コンピュータ１８は、ＬＡ
Ｎ１０の遠隔記憶装置としてはたらく記憶装置２０に接
続されている。第２のＬＡＮ３２が、ゲートウェイ・サ
ーバ２８への通信制御装置２６および通信リンク３４を
介して、ＬＡＮ１０に接続されている。ゲートウェイ・
サーバ２８は、ＬＡＮ３２をＬＡＮ１０につなげる役割
をする別個のコンピュータあるいはインテリジェント・
ワークステーションであることが望ましい。

【００２７】ＬＡＮ３２およびＬＡＮ１０に関連して述
べたように、プライマリ・データベースまたはそのレプ
リカは記憶装置２０内にストアされ、そのようにストア
されたプライマリ・データベースおよびそのレプリカに
対するリソース・マネジャーまたはライブラリ・サービ
スの役割をするメインフレーム・コンピュータ１８によ
って制御される。

【００２８】もちろん、当業者には明らかなように、メ
インフレーム・コンピュータ１８はＬＡＮ１０から地理
的に遠い距離に設置することができ、同様に、ＬＡＮ１
０は、ＬＡＮ３２から相当な距離離れていてもよい。た
とえば、ＬＡＮ３２がカリフォルニア州にあり、ＬＡＮ
１０がテキサス州にあり、メインフレーム・コンピュー
タがニューヨークにあってもよい。

【００２９】上述したことからわかるように、分散デー
タ処理ネットワーク８の或る１つの部分にいるユーザ
が、データ処理ネットワーク８の別の部分にストアされ
ているデータベースにアクセスしたいことがしばしばあ
る。そのようなクライアント／サーバ・システム環境で
は、データベース内にストアされたデータへのアクセス
は、いわゆる「回復可能な（resilient）データベース
・システム」を提供することによって増やすことができ
る。回復可能なデータベース・システムとは、分散デー
タ処理システム内の１つまたは複数のロケーションにお
いて複製化されている、ジャーナルされたデータベース
である。そのようなデータベースでは、１つのデータベ
ースがプライマリ・データベースとして、他の全てのデ
ータベースはバックアップ・レプリカとして指定され
る。回復可能なデータベース・システムは、故障が起こ
ったとき１つ前のポイントに回復する。すなわち、ここ
でいう故障とは、データベース・レプリカの１つが在る
コンピュータの故障、あるいは、レプリカの１つを破壊
するような媒体故障によって引き起こされる故障のこと
である。クラスター管理を行うことによって、アプリケ
ーション・プログラマおよびエンドユーザに透明で、プ
ライマリ・レプリカが故障したときにバックアップ・レ
プリカにスムーズに切り替えられる回復処理を提供する
ことができる。

【００３０】高い使用可能性を持つデータベースを提供
するためにデータベースが複製化されているシステムに
おいては、そのようなシステムの自然な延長は、プライ
マリ・サーバのワークロードを軽減するために、ユーザ
がバックアップ・レプリカに照会できるようにすること
である。しかし、或る整合性が強制されていない限り、
レプリカ・データベースに対する照会トランザクション
は、コミットしていないトランザクションによってセッ
トされた値、あるいは、古い値を読んでしまう。あまり
重要でないアプリケーションではこれでも良いかも知れ
ないが、通常多くのアプリケーションは、プライマリ・
データベースとの最低レベルの整合性を必要とする。

【００３１】このアプリケーションについて説明する目
的で、ここでは、「アプリケーション」という用語は、
ユーザによって始動されデータベース・オペレーション
を呼び出すアプリケーション・コードのことをいう。デ
ータベース・オペレーションを呼び出すために使用され
る多くの多様なアプリケーションが現在使用可能であ
り、そのようなアプリケーションは本発明の方法とシス
テムにとって修正する必要はない。典型的には、そのよ
うなアプリケーションがデータベース・オペレーション
を呼び出すときはいつでも使える「アプリケーション・
スタブ」も提供される。アプリケーション・スタブは呼
び出しをトラップし、その呼び出しを特別ルーチンにま
わす。このアプリケーション・スタブは一般的にクラス
ター管理によって提供され、その後、リクエストを、プ
ライマリ・データベースを制御する機械にわたす。故障
を回復するために必要などの回復ステップも、アプリケ
ーション・スタブによってアプリケーションから隠され
ている。

【００３２】本発明の明細書で記述される「プライマリ
・エージェント」はプライマリ・データベースを制御す
る機械の上にあり、データベース・オペレーションを実
行するプロセスである。アプリケーション・プロセス１
つにつき、１つのプライマリ・エージェントがある。本
発明の方法とシステムで使用される「バックアップ・レ
シーバ」は、レプリカ・データベースへのアクセスを管
理する機械の上にあり、プライマリ・データベースにほ
どこされた変更を記述するジャーナル・エントリを受け
取り、それらのジャーナル・エントリをジャーナルのロ
ーカル・レプリカに記録するプロセスである。データベ
ースのレプリカを制御する各機械の上の１つのデータベ
ースに対して１つのバックアップ・レシーバ・プロセス
がある。「バックアップ・アプライア」は、レプリカ・
データベースを制御する機械の上にあり、データベース
のローカル・レプリカにジャーナル・エントリを付すプ
ロセスである。バックアップ・レプリカを制御する各機
械の上の１つのデータベースに対して１つのバックアッ
プ・アプライア・プロセスがある。

【００３３】図２に、本発明の方法とシステムにしたが
い実施された回復可能なデータベース・システム内の、
典型的な書き込みオペレーションの制御フローの概略を
示す。図に示すように、ユーザ４０はアプリケーション
４２を使用し、スタブ・ルーチン４４を呼び出し、プラ
イマリ・データベース４６内でオペレーションを実行す
る。プライマリ・データベース４６を制御する機械の中
のプライマリ・エージェント４８がこのオペレーション
を実行する。この修正によって必要になったジャーナル
・エントリがジャーナル５０内に挿入され、レプリカ・
データベース５２内のバックアップ・レシーバ５４、お
よび、レプリカ・データベース６０のような他のレプリ
カ・データベースに広げられる。

【００３４】バックアップ・レシーバ５４はそれらのジ
ャーナル・エントリを受け取ったというアクノレッジメ
ントを返し、その後、それらのジャーナル・エントリを
そのジャーナルのローカルレプリカ（符号５８に示すよ
うな）内に、随時非同期的に入れる。バックアップ・ア
プライア５６は、ジャーナル５８内にあるそれらのジャ
ーナル・エントリをレプリカ・データベース５２内の対
応するレコードに付ける。これは、そのレコードをロッ
クし、アップデートし、その後、アンロックすることに
よって行われる。この方法によって、レプリカ・データ
ベース５２とプライマリ・データベース４６との間の整
合性を保つことができる。

【００３５】したがって、バックアップ・アプライア５
６により、ユーザが直接レプリカ・データベース５２か
らレコードを読んだ場合には部分的にしかアップデート
されていないレコードを読むのを防ぐことによって、最
低レベルの整合性を提供することができる。もちろん、
データベース読取りオペレーションに対する制御フロー
は、図２に示したものに似ている。しかし、ジャーナル
・エントリは生成されず、したがって、バクアップ・レ
シーバとバックアップ・アプライアは使用されない。図
２に示した環境は、たとえば、ＩＢＭＡＳ／４００の
ようなコンピュータ・システムを使用して実施すること
ができる。

【００３６】次に、本発明の重要な特徴として、選択さ
れたレプリカ・データベースをユーザが使用する際にユ
ーザが選択する複数の多様な整合性レベルが提供され
る。回復可能なデータベース・システム内の同時実行に
ついては、「同時実行制御とデータベース・システムの
回復」（"Concurrence Control and Recovery in Datab
ase Systems" Addison-Wesley Publishing Company, 1
987）に記載があり、複数バージョンの同時実行制御モ
デルが記述されている。このシステムにおいては、バッ
クアップ・レプリカ・データベースは常にプライマリ・
データベースより遅れ、したがって、データベースのバ
ージョンが２つできる。上記文献のシステムに対比し
て、本発明の方法とシステムは、考慮するべき２つの異
なる整合性属性を提供する。

【００３７】具体的には、これらの２つの属性は、デー
タベース・システム内のトランザクションの順序付け
（ordering）と、これらのトランザクションの直列化可
能性（serializability）を含む。これらの２つの属性
はいくつかの方法で組み合わせることができ、その結果
６つの異なる整合性レベルができる。したがって、本発
明の重要な特徴にしたがい、レプリカ・データベースか
ら読み込む照会に対し、トランザクションの順序付けに
関して３つの異なる整合性レベルが考慮される。もちろ
ん、当業者には明らかなように、レコード・アップデー
トの後の整合性維持のために、最大時間遅れの値を指定
することができる。「レベル０」整合性レベルは、レプ
リカ・データベース内の古い値を使って照会することを
許す。「レベル１」整合性レベルは、レプリカ・データ
ベースから最新のコミットされた値だけを使って照会で
きるという整合性を課す。最後に、「レベル２」整合性
レベルは、その値がコミットに達したか否かに拘わら
ず、レプリカ・データベースからの最新の値だけを使っ
て照会するという整合性を課す。

【００３８】次に、上述したように、所望の整合性レベ
ルを割り当てるために、本発明の回復可能なデータベー
ス・システム内のトランザクションの直列化可能性につ
いて考慮しなければならない。この属性によって、現実
には同時にインターリーブして実行されたトランザクシ
ョンが、或る直列順序で実行されたのと論理的には等し
い効果を持たせることを保証する。回復可能なデータベ
ース・システムは、コミットメント制御の下で動くアプ
リケーションが、コミットメント制御の下にない他のア
プリケーションと同時に同じデータベースに対して動く
ことを許す。したがって、異なるアプリケーションは、
直列化可能性を必要としてもしなくても良いことが考え
られる。したがって、本発明の回復可能なデータベース
・システム内のレプリカ・データベースにユーザまたは
システム管理者が異なる多様な整合性レベルをセットす
ることを許すとき、整合性レベルを制御するために２つ
の異なる変数がセットされなければならない。順序付け
は、「レベル０」、「レベル１」、あるいは「レベル
２」にセットされる。さらに、直列化可能性は「必要」
あるいは「不要」にセットされる。

【００３９】図３に、本発明の方法とシステムによる回
復可能なデータベース内での複数の多様な整合性レベル
のセットを説明する論理フローの概略図を示す。図示し
たように、このプロセスは、ブロック７０で始まり、ブ
ロック７２に進む。ブロック７２で、整合性レベルの選
択が行われたかどうかが判断される。Ｎｏの場合、この
プロセスは、ユーザまたはシステム管理者が回復可能な
データベース・システム内のレプリカ・データベースの
整合性レベルをセットしたいという意志表示を示すま
で、繰り返される。

【００４０】ブロック７２で整合性レベルの選択が行わ
れた場合、プロセスはブロック７４に進む。ブロック７
４は、本発明の回復可能なデータベース・システム内の
最初のレプリカ・データベースに対するプロセスを示
す。次にプロセスはブロック７６に進む。ブロック７６
で、プロセスは、ユーザあるいはシステム・オペレータ
が所望の整合性レベルをセットすることを促す。次に、
プロセスはブロック７８に進む。ブロック７８で、所望
の整合性レベルが入れられたかどうかが判断され、Ｎｏ
の場合は、プロセスは繰り返しブロック７６に戻り、再
度所望の整合性レベルを入れるように促す。

【００４１】ブロック７８で所望の整合性レベルが入れ
られたと判断されれば、プロセスはブロック８０に進
む。ブロック８０で、直列化可能性の要求があるかどう
かをユーザあるいはシステム・オペレータに促す。すな
わち、インターリーブされて実行されたトランザクショ
ンが、或る直列順序で実行されたのと論理的に等しいも
のとしたいかどうかを、ユーザあるいはシステム・オペ
レータに意志表示してもらう。次に、プロセスはブロッ
ク８２に進む。ブロック８２で、ユーザが直列化可能性
要求を入れたかどうかを判断し、Ｎｏの場合は繰り返し
ブロック８０に戻り、再度、このデータベースに対する
直列化可能性要求があるか否かを入れるようにユーザに
促す。ユーザが直列化可能性要求を入れた後、プロセス
はブロック８２からブロック８４に進む。ブロック８４
で、整合性レベルを付けるべきレプリカ・データベース
がまだあるかどうかを判断し、以上のプロセスで整合性
レベルを付けたレプリカ・データベースが最後のレプリ
カでない場合には、プロセスは繰り返しブロック７６に
戻り、再度上述したプロセスを実行する。ブロック８４
がＹｅｓの場合、すなわち、最後のレプリカ・データベ
ースに所望の整合性レベルが付けられた場合は、プロセ
スはブロック８６に進みリターンする。

【００４２】図４から図１０に、本発明の方法とシステ
ムによる回復可能なデータベース・システム内で、レコ
ード・アップデートが行われた後の、複数の多様な整合
性レベルを実行する方法を示すフローチャートの概略図
を示す。図４に示すように、プロセスはブロック９０か
ら始まる。次に、プロセスはブロック９２に進み、レコ
ード・アップデートが起こったかどうかを判断する。レ
コード・アップデートがまだ起こっていない場合、この
プロセスは、プライマリ・データベースにレコード・ア
ップデートが起こるまで繰り返される。次に、レコード
・アップデートが起こったときに、プロセスはブロック
９２からブロック９４に進む。

【００４３】ブロック９４は、本発明の回復可能なデー
タベース・システム内の各レプリカ・データベースに対
して繰り返して行われるプロセスの始まりを示す。プロ
セスはブロック９４からブロック９６に進む。ブロック
９６で、所望の整合性レベルが「レベル０」にセットさ
れたかどうかが判断される。Ｙｅｓであれば、プロセス
はブロック９８に進む。ブロック９８で直列化可能性が
要求されているかどうかが判断され、Ｙｅｓの場合、プ
ロセスは、図４のコネクタ１００を介して図５の論理フ
ローに進む。そうでない場合、すなわち、直列化可能性
が不要であった場合、プロセスは、図４のコネクタ１０
２を介して図６の論理フローに進む。

【００４４】再びブロック９６に戻り、所望の整合性レ
ベルが「レベル０」にセットされなかった場合は、プロ
セスはブロック１０４に進む。ブロック１０４で、所望
の整合性レベルが「レベル１」にセットされたかどうか
が判断される。Ｙｅｓであれば、プロセスはブロック１
０４からブロック１０６に進み、再度、直列化可能性が
要求されているかどうかが判断される。直列化可能性が
要求されている場合には、プロセスは、図４のコネクタ
１０８を介して図７の論理フローに進む。そうでない場
合、すなわち、直列化可能性が不要であった場合、コネ
クタ１１０を介して図８の論理フローに進む。

【００４５】再びブロック１０４に戻り、所望の整合性
レベルが「レベル１」でない場合、プロセスはブロック
１０４からブロック１１２に進む。ブロック１１２で、
このレプリカ・データベースに対する所望の整合性レベ
ルが「レベル２」にセットされたかどうかが判断され、
もしＹｅｓであれば、プロセスはブロック１１２からブ
ロック１１４に進む。前と同じように、ブロック１１４
で直列化可能性が要求されたかどうかが判断され、Ｙｅ
ｓの場合、プロセスはコネクタ１１６を介して図９の論
理フローに進む。Ｎｏの場合、すなわち、直列化可能性
が不要であった場合、プロセスはブロック１１４からコ
ネクタ１１８を介して図１０の論理フローに進む。最後
に、再びブロック１１２で、所望の整合性レベルが「レ
ベル２」でない場合、プロセスはブロック１２０に進み
リターンする。

【００４６】図５に、レプリカ・データベース内で整合
性「レベル０」が選択され直列化可能性が要求されたレ
コードに対応するレコードにレコード・アップデートが
行われた場合に起こる論理フローの順序を示す。図５か
ら図１０のそれぞれには、番号１３０、１３２、１３
４、および、１３６を付けた４つのカラムがある。それ
ぞれの場合において、カラム１３０はプライマリ・デー
タベースに起こるアクティビティを示す。カラム１３
２はジャーナル・エントリのフローを示し、カラム１３
４は考慮対象の特定のレプリカ・データベース内のバッ
クアップ・レシーバに起こるアクティビティを示す。最
後に、カラム１３６は、レプリカ・データベース内のバ
ックアップ・アプライア（図２を参照）のアクティビテ
ィを示す。

【００４７】したがって、図５のカラム１３０を見る
と、ブロック１５０に、レコードＲ１に対するアップデ
ートＵ１を含むトランザクションＴ１が示されている。
この結果ジャーナル・エントリ（ＪＥ１）が作られ、こ
れがバックアップ・レシーバに送られる。次に、バック
アップ・レシーバはアクノレッジメントをプライマリ・
データベースに送り、ジャーナル・エントリ（ＪＥ１）
を、レプリカ・データベースにあるローカルジャーナル
に入れる。次に、バックアップ・アプライアはレコード
Ｒ１をロックし、ジャーナル・エントリ（ＪＥ１）を付
ける。

【００４８】次に、ブロック１５２に、レコードＲ２に
対するアップデートＵ２を含むトランザクションＴ２が
示されている。この結果ジャーナル・エントリ（ＪＥ
２）が作られ、これがバックアップ・レシーバに送られ
る。次に、バックアップ・レシーバはアクノレッジメン
トをプライマリ・データベースに送り、ジャーナル・エ
ントリ（ＪＥ２）をローカル・ジャーナルに入れる。そ
の後、バックアップ・アプライアはレコードＲ２をロッ
クし、ジャーナル・エントリ（ＪＥ２）を付ける。

【００４９】次に、ブロック１５４に、レコードＲ３に
対するアップデートＵ３を含むトランザクションＴ１を
示す。このトランザクションの結果第３のジャーナル・
エントリ（ＪＥ３）が作られ、これがバックアップ・レ
シーバに送られる。バックアップ・レシーバは再度アク
ノレッジメントを送り、このジャーナル・エントリをロ
ーカルジャーナルに入れる。次に、バックアップ・アプ
ライアはレコードＲ３をロックし、ジャーナル・エント
リ（ＪＥ３）を付ける。

【００５０】最後に、ブロック１５６に、トランザクシ
ョンＴ１のためのコミット・オペレーションを示す。こ
のトランザクションの結果、ジャーナル・エントリ（Ｊ
Ｅ４）が作られ、バックアップ・レシーバに送られる。
バックアップ・レシーバはアクノレッジメントをプライ
マリ・データベースに送り、ジャーナル・エントリ（Ｊ
Ｅ４）をローカルジャーナルに入れる。次に、バックア
ップ・アプライアはレコードＲ１とＲ３に対するロック
をリリースする。

【００５１】図６は、整合性レベルを「レベル０」にセ
ットし直列化可能性を不要にしたレプリカ・データベー
ス内のレコードにアップデートをした結果起こる論理フ
ローを示す。説明を簡単にするために、図６から図１０
のカラムおよびトランザクションは、図５に使ったもの
と同じ番号を使用している。上述したのと同じように、
プロセスは、レコードＲ１に対するアップデートＵ１を
含むトランザクションＴ１を示すブロック１５０から始
まる。このトランザクションの結果、ジャーナル・エン
トリ（ＪＥ１）が作られ、これがバックアップ・レシー
バに結合される。アクノレッジメントがバックアップ・
レシーバからプライマリ・データベースに送られ、ジャ
ーナル・エントリ（ＪＥ１）がローカル・ジャーナルに
入れられる。次に、バックアップ・アプライアはレコー
ドＲ１をロックし、ジャーナル・エントリ（ＪＥ１）を
付ける。その後、直列化可能性が不要なので、バックア
ップ・アプライアはレコードＲ１をリリースする。

【００５２】ブロック１５２に、レコードＲ２に対する
アップデートＵ２を含むトランザクションＴ２を示す。
このトランザクションの結果ジャーナル・エントリ（Ｊ
Ｅ２）が作られ、これがバックアップ・レシーバに送ら
れる。バックアップ・レシーバはアクノレッジメントを
プライマリ・データベースに送り、ジャーナル・エント
リ（ＪＥ２）をローカルジャーナルに入れる。次に、バ
ックアップ・アプライアはレコードＲ２をロックし、ジ
ャーナル・エントリ（ＪＥ２）を付け、その後、レコー
ドＲ２をリリースする。

【００５３】ブロック１５４に、レコードＲ３に対する
アップデートＵ３を含むトランザクションＴ１の追加部
分を示す。このトランザクションの結果ジャーナル・エ
ントリ（ＪＥ３）が作られ、バックアップ・レシーバに
送られる。バックアップ・レシーバはアクノレッジメン
トをプライマリ・データベースに送り、ジャーナル・エ
ントリ（ＪＥ３）をローカルジャーナルに入れる。次
に、バックアップ・アプライアはレコードＲ３をロック
し、ジャーナル・エントリ（ＪＥ３）を付け、その後、
レコードＲ３をリリースする。

【００５４】最後に、ブロック１５６に、トランザクシ
ョンＴ１に対するコミット・オペレーションを示す。こ
のコミット・オペレーションの結果、ジャーナル・エン
トリ（ＪＥ４）が作られ、バックアップ・レシーバに送
られる。アクノレッジメントがバックアップ・レシーバ
によりプライマリ・データベース送られ、ジャーナル・
エントリ（ＪＥ４）がローカルジャーナルに入れられ
る。直列化可能性が不要であるので、このコミット・オ
ペレーションの結果、バックアップ・アプライアによる
アクティビティは起こらない。

【００５５】次に、図７に、レプリカ・データベースに
対して整合性「レベル１」が選択され直列化可能性が要
求されている場合のプライマリ・データベース内のレコ
ードに対するアップデートへの応答の方法を示す論理フ
ローを示す。前と同じように、ブロック１５０は、レコ
ードＲ１に対するアップデートＵ１を含むトランザクシ
ョンＴ１を示す。このトランザクションの結果ジャーナ
ル・エントリ（ＪＥ１）が作られ、バックアップ・レシ
ーバに送られる。アクノレッジメントがバックアップ・
レシーバによってプライマリ・データベースに送られ、
ジャーナル・エントリ（ＪＥ１）がローカルジャーナル
に入れられる。次に、バックアップ・アプライアはこの
ジャーナル・エントリ（ＪＥ１）をバッファにストアす
る。上述したように、整合性「レベル１」は、照会がコ
ミットされた最新の値のみを読むことを課しているの
で、当業者には明らかなように、レコードＲ１に対する
アップデートは、コミット・トランザクションが起こる
までの間、必ずバッファにストアされなければならな
い。

【００５６】次に、ブロック１５２に示すように、レコ
ードＲ２に対するアップデートＵ２を含むトランザクシ
ョンＴ２が起こる。この結果ジャーナル・エントリ（Ｊ
Ｅ２）が作られ、バックアップ・レシーバに結合され
る。バックアップ・レシーバは、アクノレッジメントを
プライマリ・データベースに送り、ジャーナル・エント
リ（ＪＥ２）をローカルジャーナルに入れる。前と同じ
ように、次に、バックアップ・アプライアはこのジャー
ナル・エントリ（ＪＥ２）をバッファにストアする。

【００５７】次に、ブロック１５４に示すように、レコ
ードＲ３に対するアップデートＵ３を含むトランザクシ
ョンＴ１が起こる。この結果ジャーナル・エントリ（Ｊ
Ｅ３）が作られ、バックアップ・レシーバに結合され
る。前と同じように、アクノレッジメントがバックアッ
プ・レシーバからプライマリ・データベースに送られ、
ジャーナル・エントリ（ＪＥ３）がローカルジャーナル
に入れられる。バックアップ・アプライアはこのジャー
ナル・エントリ（ＪＥ３）をバッファ内にストアする。

【００５８】最後に、ブロック１５６に示すように、ト
ランザクションＴ１のためのコミット・オペレーション
が起こる。この結果、ジャーナル・エントリ（ＪＥ４）
が作られ、バックアップ・レシーバに送られる。バック
アップ・レシーバはレコードＲ１とＲ３をロックし、ア
クノレッジメントをプライマリ・データベースに送る。
その後、バックアップ・アプライアはトランザクション
Ｔ１からジャーナル・エントリを取り出し、該当するジ
ャーナル・エントリ、すなわち、トランザクションＴ１
に関連しているジャーナル・エントリ（ＪＥ１およびＪ
Ｅ３）を付ける。その後、レコードＲ１およびＲ３はリ
リースされる。したがって、レコードＲ１およびＲ３に
対するアップデートは、そのトランザクションのための
コミット・オペレーションが起こるまで、バックアップ
・アプライアによって適用されない。

【００５９】図８に、整合性レベルを「レベル１」に、
直列化可能性を不要にセットしたレプリカ・データベー
ス内でアップデートされたレコードに対する応答方法を
記述した論理フローを示す。前と同じように、ブロック
１５０は、レコードＲ１に対するアップデートＵ１を含
むトランザクションＴ１を示す。この結果、ジャーナル
・エントリ（ＪＥ１）が作られ、バックアップ・レシー
バに結合される。バックアップ・レシーバはアクノレッ
ジメントをプライマリ・データベースに送り、このジャ
ーナル・エントリ（ＪＥ１）をローカルジャーナルに入
れる。次に、ジャーナル・エントリ（ＪＥ１）は、バッ
クアップ・アプライアによってバッファにストアされ
る。

【００６０】次に、ブロック１５２に示すように、レコ
ードＲ２に対するアップデートＵ２を含むトランザクシ
ョンＴ２が起こる。この結果、ジャーナル・エントリ
（ＪＥ２）が作られ、バックアップ・レシーバに結合さ
れる。次に、バックアップ・レシーバはアクノレッジメ
ントをプライマリ・データベースに送り、このジャーナ
ル・エントリ（ＪＥ２）をローカルジャーナルに入れ
る。次に、前と同じように、このジャーナル・エントリ
はバックアップ・アプライアによってバッファにストア
される。

【００６１】ブロック１５４で、レコードＲ３に対する
アップデートＵ３を含むトランザクションＴ１が起こ
る。この結果ジャーナル・エントリ（ＪＥ３）が作ら
れ、バックアップ・レシーバに結合される。アクノレッ
ジメントがバックアップ・レシーバからプライマリ・デ
ータベースに送られ、ジャーナル・エントリ（ＪＥ３）
がローカルジャーナル内にストアされる。次に、前と同
じように、ジャーナル・エントリ（ＪＥ３）がバックア
ップ・アプライアによってバッファにストアされる。

【００６２】最後に、ブロック１５６に示すように、ト
ランザクションＴ１のためのコミット・オペレーション
が起こる。この結果ジャーナル・エントリ（ＪＥ４）が
作られ、バックアップ・レシーバに結合される。次に、
バックアップ・レシーバはレコードＲ１とＲ３をロック
し、アクノレッジメントをプライマリ・データベースに
送る。その後、バックアップ・アプライアはトランザク
ションＴ１に対するジャーナル・エントリを取り出し、
第１のジャーナル・エントリ（ＪＥ１）を適用する。次
に、レコードＲ１がリリースされる。次に、トランザク
ションＴ１に対する第２のジャーナル・エントリ（ＪＥ
３）がレコードＲ３に適用され、そのレコードはリリー
スされる。図７の論理フローとは対照的に、図８の論理
フローでは直列化可能性の要求がないので、各レコード
はそのアップデートが適用された後でリリースされる点
に留意する必要がある。

【００６３】次に、図９に、整合性レベルを「レベル
２」にセットし直列化可能性を必要とするプライマリ・
データベース内の対応するレコードのアップデートに対
する、レプリカ・データベースの応答方法を記述した論
理フローを示す。前と同じように、ブロック１５０で、
レコードＲ１に対するアップデートＵ１を含むトランザ
クションＴ１が起こる。このトランザクションの結果、
ジャーナル・エントリ（ＪＥ１）が作られ、バックアッ
プ・レシーバに送られる。次に、バックアップ・レシー
バはＲ１をロックし、アクノレッジメントをプライマリ
・データベースに送る。次に、ジャーナル・エントリ
（ＪＥ１）がローカルジャーナルに入れられ、バックア
ップ・アプライアは直ちにジャーナル・エントリ（ＪＥ
１）を適用する。当業者には明らかなように、整合性
「レベル２」は、照会は最新の値（コミットが起こっ
たかどうかに拘わらず）のみを読むことによって行うこ
とを課している。したがって、レコードＲ１に対するア
ップデートは、バックアップ・アプライアによって直ち
に適用される。

【００６４】ブロック１５２で、レコードＲ２に対する
アップデートＵ２を含むトランザクションＴ２が起こ
る。この結果、ジャーナル・エントリ（ＪＥ２）が作ら
れ、バックアップ・レシーバに結合される。次に、バッ
クアップ・レシーバはレコードＲ２をロックし、アクノ
レッジメントをプライマリ・データベースに送り、ジャ
ーナル・エントリ（ＪＥ２）をローカルジャーナルに入
れる。次に、バックアップ・アプライアは直ちにジャー
ナル・エントリ（ＪＥ２）を適用し、レコードＲ２を最
新の値にアップデートする。

【００６５】ブロック１５４で、レコードＲ３に対する
アップデートＵ３を含むトランザクションＴ１の第２部
分が起こる。この結果、ジャーナル・エントリ（ＪＥ
３）が作られてバックアップ・レシーバに結合される。
次に、バックアップ・レシーバはレコードＲ３をロック
し、アクノレッジメントをプライマリ・データベースに
送る。次に、ジャーナル・エントリ（ＪＥ３）がローカ
ルジャーナルに入れられ、バックアップ・アプライアは
このジャーナル・エントリ（ＪＥ３）をレコードＲ３に
適用する。

【００６６】最後に、ブロック１５６で、トランザクシ
ョンＴ１に対するコミット・オペレーションが起こる。
この結果、ジャーナル・エントリ（ＪＥ４）が作られ、
バックアップ・レシーバに結合される。次に、バックア
ップ・レシーバはアクノレッジメントをプライマリ・デ
ータベースに送り、このジャーナル・エントリ（ＪＥ
４）をローカルジャーナルに入れる。次に、バックアッ
プ・アプライアはレコードＲ１とＲ３をリリースし、必
要に応じて、このトランザクション部分の直列化可能性
を維持する。

【００６７】最後に、図１０に、整合性「レベル２」を
セットし直列化可能性を要求しないレプリカ・データベ
ースの中のプライマリ・データベース内のレコードに対
するアップデートに応答して起こる論理フローを示す。
前と同様に、ブロック１５０で、レコードＲ１に対する
アップデートＵ１を含むトランザクションＴ１が起こ
る。この結果、ジャーナル・エントリ（ＪＥ１）が作ら
れバックアップ・レシーバに結合される。次に、バック
アップ・レシーバはレコードＲ１をロックし、アクノレ
ッジメントをプライマリ・データベースに送る。次に、
ジャーナル・エントリ（ＪＥ１）がローカルジャーナル
に入れられる。次に、バックアップ・アプライアはジャ
ーナル・エントリ（ＪＥ１）を適用し、直列化可能性が
要求されていないので、直ちにレコードＲ１をリリース
する。

【００６８】次に、ブロック１５２に示すように、レコ
ードＲ２に対するアップデートＵ２を含むトランザクシ
ョンＴ２が起こる。この結果、ジャーナル・エントリ
（ＪＥ２）が作られバックアップ・レシーバに結合され
る。次に、バックアップ・レシーバはレコードＲ２をロ
ックし、アクノレッジメントをプライマリ・データベー
スに送る。次に、ジャーナル・エントリ（ＪＥ２）がロ
ーカルジャーナルに入れられる。次に、バックアップ・
アプライアはジャーナル・エントリ（ＪＥ２）を適用
し、レコードＲ２をリリースする。

【００６９】次に、ブロック１５４に示すように、レコ
ードＲ３に対するアップデートＵ３を含むトランザクシ
ョンＴ１の次の部分が起こる。この結果、ジャーナル・
エントリ（ＪＥ３）が作られ、バックアップ・レシーバ
に結合される。次に、バックアップ・レシーバはレコー
ドＲ３をロックし、アクノレッジメントをプライマリ・
データベースに送る。次に、ジャーナル・エントリ（Ｊ
Ｅ３）がローカルジャーナルに入れられ、バックアップ
・アプライアはジャーナル・エントリ（ＪＥ３）を適用
し、レコードＲ３をリリースする。以上の記述から当業
者には明らかなように、この整合性レベルでは直列化可
能性が要求されていないので、レコードＲ１およびＲ３
に対するアップデートが行われ、各レコードは、そのア
ップデートが行われた後直ちにリリースされる。

【００７０】最後に、ブロック１５６で、トランザクシ
ョンＴ１に対するコミット・オペレーションが起こる。
この結果、ジャーナル・エントリ（ＪＥ４）が作られ、
バックアップ・レシーバに結合される。次に、バックア
ップ・レシーバはこのジャーナル・エントリのアクノレ
ッジメントを送り、ジャーナル・エントリ（ＪＥ４）を
ローカルジャーナルに入れる。

【００７１】まとめとして、本発明の構成に関して以下
の事項を開示する。（１）分散データ処理システム内でのデータベース・ア
クセス効率を向上させる方法であって、前記分散データ
処理システム内において、ストアされた複数のレコード
を持つ１つのデータベースを選択しプライマリ・データ
ベースとして指定するステップと、前記分散データ処理
システム内の第２の物理的ロケーションにおいて前記プ
ライマリ・データベースを複製するステップと、前記プ
ライマリ・データベースと前記の複製されたレプリカ・
データベースとの間に維持される複数の多様な整合性レ
ベルを指定するステップと、ユーザに前記の複数の多様
な整合性レベルから１つを指定させるステップと、を有
し、前記プライマリ・データベース内のレコードに対す
るアップデートに応答して、前記プライマリ・データベ
ースと前記レプリカ・データベースとの間に前記の複数
の多様な整合性レベルの前記の指定された１つを自動的
に維持する前記方法。（２）前記分散データ処理システム内の第３の物理的ロ
ケーションにおいて前記プライマリ・データベースを複
製するステップをさらに有する、前記（１）に記載の方
法。（３）ユーザに前記の複数の多様な整合性レベルから１
つを指定させる前記ステップが、前記プライマリ・デー
タベースとそのそれぞれのレプリカとの間に維持される
前記の複数の多様な整合性レベルから別の１つを指定さ
せるステップを有する、前記（２）に記載の方法。（４）分散データ処理システム内でのデータベース・ア
クセス効率を向上させるシステムであって、前記分散デ
ータ処理システム内において、ストアされた複数のレコ
ードを持つプライマリ・データベースと、前記分散デー
タ処理システム内の第２の物理的ロケーションにおいて
ストアされている前記プライマリ・データベースのレプ
リカと、前記プライマリ・データベースと前記レプリカ
・データベースとの間に維持される複数の多様な整合性
レベルを指定する手段と、ユーザに前記の複数の多様な
整合性レベルから１つを指定させる手段と、前記プライ
マリ・データベース内のレコードに対するアップデート
に応答して、前記プライマリ・データベースと前記レプ
リカ・データベースとの間に前記の複数の多様な整合性
レベルの前記の指定された１つを自動的に維持する手段
と、を有するシステム。（５）前記分散データ処理システム内の第３の物理的ロ
ケーションにおいてストアされている前記プライマリ・
データベースの第２のレプリカをさらに有する、前記
（４）に記載のシステム。（６）ユーザに前記の複数の多様な整合性レベルから１
つを指定させる前記手段が、前記プライマリ・データベ
ースとそのそれぞれのレプリカとの間に維持される前記
の複数の多様な整合性レベルから別の１つを指定させる
手段を有する、前記（５）に記載のシステム。（７）分散データ処理システム内でのデータベース・ア
クセス効率を向上させる方法であって、前記分散データ
処理システム内において、ストアされた複数のレコード
を持つ１つのデータベースを選択しプライマリ・データ
ベースとして指定するステップと、前記分散データ処理
システム内の第２の物理的ロケーションにおいて前記プ
ライマリ・データベースを複製するステップと、前記プ
ライマリ・データベース内の１つの選択されたレコード
に対するアップデートに応答して、前記の複製されたデ
ータベース内の対応する選択されたレコードへのアクセ
スを自動的にロックするステップと、前記の複製された
データベース内の前記の選択されたレコードをアップデ
ートするステップと、前記アップデートの後で、前記の
選択されたレコードへのアクセスをリリースするステッ
プと、前記分散データ処理システム内のユーザに、前記
プライマリ・データベースおよび前記の複製されたデー
タベースの中のレコードを照会させるステップと、を有
し、データの絶対的な整合性を維持するとともにデータ
アクセスの使用可能性を向上させる方法。（８）前記プライマリ・データベース内のレコードに対
する各アップデートが、コミット・オペレーションを行
う前の１つの整合性時点に戻り、前記の選択されたレコ
ードへのアクセスを前記アップデートの後でリリースす
る前記ステップが、前記アップデートに続くコミット・
オペレーションの後でのみ前記の選択されたレコードへ
のアクセスをリリースするステップを有する、前記
（７）に記載の方法。（９）分散データ処理システム内でのデータベース・ア
クセス効率を向上させるシステムであって、前記分散デ
ータ処理システム内において、ストアされた複数のレコ
ードを持つプライマリ・データベースと、前記分散デー
タ処理システム内の第２の物理的ロケーションにおいて
ストアされている前記プライマリ・データベースのレプ
リカと、前記プライマリ・データベース内の１つの選択
されたレコードに対するアップデートに応答して、前記
の複製されたデータベース内の対応する選択されたレコ
ードへのアクセスを自動的にロックする手段と、前記の
複製されたデータベース内の前記の選択されたレコード
をアップデートする手段と、前記アップデートの後で、
前記の選択されたレコードへのアクセスをリリースする
手段と、前記分散データ処理システム内のユーザに、前
記プライマリ・データベースおよび前記の複製されたデ
ータベースの中のレコードを照会させる手段と、を有
し、データの絶対的な整合性を維持するとともにデータ
アクセスの使用可能性を向上させるシステム。（１０）前記プライマリ・データベースを、いかなる時
点でも、コミット・オペレーションを行う前の整合性時
点に戻す手段をさらに有する、前記（９）に記載のシス
テム。（１１）前記アップデートの後で前記の選択されたレコ
ードへのアクセスをリリースする前記手段が、前記アッ
プデートに続くコミット・オペレーションの後でのみ前
記の選択されたレコードへのアクセスをリリースする手
段を有する、前記（１０）に記載のシステム。

【００７２】

【発明の効果】本発明の方法とシステムによって、ユー
ザあるいはシステム・オペレータは、バックアップ・サ
ーバ内のレプリカ・データベースに適する任意の整合性
レベルを広範な整合性レベルから選択できるようになる
（この選択には、整合性と性能との間のトレードオフが
含まれる）。この方法とシステムにより、最低限の整合
性レベルでは、１つのレプリカ・データベースにおい
て、古い、コミットされていない値を読むことができる
一方、他方では、プライマリ・データベースの第２のレ
プリカ内で、あたかも、照会がプライマリ・データベー
スから読み込みを行ったのと同じ結果を返すことができ
る最大レベルの整合性を提供することもできる。このよ
うにして、上述した回復可能なデータベース・システム
内において、データベースへのアクセスの効率を大いに
改善することができる。

【図面の簡単な説明】

【図１】本発明の方法およびシステムを実施するのに使
用できる分散データ処理システムの概略図である。

【図２】本発明の方法およびシステムにしたがって実施
される回復可能なデータベース・システム内での、典型
的な書き込みオペレーションの概略制御フローを示す。

【図３】本発明の方法およびシステムによる回復可能な
データベース内での複数の多様な整合性レベルの設定を
図示する概略論理フローチャートである。

【図４】本発明による複数の多様な整合性レベルの実施
を図示する概略論理フローチャートであり、図５に続
く。

【図５】図４に続く論理フローチャート。

【図６】図５に続く論理フローチャート。

【図７】図６に続く論理フローチャート。

【図８】図７に続く論理フローチャート。

【図９】図８に続く論理フローチャート。

【図１０】図９に続く論理フローチャート。

【符号の説明】

８分散データ処理システム１０、３２ローカルエリア・ネットワーク（Ｌ
ＡＮ）１２、３０コンピュータ１４、２０記憶装置１６印刷出力装置１８メインフレーム・コンピュータ２２、２４、３４通信リンク２６通信制御装置２８ゲートウェイ・サーバ４０ユーザ４２アプリケーション４４スタブ・ルーチン４６プライマリ・データベース４８プライマリ・エージェント５０、５８ジャーナル５２レプリカ・データベース５４、６０バックアップ・レシーバ５６バックアップ・アプライア

───────────────────────────────────────────────────── フロントページの続き (72)発明者ダニー・ドレブイスラエル、メバセレット・イェルチャライム、メボ・ナアマ 28 (72)発明者ジャーマン・ゴフトアメリカ合衆国13760ニューヨーク州エンディコット、ボーント・ヒル・ロード 207 アパートメント 23 (72)発明者ジョン・エム・マーバーグイスラエル34754ハイファ、ビトキン・ストリート 31 (72)発明者ジェイムス・ジー・ランワイラーアメリカ合衆国55902ミネソタ州ロチェスター、グレンクロフト・レイン・サウスウェスト 5720 (72)発明者ジュリアン・サトランアメリカ合衆国10589ニューヨーク州ソマーズ、ヘリテッジ・ヒルズ 82エイ

Claims

【特許請求の範囲】

【請求項１】分散データ処理システム内でのデータベ
ース・アクセス効率を向上させる方法であって、前記分散データ処理システム内において、ストアされた
複数のレコードを持つ１つのデータベースを選択しプラ
イマリ・データベースとして指定するステップと、前記分散データ処理システム内の第２の物理的ロケーシ
ョンにおいて前記プライマリ・データベースを複製する
ステップと、前記プライマリ・データベースと前記の複製されたレプ
リカ・データベースとの間に維持される複数の多様な整
合性レベルを指定するステップと、ユーザに前記の複数の多様な整合性レベルから１つを指
定させるステップと、を有し、前記プライマリ・データベース内のレコードに対するア
ップデートに応答して、前記プライマリ・データベース
と前記レプリカ・データベースとの間に前記の複数の多
様な整合性レベルの前記の指定された１つを自動的に維
持する前記方法。
【請求項２】前記分散データ処理システム内の第３の
物理的ロケーションにおいて前記プライマリ・データベ
ースを複製するステップをさらに有する、請求項１に記
載の方法。
【請求項３】ユーザに前記の複数の多様な整合性レベ
ルから１つを指定させる前記ステップが、前記プライマ
リ・データベースとそのそれぞれのレプリカとの間に維
持される前記の複数の多様な整合性レベルから別の１つ
を指定させるステップを有する、請求項２に記載の方
法。
【請求項４】分散データ処理システム内でのデータベ
ース・アクセス効率を向上させるシステムであって、前記分散データ処理システム内において、ストアされた
複数のレコードを持つプライマリ・データベースと、前記分散データ処理システム内の第２の物理的ロケーシ
ョンにおいてストアされている前記プライマリ・データ
ベースのレプリカと、前記プライマリ・データベースと前記レプリカ・データ
ベースとの間に維持される複数の多様な整合性レベルを
指定する手段と、ユーザに前記の複数の多様な整合性レベルから１つを指
定させる手段と、前記プライマリ・データベース内のレコードに対するア
ップデートに応答して、前記プライマリ・データベース
と前記レプリカ・データベースとの間に前記の複数の多
様な整合性レベルの前記の指定された１つを自動的に維
持する手段と、を有するシステム。
【請求項５】前記分散データ処理システム内の第３の
物理的ロケーションにおいてストアされている前記プラ
イマリ・データベースの第２のレプリカをさらに有す
る、請求項４に記載のシステム。
【請求項６】ユーザに前記の複数の多様な整合性レベ
ルから１つを指定させる前記手段が、前記プライマリ・
データベースとそのそれぞれのレプリカとの間に維持さ
れる前記の複数の多様な整合性レベルから別の１つを指
定させる手段を有する、請求項５に記載のシステム。
【請求項７】分散データ処理システム内でのデータベ
ース・アクセス効率を向上させる方法であって、前記分散データ処理システム内において、ストアされた
複数のレコードを持つ１つのデータベースを選択しプラ
イマリ・データベースとして指定するステップと、前記分散データ処理システム内の第２の物理的ロケーシ
ョンにおいて前記プライマリ・データベースを複製する
ステップと、前記プライマリ・データベース内の１つの選択されたレ
コードに対するアップデートに応答して、前記の複製さ
れたデータベース内の対応する選択されたレコードへの
アクセスを自動的にロックするステップと、前記の複製されたデータベース内の前記の選択されたレ
コードをアップデートするステップと、前記アップデートの後で、前記の選択されたレコードへ
のアクセスをリリースするステップと、前記分散データ処理システム内のユーザに、前記プライ
マリ・データベースおよび前記の複製されたデータベー
スの中のレコードを照会させるステップと、を有し、データの絶対的な整合性を維持するとともにデ
ータアクセスの使用可能性を向上させる方法。
【請求項８】前記プライマリ・データベース内のレコ
ードに対する各アップデートが、コミット・オペレーシ
ョンを行う前の１つの整合性時点に戻り、前記の選択さ
れたレコードへのアクセスを前記アップデートの後でリ
リースする前記ステップが、前記アップデートに続くコ
ミット・オペレーションの後でのみ前記の選択されたレ
コードへのアクセスをリリースするステップを有する、
請求項７に記載の方法。
【請求項９】分散データ処理システム内でのデータベ
ース・アクセス効率を向上させるシステムであって、前記分散データ処理システム内において、ストアされた
複数のレコードを持つプライマリ・データベースと、前記分散データ処理システム内の第２の物理的ロケーシ
ョンにおいてストアされている前記プライマリ・データ
ベースのレプリカと、前記プライマリ・データベース内の１つの選択されたレ
コードに対するアップデートに応答して、前記の複製さ
れたデータベース内の対応する選択されたレコードへの
アクセスを自動的にロックする手段と、前記の複製されたデータベース内の前記の選択されたレ
コードをアップデートする手段と、前記アップデートの後で、前記の選択されたレコードへ
のアクセスをリリースする手段と、前記分散データ処理システム内のユーザに、前記プライ
マリ・データベースおよび前記の複製されたデータベー
スの中のレコードを照会させる手段と、を有し、データの絶対的な整合性を維持するとともにデ
ータアクセスの使用可能性を向上させるシステム。
【請求項１０】前記プライマリ・データベースを、いか
なる時点でも、コミット・オペレーションを行う前の整
合性時点に戻す手段をさらに有する、請求項９に記載の
システム。
【請求項１１】前記アップデートの後で前記の選択され
たレコードへのアクセスをリリースする前記手段が、前
記アップデートに続くコミット・オペレーションの後で
のみ前記の選択されたレコードへのアクセスをリリース
する手段を有する、請求項１０に記載のシステム。