JPH11345219A - アプリケ―ション実現方法及びアプリケ―ション実現装置 - Google Patents

アプリケ―ション実現方法及びアプリケ―ション実現装置

Info

Publication number
JPH11345219A
JPH11345219A JP11112807A JP11280799A JPH11345219A JP H11345219 A JPH11345219 A JP H11345219A JP 11112807 A JP11112807 A JP 11112807A JP 11280799 A JP11280799 A JP 11280799A JP H11345219 A JPH11345219 A JP H11345219A
Authority
JP
Japan
Prior art keywords
computer
process group
application
groups
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11112807A
Other languages
English (en)
Other versions
JP3844621B2 (ja
Inventor
Reginald A Allen
エー アレン レジナルド
Debra K Haddad
ケー ハダッド デブラ
Susan A Lee
エー リー スーザン
John H Pokropinski
エイチ ポクロピンスキー ジョン
Bonnie L Prokopowicz
エル プロコポウィッズ ボニー
Dale F Rathunde
エフ ラサンデ デール
James P Schoonover
ピー スクーナバー ジェームス
Raymond D Smith
ディー スミス レイモンド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia of America Corp
Original Assignee
Lucent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lucent Technologies Inc filed Critical Lucent Technologies Inc
Publication of JPH11345219A publication Critical patent/JPH11345219A/ja
Application granted granted Critical
Publication of JP3844621B2 publication Critical patent/JP3844621B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2035Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0715Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1479Generic software techniques for error detection or fault masking
    • G06F11/1482Generic software techniques for error detection or fault masking by means of middleware or OS functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)
  • Power Sources (AREA)

Abstract

(57)【要約】 【課題】 緩やかに結合された計算システムを用いて高
利用可能性アプリケーションプロセスのスケーラブルな
階層を実現する。 【解決手段】 リソースの依存性及び故障回復戦略がプ
ロセスグループレベルで発生する。プロセスグループ
は、システムレイヤ、プラットフォームレイヤ、あるい
はアプリケーションレイヤのいずれかに属する。各レイ
ヤは、独自のプロセスグループ起動及び故障回復戦略を
有している。アプリケーションレイヤプロセスグループ
は、個々のコンピュータ上の別のアプリケーションレイ
ヤプロセスグループと対を構成している。あるアプリケ
ーションレイヤプロセスグループが故障すると、それと
対を構成しているアプリケーションレイヤプロセスグル
ープが存在する場合には、それが故障したプロセスグル
ープの機能の実行を引き継ぐ。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はコンピュータシステ
ムアーキテクチャに関し、特に、市販の複数個の演算装
置にわたってスケーラブルなアプリケーションの利用可
能性階層を同時に実現する高信頼性クラスタ計算アーキ
テクチャに関する。
【0002】
【従来の技術】従来技術に係る高利用可能性クラスタコ
ンピュータシステムは、通常、例えば共有ディスクなど
の共有された物理的なストレージデバイスを有するアー
キテクチャを有するように配置されている。それゆえ、
従来技術に係るクラスタ提供は、通常、物理的なハード
ウエア、すなわちシステム及びストレージデバイスの、
特に特定のアプリケーション処理環境に適合されたクラ
スタ配置、に基づいている。従来技術に係る容易に入手
可能な一般的なクラスタにおいては、重要なアプリケー
ションデータは、全て、最低でもクラスタ内の一つの計
算システムからアクセス可能な外部共有ディスク上、あ
るいはディスクプール上に存在していなければならな
い。従来技術に係るこの種のクラスタはディスク上のデ
ータパーティションへのアクセスを分離しようと試みる
ため、共有ディスクへのアクセスは一度にわずか一つの
計算システムに限定されてしまう。プライマリ計算シス
テムが故障すると交代が発生し、クラスタ内においてデ
ィスクへのアクセスがプライマリ計算システムから専用
のバックアップシステムへと再割り当てされる。この種
の再割り当てが実行されると、そのバックアップシステ
ム上のアプリケーションがディスクへのアクセスを実行
する。
【0003】従来技術に係る他のクラスタソリューショ
ンは、マルチプロセッサクラスタである。共有ディスク
クラスタと同様、マルチプロセッサクラスタは、計算シ
ステムのハードウエアベースの配置である。複数個の計
算システムが本質的に互いに無関係である共有ディスク
クラスタとは異なり、マルチプロセッサクラスタ内の計
算システムは、同一のデータを実質的に同時に利用して
全て同一のアプリケーションを実行している。前物理的
ストレージデバイスは、全ての計算システムからアクセ
ス可能であるように配置されている。この種のマルチプ
ロセッサクラスタは、コンカレントなデータへのアクセ
スを制御する目的で、データへのアクセスを管理しデー
タ破壊すなわちデータ整合性の問題を防止するロックマ
ネージメントソフトウエアを利用する。マルチプロセッ
サクラスタを構成するある計算システムが障害を起こし
た場合でも、残存するシステムがデータ処理を継続する
ことが可能である。
【0004】従来技術に係る別のクラスタソリューショ
ンは、メモリが複数個の計算システムに関して共有され
ている共有メモリすなわちシステムバスアーキテクチャ
に基づく対称マルチプロセッシングクラスタすなわちス
ケーラブルパラレルプロセッシングクラスタである。こ
の種のシステムは、対称マルチプロセッシングクラスタ
における計算システムの個数をスケーリングすることに
よって性能を向上させることを目的とするため、単一の
計算システムが故障すると対称マルチプロセッシングす
なわちパラレルプロセッシングクラスタプラットフォー
ム全体が利用不可能になってしまう。
【0005】従来技術に係るさらに別のクラスタアーキ
テクチャは、多重パラレルプロセッサクラスタである。
この場合には、各々の計算システムがそれぞれ専用のメ
モリ及びディスクを有しており、それらはクラスタ内の
いずれの計算システムによっても共有されていない。あ
るシステムがデータをディスク上に有していてそのデー
タが他の計算システムによって必要とされる場合には、
前者のコンピュータが高速ネットワークを介してデータ
を後者の計算システム宛に送出する。この種の多重パラ
レルプロセッサクラスタは、複数個の計算システムをコ
ンカレントに動作させることによって性能向上を図るこ
とを目的としているため、故障してしまった計算システ
ムに関連しているデータは利用不可能となる。
【0006】
【発明が解決しようとする課題】従来技術に係る高利用
可能性クラスタは、種々のレベルの利用可能性を実現す
る目的で、ターゲットとする特定の市場に関してデータ
及びアプリケーション特性を最適化するオペレーティン
グシステムベースのクラスタを用いている。この種のタ
ーゲットベースのアプローチは、無数のレガシーアプリ
ケーションが現実として存在し、それぞれが対応したハ
ードウエア上で実行される独自の回復及び性能特性を有
し、そのうちのあるものがフォールトトレラントである
ような、通信を含む産業群には向いていない。
【0007】それゆえ、市販の相互接続手段を用いて緩
やかに結合された単一あるいは複数個の市販の計算シス
テムにわたって種々のレベルの高利用可能性を同時に実
現する計算システムアーキテクチャが望まれている。
【0008】従来技術に係る高利用可能性クラスタソリ
ューションは、特定のアプリケーションの“鼓動(hear
tbeats)”及び回復をサポートすることが可能である。
従来技術に係るソリューション間での最も顕著なアーキ
テクチャ的な差異は、アプリケーション及び/あるいは
計算システムがアクティブあるいはスタンバイ状態であ
るように如何に選択あるいは制御するかを決定する方
法、及び、計算システムに対してアプリケーションデー
タへのアクセスがいつ許可されるのかを決定する方法で
ある。通常の物理的な高利用可能性クラスタソリューシ
ョンにおいては、計算システム対間の余剰通信機能の組
を用いて、コンフィグレーションステータスを決定す
る。ほとんどの場合において、システム対はいずれのシ
ステムがアプリケーションに関してアクティブであるか
を決定することが可能である。
【0009】従来技術に係る高利用可能性ソリューショ
ンにおいては、計算システム間の全ての通信が失われる
と、各々の計算システムあるいはクラスタアプリケーシ
ョンは、他のものが故障したと思い込んで、それぞれが
全てアクティブ状態になってしまう。このような状況
は、アプリケーションデータ及び処理の破壊という、好
ましくない高いリスクを顕在化させることになる。この
ような事態の発生を防止するため、複数のレベルでのプ
ロテクション及びセーフティが可能である。従来技術に
係るあるソリューションにおいては、共有ストレージを
介して“鼓動”を利用することにより、この種のリスク
をほぼ除去することが可能である。ある種のクラスタソ
リューションにおいては共有ストレージを用いる必要が
ないため、プラットフォームに依存しないハードウエア
コンポーネントがソフトウエアベースのクラスタコンポ
ーネントを補完するために望ましい。それゆえ、緩やか
に結合された市販の計算システムを用いて高利用可能性
アプリケーションプロセスのスケーラブルな階層を実現
することが本発明の目的である。
【0010】
【課題を解決するための手段】本発明は、緩やかに結合
された市販の計算システム、以下、コンピュータとも故
障される、を用いて高利用可能性アプリケーションプロ
セスのスケーラブルな階層を実現する方法及び装置を提
供する。計算システムは、あらゆるタイプのプロセッサ
及びこの種のプロセッサを含むあらゆるデバイスを意味
している。
【0011】リソースの依存性及び故障回復戦略がプロ
セスグループレベルで発生する。例えば、3つのプロセ
スを含むプロセスグループが、4つのリソース、例えば
他のプロセスグループやディスクなどの周辺デバイス、
に依存する場合がある。このプロセスグループ内での単
一のプロセスの故障あるいはそのプロセスグループが依
拠している単一のリソースの故障により、そのプロセス
グループ全体に関して、それを単一のユニットとして故
障回復が開始される。
【0012】プロセスグループは、システムレイヤ、プ
ラットフォームレイヤ、あるいはアプリケーションレイ
ヤのいずれかに属する。本発明の望ましい実施例におい
ては、各々のレイヤは、独自のプロセスグループ起動及
び故障回復戦略を有している。本発明の望ましい実施例
においては、アプリケーションレイヤプロセスグループ
は、個々のコンピュータ上の別のアプリケーションレイ
ヤプロセスグループと対を構成している。ある種の拡大
するプロセスグループ故障回復戦略の一部として、ある
アプリケーションレイヤプロセスグループが故障する
と、それと対を構成しているアプリケーションレイヤプ
ロセスグループが存在する場合には、それが故障したプ
ロセスグループの機能の実行を引き継ぐ。
【0013】アプリケーションレイヤプロセスグループ
は単一あるいは複数個のプラットフォームレイヤプロセ
スグループに依存しており、プラットフォームレイヤプ
ロセスグループは単一あるいは複数個のシステムレイヤ
プロセスグループに依存し、システムレイヤプロセスグ
ループはこれらのプロセスグループのホストとして機能
している緩やかに結合されたコンピュータのハードウエ
アに依存している。
【0014】システムレイヤプロセスグループが故障す
るとそのホストコンピュータ上の全てのプロセスが機能
を停止する。この際、他の単一あるいは複数個のコンピ
ュータ上の、機能停止してしまったアプリケーションレ
イヤプロセスグループと対を構成しているあらゆるアプ
リケーションレイヤプロセスグループが起動され、故障
したシステムレイヤプロセスグループのホストとして機
能してるコンピュータがリブートされ、そして、全ての
システムレイヤ、プラットフォームレイヤ、及びアプリ
ケーションレイヤプロセスグループが再初期化される。
【0015】プラットフォームレイヤプロセスグループ
が故障すると、そのプラットフォームレイヤプロセスグ
ループが0回あるいは複数回再起動される。故障したプ
ラットフォームレイヤプロセスグループの再起動によっ
て当該プラットフォームレイヤプロセスグループの故障
が修復されない、あるいは当該プラットフォームレイヤ
プロセスグループが再起動可能ではない、という場合に
は、当該ホストコンピュータ上の全てのアプリケーショ
ンレイヤ及びプラットフォームレイヤプロセスグループ
が停止させられて再初期化される。この段階には、当該
ホストコンピュータ上の停止させられたアプリケーショ
ンレイヤプロセスグループと対を構成している他の単一
あるいは複数個のコンピュータ上のあらゆるアプリケー
ションレイヤプロセスグループの起動が含まれる。
【0016】プラットフォームレイヤプロセスグループ
が依存しているリソースが故障すると、当該ホストコン
ピュータ上の全てのアプリケーションレイヤ及びプラッ
トフォームレイヤプロセスグループが停止させられて再
初期化される。この段階には、当該ホストコンピュータ
上の停止させられたアプリケーションレイヤプロセスグ
ループと対を構成している他の単一あるいは複数個のコ
ンピュータ上のあらゆるアプリケーションレイヤプロセ
スグループの起動が含まれる。
【0017】アプリケーションレイヤプロセスグループ
が故障すると、そのアプリケーションレイヤプロセスグ
ループが0回あるいは複数回再起動される。故障したア
プリケーションレイヤプロセスグループの再起動によっ
て当該アプリケーションレイヤプロセスグループの故障
が修復されない、あるいは当該アプリケーションレイヤ
プロセスグループが再起動可能ではない、という場合に
は、故障したアプリケーションレイヤプロセスグループ
が停止させられ、この停止させられたアプリケーション
レイヤプロセスグループと対を構成している、他のコン
ピュータ上のアプリケーションレイヤプロセスグループ
が起動される。
【0018】アプリケーションレイヤプロセスグループ
が依存しているリソースが故障した場合には、当該依存
しているアプリケーションレイヤプロセスグループは停
止させられ、当該ホストコンピュータ上の停止させれた
当該依存しているアプリケーションレイヤプロセスグル
ープと対を構成している別のコンピュータ上のアプリケ
ーションレイヤプロセスグループが起動される。
【0019】
【発明の実施の形態】図1は、本発明の望ましい実施例
を模式的に示した図である。当該実施例には、管理端末
(MT)2、独立コンピュータ(IC)4、ネットワー
ク、コンピュータバスアーキテクチャ等の相互接続8に
よって互いに緩やかに結合させられた4つの市販の業界
標準計算装置6(以下、コンピュータ6とも呼称され
る)が含まれる。計算装置6(コンピュータ6とも呼称
される)は、あらゆる種類のプロセッサあるいはこれら
プロセッサを含むあらゆる種類のデバイスである。
【0020】各々のコンピュータ6は、集合的にプロセ
スグループマネージャと呼称される場合のある、プロセ
スグループ管理ソフトウエア10を実行している。プロ
セスグループマネージャ10はプロセスグループを起動
し、プロセスグループレベルで故障回復戦略を開始す
る。プロセスグループはプロセス群であり、通常、ソフ
トウエアでインプリメントされ、互いにある様式で関連
しているため、プロセスグループを単一のユニットとし
て管理することが望ましい。あるプロセスグループ内の
全てのプロセスを再始動することが望ましい場合もあ
り、また、強化された故障回復戦略の一部として、個々
のコンピュータ上のプロセスグループによって実行され
ている、プロセスグループ内のプロセスの全ての機能を
有することが望ましい場合もある。プロセスグループ
は、当該プロセスグループに対して共通であるリソース
あるいはリソースの組に依存する場合もあるが必ずしも
そうとは限らない。
【0021】独立コンピュータ4は、長期間に亘って最
小の故障しか起こさないように設計された計算デバイス
であることが望ましい。独立コンピュータ4は、米国特
許第5,560,033号に記載されているように、
“鼓動”を用いてコンピュータ6のハードウエア故障を
モニタする。緩やかに結合されたコンピュータ6の各々
は、図1の参照番号12によって示されているように、
中央コンピュータ4に接続されている。
【0022】 プロセスグループは、システムレイヤ1
3、プラットフォームレイヤ15、及びアプリケーショ
ンレイヤ17のうちのいずれかのレイヤに属する。各々
のコンピュータ6は、プロセスグループ管理(PGM)
ソフトウエア10、一つのシステムレイヤプロセスグル
ープ(SLPG)14、一つのプラットフォームレイヤ
プロセスグループ(PLPG)16、単一あるいは二つ
の互いにプロセスグループ対(PGP)24を構成して
はいないアプリケーションレイヤプロセスグループ(A
LPG)18、プロセスグループ対24の一部である一
つのプライマリアプリケーションレイヤプロセスグルー
プ(P−ALPG)20、及び、プロセスグループ対2
4の一部であるオルタネートアプリケーションレイヤプ
ロセスグループ(A−ALPG)22を実行している。
その定義から、(1)各プロセスグループ対24は、第
一のコンピュータ6上のプライマリプロセスグループ2
0及び第二のコンピュータ6上の別のプロセスグループ
22をそれぞれ含んでいる;(2)各プライマリプロセ
スグループ20及び各オルタネートプロセスグループ2
2は、それぞれプロセスグループ対の一部である;及
び、(3)プロセスグループ14、16、及び18はプ
ロセスグループ対24の一部ではない。本発明の望まし
い実施例においては、プロセスグループ対はアプリケー
ションレイヤ17のみに属している。しかしながら、シ
ステムレイヤ13、プラットフォームレイヤ15、ある
いは3つのレイヤの全てにおいてプロセスグループ対は
生成され得るものであって、それは本発明の技術的範疇
に含まれる。
【0023】本発明の望ましい実施例における各々のコ
ンピュータ6は前述された種々のタイプの複数個のプロ
セスグループを実行しているが、各コンピュータ6が
(1)ゼロ個あるいは単一のプロセスグループ14、1
6、及び18;(2)ゼロ個あるいは複数個のプライマ
リプロセスグループ20;及び(3)ゼロ個あるいは複
数個のオルタネートプロセスグループ22;を実行する
ことも本発明の技術的範疇に含まれる。
【0024】同様に、コンピュータ6の個数が2あるい
はそれ以上であることも本発明の技術的範疇に含まれ
る。また、図1においては、プロセスグループ管理ソフ
トウエア10が緩やかに結合された4つのコンピュータ
6の全てにおいて実行されているが、プロセスグループ
管理ソフトウエア10が緩やかに結合されたコンピュー
タ6においてある順序あるいは組み合わせで実行される
こと及び/あるいは独立コンピュータ4上で実行される
ことも本発明の技術的範疇に含まれる。さらに、独立コ
ンピュータ4によって実行される機能が、デジタル信号
プロセッサを搭載した周辺ボード、汎用プロセッサを有
するシステムボード、フォールトトレラントプロセッサ
等のあらゆるタイプのプロセッサを実行することが可能
なあらゆるタイプのデバイスを用いて実行され得るが、
このことも本発明の技術的範疇に含まれる。
【0025】独立コンピュータ4は、本発明の望ましい
実施例においてはRS−232等の業界標準インターフ
ェース12を用いるが、あらゆるインターフェースを用
いることも可能である。このため、イーサネット、ファ
イバ分散データインターフェース(FDDI)、非同期
転送モード(ATM)等の一般的なネットワークインタ
ーフェース及び転送制御プロトコル/インターネットプ
ロトコル(TCP/IP)等のプロトコル、あるいはペ
リフェラルコンポーネントインターコネクト(PCI)
等を用いることが可能となる。
【0026】緩やかに結合されたコンピュータ6の各々
は、通常、他の緩やかに結合されたコンピュータ6の各
々と同一あるいは相異なった動作環境を有する単一プロ
セッサ、マルチプロセッサ、あるいはフォールトトレラ
ントプロセッサシステムを有している。言い換えれば、
個々のコンピュータ6は、例えばウィンドウズ(Window
s)やユニックス(UNIX)等の相異なったオペレーティ
ングシステムを実行することが可能であり、また、例え
ばリアルタイムと非リアルタイム等の相異なった動作環
境、及び、相異なった個数及びタイプのプロセッサを有
することも可能である。緩やかに結合されたコンピュー
タ6の各々は、同一のサイトに位置することも可能であ
り、また、地勢的に分離されていてローカルエリアネッ
トワーク(LAN)あるいはワイドエリアネットワーク
(WAN)等のネットワーク8によって接続されていて
もよい。
【0027】前述されているように、各々のプロセスグ
ループ14、16、18、20、あるいは22は、プロ
セスグループ14、16、18、20、あるいは22に
関して共通であるリソースの組に依存する単一あるいは
複数個のプロセスを有している。例えば、このようなリ
ソースの組には、コンピュータハードウエア周辺デバイ
ス、他のプロセスグループ14、16、あるいは18、
20、あるいは22,通信リンク、利用可能なディスク
空間、あるいは外部アプリケーションの利用可能性に影
響を与えるあらゆるもの、が含まれる。各オルタネート
プロセスグループ22は、これらオルタネートプロセス
グループと対を構成しているプライマリプロセスグルー
プ20が依存しているリソースの組と機能的に等価なリ
ソースの組に依存する。しかしながら、プライマリプロ
セスグループ20が依存しているリソースの組とオルタ
ネートプロセスグループ22が依存している個別のリソ
ースの組は、同一の個数のリソースを有する必要はな
い。プロセスグループ14、16、18、20、あるい
は22内に含まれる各々のプロセスは、プロセスグルー
プ14、16、18、20、あるいは22に共通の起動
及び故障回復戦略も有している。
【0028】図2は、各々のプロセスグループ14、1
6、18、20、及び22が移行する状態、すなわち、
利用不可能30、初期化32、待機34、アクティブ3
6、及びオフライン38、を示している。利用不可能状
態30及び初期化状態32内のプロセスグループは開始
されておらず、それゆえ実行されていない。アクティブ
状態36内のプロセスグループは開始されており、実行
されている。待機状態34内のプロセスグループが開始
されていて実行されているか否かは、そのプロセスグル
ープがホットスタンバイあるいはコールドスタンバイプ
ロセスグループのいずれであるかに依存している。待機
状態34内のホットスタンバイプロセスグループは開始
されていて、起動されるのを待機している。待機状態3
4内のコールドスタンバイプロセスグループは、それが
起動されるまで開始されない。コールドスタンバイプロ
セスグループの起動は、そのコールドスタンバイプロセ
スグループが依存しているあらゆる未初期化のリソース
の初期化も含んでいる。故障状態ではない場合には、プ
ライマリプロセスグループ20はアクティブ状態36内
で実行されるように初期化され、オルタネートプロセス
グループ22は待機状態34内で初期化される。
【0029】本発明の望ましい実施例においては、オフ
ライン状態38には、マニュアル操作によってのみ入る
ことが可能であってまた出ることも可能である。言い換
えれば、単一あるいは複数個のプロセスグループ14、
16、18、20、及び22をオフライン状態38にす
るあるいは単一あるいは複数個のプロセスグループ1
4、16、18、20、及び22をオフライン状態38
から取り除くためには、作業者がローカル管理端末2か
らコマンドを入力しなければならない。オフライン状態
38は、例えばプロセスグループマネージャ10からの
コマンドに応答する場合等のマニュアル操作以外の状況
下でもオフライン状態になることは可能であるが、これ
は本発明の技術的範疇に含まれる。
【0030】リソースあるいはプロセスグループに欠陥
がなく、かつ、プライマリプロセスグループ20及びオ
ルタネートプロセスグループ22がマニュアルでオフラ
イン状態38に遷移させられていない、ということを仮
定すると、プロセスグループ対24は、プライマリプロ
セスグループ20及びオルタネートプロセスグループ2
2を、それぞれ対になっているアクティブ/コールドス
タンバイあるいはアクティブ/ホットスタンバイという
関係で、アクティブ状態36及び待機状態34に有して
いる。本発明の望ましい実施例においては、プライマリ
プロセスグループ20はアクティブ状態36に初期化さ
れ、オルタネートプロセスグループ22は待機状態34
に初期化されることが望ましい。
【0031】プライマリプロセスグループ20がアクテ
ィブ状態36に初期化され、オルタネートプロセスグル
ープ22が待機状態34に初期化されるが、ある条件下
では、オルタネートプロセスグループ22がアクティブ
状態36にあり、それと対をなしているプライマリプロ
セスグループ20が待機状態34にある場合がある。例
えば、アクティブ状態36/待機状態34対を構成して
いる関係を有するプロセスグループ対24に含まれるプ
ライマリプロセスグループ20において欠陥が生じた場
合には、プロセスグループマネージャ10はプライマリ
プロセスグループ20をアクティブ状態36から利用不
可能状態30に遷移させ、オルタネートプロセスグルー
プ22を待機状態34からアクティブ状態36に遷移さ
せる。プライマリプロセスグループ20を利用不可能状
態30に遷移させる原因となった欠陥が修復されると、
プライマリプロセスグループ20は待機状態34へ遷移
させられ、オルタネートプロセスグループ22を利用不
可能状態30へと遷移させるようなオルタネートプロセ
スグループにおける欠陥が発生する、といった状況にな
るまで待機状態34に留まる。前述されたような状況が
発生すると、プライマリプロセスグループ20は待機状
態34からアクティブ状態36に遷移する。プロセスグ
ループ対のプライマリプロセスグループ20及びオルタ
ネートプロセスグループ22は、アクティブ状態36/
待機状態34から待機状態34/アクティブ状態36へ
とマニュアルで、あるいは、アクティブ状態36にある
プロセスグループ20あるいは22を待機状態34へ、
そして待機状態34にあるプロセスグループ20あるい
は22をアクティブ状態36へ、それぞれ切り替えるこ
とが望ましいような状況下で、切り替えられ得る。
【0032】アプリケーションレイヤプロセスグループ
18、20あるいは22の利用可能性は、通常、単一あ
るいは複数個のプラットフォームレイヤプロセスグルー
プ16の利用可能性に依存している。プラットフォーム
レイヤプロセスグループ16の利用可能性は、通常、単
一あるいは複数個のシステムレイヤプロセスグループ1
4の利用可能性に依存しており、システムレイヤプロセ
スグループ14の利用可能性は、システムレイヤプロセ
スグループ14のホストとして機能しているコンピュー
タ6のハードウエアの利用可能性に依存している。シス
テムレイヤプロセスグループ14は、プラットフォーム
レイヤプロセスグループ16より前に初期化され、プラ
ットフォームレイヤプロセスグループ16はアプリケー
ションレイヤプロセスグループ18、20、及び22よ
りも前に初期化される。
【0033】本発明は、種々の個数のプロセスグループ
14、16、18、20、及び22、及び/あるいは2
つあるいはそれ以上のコンピュータ6に亘って拡散され
ているプロセスグループ対24を用いて外部アプリケー
ションをインプリメントするフレキシビリティを提供す
る。例えば、図1に示されている4つのプロセスグルー
プ対24は単一の外部アプリケーションの一部である可
能性があり、あるいはそれらは4つ、3つあるいは2つ
の個別の外部アプリケーションの一部であってもよい。
加えて、図1に示されたプロセスグループ対24のうち
の2つが、2つの個別のコンピュータ6対によって支持
されている同一の外部アプリケーションの一部であるこ
とも可能である。さらに、単一あるいは複数個のプロセ
スグループ対24及び/あるいは単一あるいは複数個の
プロセスグループ14、16、18、20、あるいは2
2が、単一あるいは複数個のプロセスグループ対24及
び/あるいは単一あるいは複数個のプロセスグループ1
4、16、18、20、あるいは22と同一のリソース
に依存している場合もあり、単一のリソースが故障する
と複数個のプロセスグループ及び/あるいは複数個のプ
ロセスグループ対の故障回復戦略が実行されることにな
る。
【0034】システムレイヤ13、プラットフォームレ
イヤ15、及びアプリケーションレイヤ17の各レイヤ
は、それぞれ独自のプロセスグループ起動及び故障回復
戦略を有している。本発明の望ましい実施例において
は、システムレイヤは、再始動可能ではなく、かつリロ
ケート可能ではないプロセスグループ14を有してい
る。プラットフォームレイヤは、以下の2つのタイプの
プロセスグループのいずれかあるいは双方を有してい
る。プラットフォームレイヤプロセスグループ16は、
(1)再始動不能かつリロケート不能;あるいは、
(2)再始動可能かつリロケート可能;のいずれかであ
る。アプリケーションレイヤ17は、以下の3つのタイ
プのプロセスグループのいずれかあるいは全てを有して
いる:(1)再始動不能かつリロケート不能なプロセス
グループ18;(2)再始動可能かつリロケート不能な
プロセスグループ18;及び(3)再始動可能かつリロ
ケート可能なプロセスグループ20及び22。リロケー
ト可能とは、同一のコンピュータ6内でのあらゆるタイ
プのリロケーションではなく、プライマリプロセスグル
ープ20あるいはオルタネートプロセスグループ22の
機能の実行をあるコンピュータ6から別のコンピュータ
6へとリロケートすることを意味している。プライマリ
プロセスグループ20及びオルタネートプロセスグルー
プ22はリロケート可能である。プロセスグループ1
4、16、及び18はリロケート不能である。前述され
ているように、本発明の望ましい実施例においては、プ
ライマリプロセスグループ20及びセコンダリ(オルタ
ネート)プロセスグループ22は、アプリケーションレ
イヤ17のみに属している。しかしながら、プライマリ
プロセスグループ20及びオルタネートプロセスグルー
プ22がプラットフォームレイヤ及び/あるいはシステ
ムレイヤに属することや、レイヤベースの故障回復及び
/あるいはプロセスグループ起動戦略及び再始動可能性
及びリロケート可能性の他の順列及び組み合わせが本発
明の技術的範疇を逸脱することなくインプリメントされ
得ることは、当業者には明らかである。
【0035】システムレイヤプロセスグループが故障す
ると、(1)故障したシステムレイヤプロセスグループ
のホストとして機能しているコンピュータ6(“ホスト
コンピュータ”)上の全てのシステムレイヤ、プラット
フォームレイヤ、及びアプリケーションレイヤプロセス
グループ14、16、18、20、及び22が、利用不
可能状態30に遷移させられることによって利用不可能
となり;(2)ホストコンピュータ上でアクティブ状態
36から利用不可能状態30に遷移させられた各プライ
マリ及びオルタネートプロセスグループ20及び22に
関して、それらと対を構成しているプロセスグループ2
0あるいは22が、その対を構成しているプロセスグル
ープ20あるいは22を待機状態34からアクティブ状
態36へ遷移させることによって、別個のコンピュータ
6上で起動され;及び(3)故障したシステムレイヤプ
ロセスグループ14のホストとして機能しているコンピ
ュータ6がリブートされる。本発明の望ましい実施例に
おいては、リブートは、所定の時間期間の間に所定の回
数実行され得る。ホストコンピュータ6をリブートする
ことによって故障が回復されない場合には、独立コンピ
ュータ4がホストコンピュータ6の電源を切断・投入
し、ホストコンピュータ6を再起動する。本発明の望ま
しい実施例においては、電源の切断・投入は、所定の時
間期間の間に所定の回数実行され得る。ホストコンピュ
ータの電源の切断・投入によってシステムレイヤプロセ
スグループの故障が回復されない場合には、独立コンピ
ュータ4はホストコンピュータ6の電源を切断し、ホス
トコンピュータは電源が切断された状態に留まる。
【0036】プラットフォームレイヤプロセスが故障し
た場合には、故障したプロセスがゼロ回あるいは複数回
再始動される。本発明の望ましい実施例においては、再
始動可能なプラットフォームレイヤプロセスは、所定の
時間期間に所定の回数、例えば、5分以内に3回、再始
動される。
【0037】故障を回復する目的で故障したプラットフ
ォームレイヤプロセスを再始動する作業が失敗した場合
には、故障したプロセスを含むプロセスグループ16が
ゼロ回あるいは複数回再始動される。本発明の望ましい
実施例においては、再始動可能なプラットフォームレイ
ヤプロセスグループ16は、所定の時間期間に所定の回
数再始動される。この種のプロセスグループ16が再始
動される場合には、直前の動作状態へ再始動される。
【0038】故障したプラットフォームレイヤプロセス
グループ16の再始動によってプラットフォームレイヤ
プロセスグループの故障が回復されない場合には、故障
回復手続きが強化され、(1)全てのアプリケーション
レイヤプロセスグループが停止される;この際、別個の
コンピュータ上の、待機状態34にあってかつ停止され
たアプリケーションレイヤプロセスグループ20あるい
は22と対を構成している全てのプロセスグループ20
あるいは22が、存在する場合には、それら全ての起動
が含まれる;及び、(2)故障したプラットフォームレ
イヤプロセスのホストとして機能しているコンピュータ
上の全てのプラットフォームレイヤプロセスグループが
再初期化される。故障したプラットフォームレイヤプロ
セス及びそれが含まれるプロセスグループが共に再始動
不可能である場合には、上記強化された故障回復戦略
が、実行される最初の故障回復動作である。この強化さ
れたプラットフォームレイヤプロセスグループ故障回復
手続きは、プラットフォームレイヤプロセスグループ1
6が依存しているリソースの故障が検出された場合にも
インプリメントされる。その際には、故障が検出された
リソースの再初期化段階が追加される。故障したプロッ
トフォームレイヤプロセスあるいはリソースのホストと
して機能しているコンピュータ6(“ホストコンピュー
タ”)上の全てのプラットフォームレイヤプロセスグル
ープ16の再初期化によって故障が回復されない場合に
は、ホストコンピュータ6がリブートされ、ホストコン
ピュータ6上の全てのプロセスグループ14、16、1
8、20、及び22が再始動される。本発明の望ましい
実施例においては、ホストコンピュータ6は、所定の時
間期間の間に所定の回数リブートされ得る。ホストコン
ピュータ6をリブートすることによっても故障が回復さ
れない場合には、独立コンピュータ4がホストコンピュ
ータ6の電源を切断・投入し、このことによってホスト
コンピュータ6をリブートする。ホストコンピュータ6
の電源切断・投入によってもプラットフォームレイヤプ
ロセスグループの故障が回復されない場合には、独立コ
ンピュータ4はホストコンピュータ6の電源を切断し、
ホストコンピュータ6は電源が切断された状態に留ま
る。
【0039】アプリケーションレイヤプロセスグループ
18、20、あるいは22内のプロセスが故障すると、
故障したプロセスはゼロ回あるいは複数回再始動され
る。本発明の望ましい実施例においては、再始動可能な
アプリケーションレイヤプロセスは、所定の時間期間の
間に所定の回数再始動される。
【0040】故障を回復する目的での故障したアプリケ
ーションレイヤプロセスの再始動が失敗すると、故障し
たプロセスを含んでいるプロセスグループ18、20、
あるいは22がゼロ回あるいは複数回再始動される。本
発明の望ましい実施例においては、再始動可能なアプリ
ケーションレイヤプロセスグループ18、20、及び2
2は所定の時間期間の間に所定の回数再始動される。こ
の種のプロセスグループ18、20あるいは22が再始
動される場合には、直前の動作状態へ再始動される。
【0041】故障したアプリケーションレイヤプロセス
グループ18、20、あるいは22がアクティブ状態3
6にあるアプリケーションレイヤプロセスグループ18
あるいはプライマリプロセスグループ20もしくはオル
タネートプロセスグループ22であって、故障したプロ
セスグループの再始動によってもアプリケーションレイ
ヤプロセスの故障が回復されない場合には、故障回復手
続きが強化されて、故障したアプリケーションレイヤプ
ロセスグループを利用不可能状態30に遷移させること
によって停止させ、かつ、それらがプライマリプロセス
グループ20あるいはオルタネートプロセスグループ2
2である場合には、別個のコンピュータ6上の対を構成
していて待機状態にあるプロセスグループ20あるいは
22が起動される。この強化された故障回復戦略は、再
始動不可能なアプリケーションレイヤプロセスグループ
18、20及び22に含まれる再始動不可能なプロセス
のプロセス故障に関する最初の故障回復戦略である。こ
の強化された故障回復戦略は、アクティブ状態36にあ
るアプリケーションレイヤプロセスグループ18、2
0、あるいは22が依存しているリソースの故障を検出
した際にも用いられる。その際には、故障が検出された
リソースの再初期化段階が追加される。
【0042】アプリケーションレイヤプロセスグループ
18、20、あるいは22のサービスを停止すること及
び利用不可能状態30へ遷移させることが不可能である
場合には、故障回復戦略は、故障したアプリケーション
レイヤプロセスグループあるいはリソースのホストとし
て機能しているコンピュータ6(“故障したアプリケー
ションレイヤのホストコンピュータ”)上の全てのアプ
リケーションレイヤ及びプラットフォームレイヤプロセ
スグループ16、18、20、及び22が再初期化され
て再始動される。本発明の望ましい実施例においては、
この種の再初期化及び再始動は、故障したアプリケーシ
ョンレイヤのホストコンピュータ上で所定の時間期間の
間に所定の回数実行され得る。故障したアプリケーショ
ンレイヤのホストコンピュータ上の全てのプラットフォ
ームレイヤ及びアプリケーションレイヤプロセスグルー
プ16、18、20、及び22の再初期化及び再始動に
よっても故障が回復されない場合には、故障したアプリ
ケーションレイヤのホストコンピュータがリブートさ
れ、故障したアプリケーションレイヤのホストコンピュ
ータ上の全てのプロセスグループ14、16、18、2
0、及び22が再始動される。本発明の望ましい実施例
においては、故障したアプリケーションレイヤのホスト
コンピュータは、所定の時間期間の間に所定の回数リブ
ートされ得る。故障したアプリケーションレイヤのホス
トコンピュータのリブートによっても故障が回復されな
い場合には、独立コンピュータ4が故障したアプリケー
ションレイヤのホストコンピュータの電源を切断・投入
し、このことによって故障したアプリケーションレイヤ
のホストコンピュータをリブートする。本発明の望まし
い実施例においては、故障したアプリケーションレイヤ
のホストコンピュータは、所定の時間期間の間に所定の
回数リブートされ得る。故障したアプリケーションレイ
ヤのホストコンピュータの電源の切断・投入によっても
故障が回復されない場合には、独立コンピュータ4は故
障したアプリケーションレイヤのホストコンピュータの
電源を切断し、この故障したアプリケーションレイヤの
ホストコンピュータは電源が切断された状態に留まる。
【0043】アプリケーションレイヤプロセスグループ
18、20、及び22は、アプリケーションレイヤプロ
セスグループ18に依存する場合がある。それゆえ、ア
プリケーションレイヤプロセスグループ18、20ある
いは22における故障は、いかなるシステムレイヤプロ
セスグループ14あるいはプラットフォームレイヤプロ
セスグループ16の利用可能性に影響を与えない。アプ
リケーションレイヤプロセスグループ18、20あるい
は22における故障は、故障したアプリケーションレイ
ヤプロセスグループ18、20、あるいは22に依存し
ていないあらゆるアプリケーションレイヤプロセスグル
ープ18、20及び22の利用可能性にも影響を与えな
い。しかしながら、機能を停止したアプリケーションレ
イヤプロセスグループ18に依存している全てのアプリ
ケーションレイヤプロセスグループ18、20、及び2
2は、やはり機能を停止することになる。
【0044】故障したプライマリあるいはオルタネート
プロセスグループ20あるいは22が待機状態34にあ
り、これら故障したプロセスグループの再始動によって
も故障が回復しない場合には、故障回復手続きは、待機
状態34にある故障したプライマリあるいはオルタネー
トプロセスグループ20あるいは22を利用不可能状態
30に遷移させることによって停止させるように強化さ
れる。待機状態34にある故障したプライマリあるいは
オルタネートプロセスグループ20あるいは22を停止
させることが不可能な場合には、アプリケーションレイ
ヤプロセスグループ18、20、あるいは22を停止さ
せることが不可能な場合にインプリメントされる、前述
の強化された故障回復戦略がインプリメントされる。
【0045】待機状態34にあるアプリケーションレイ
ヤプロセスグループ20、あるいは22が依存している
リソースの故障が検出された場合、あるいは待機状態3
4にある再始動不能なプロセスグループ20あるいは2
2内のプロセス故障が検出された場合には、故障したリ
ソースに依存しているアプリケーションレイヤプロセス
グループ20あるいは22、もしくは故障が検出された
プロセスグループ20あるいは22は、利用不可能状態
30に遷移させられる。これらのプロセスグループ20
あるいは22をサービス停止にすることが不可能な場合
には、アプリケーションレイヤプロセスグループ18、
20、あるいは22を停止させることが不可能な場合に
インプリメントされる、前述の強化された故障回復戦略
がインプリメントされる。
【0046】プロセスグループマネージャ16は、個々
のプロセスグループ14、16、18、20、及び22
及び既知の重要なリソースを、(1)プロセスグループ
14、16、18、20、及び22に対するホストとし
て機能していて状態情報が関連しているコンピュータシ
ステム6に対してのみ、あるいは(2)緩やかに結合さ
れたコンピュータシステム6の全てに対して、知らしめ
るようにすることが可能である。さらに、この種の状態
情報は、外部のアプリケーションソフトウエアに対して
も入手可能にすることも可能である。
【0047】本発明の望ましい実施例においては、プロ
セスグループ状態間の遷移は、緩やかに結合されたコン
ピュータ6の各々において実行されているプロセスグル
ープ管理ソフトウエア10によって制御される。しかし
ながら、中央コンピュータ4及び緩やかに結合されたコ
ンピュータ6よりなるあらゆる順列及び/あるいは組み
合わせ上で実行されるプロセスグループ管理ソフトウエ
ア10によって制御されることも、本発明の技術的範疇
に含まれる。
【0048】システムレイヤプロセスグループ14は、
(1)通常の市販の計算システムに見出されるオペレー
ティングシステムソフトウエア及び/あるいはサービ
ス、あるいは(2)プロセスグループ管理ソフトウエア
10、のいずれかを含み得る。
【0049】プラットフォームレイヤプロセスグループ
16が依存しているリソースは、プラットフォームレイ
ヤプロセスグループ16が初期化される前に初期化され
る。プラットフォームレイヤリソースにサービスを提供
させることが失敗した場合には、ホストコンピュータ6
がリブートされ、プラットフォームレイヤプロセスグル
ープ16が依存しているリソースの故障に関して前述さ
れたものと同一の故障回復戦略が実行される。
【0050】初期化の間、プラットフォームレイヤプロ
セスグループ16及びアプリケーションレイヤプロセス
グループ18、20、及び22は、全てのプラットフォ
ームレイヤリソース及びプラットフォームレイヤプロセ
スグループ16が実行可能であると指定された場合にの
み、実行可能であると指定される。
【0051】プラットフォームレイヤプロセスグループ
16は、プラットフォームレイヤプロセスグループ16
のスタートアップシーケンスを制御する目的でプロセス
グループマネージャ10とハンドシェークを行なう。同
様に、アプリケーションレイヤプロセスグループ18、
20、及び22は、アプリケーションレイヤプロセスグ
ループ18、20、22のスタートアップシーケンスを
制御する目的でプロセスグループマネージャ10とハン
ドシェークを行なう。
【0052】アプリケーションレイヤプロセスグループ
18、20、及び22は、個別にオフライン状態38に
移行させられることが可能であり、オフライン状態にあ
るプロセスグループ18、20、及び22に対して、そ
れらオフライン状態にあるプロセスグループ18、2
0、及び22のホストとして機能しているコンピュータ
6上の他のプロセスグループに影響を与えることなく、
メンテナンスあるいはソフトウエアアップデートを行な
うことが可能である。
【0053】同一のプロセスグループ対24内のプライ
マリ及びオルタネートプロセスグループ20及び22
は、共通のリソース依存性を有する場合がある。アクテ
ィブ−コールドスタンバイ対という関係を有するプロセ
スグループ対24は、通常、高度の利用可能性を実現す
る。アクティブ−ホットスタンバイ対という関係を有す
るプロセスグループ対24は、通常、非常に高度な利用
可能性を実現する。
【0054】当業者には明らかであるが、プライマリ及
びオルタネートプロセスグループは、前述されたアクテ
ィブ36/待機34という関係と類似の、リードアクテ
ィブ/アクティブという関係に配置され得る。このこと
は、本発明の技術的範疇に含まれる。このようなリード
アクティブ/アクティブプロセスグループ対は、通常、
さらに非常に高い利用可能性を実現する。
【0055】個々の計算システム上のアプリケーション
レイヤリソースは、プライマリあるいはオルタネートプ
ロセスグループ20あるいは22を初期化する前に初期
化される。重要なアプリケーションレイヤリソースを機
能させることに失敗した場合には、それに依存している
アプリケーションレイヤプロセスグループ18、20、
あるいは22が、利用不可能状態30に遷移させられる
ことによって機能停止され、別個のコンピュータ6上
の、前記依存しているプロセスグループ20あるいは2
2と対になったプロセスグループ20あるいは22が存
在する場合には、それが起動される。
【0056】起動されたプラットフォームレイヤ及びア
プリケーションレイヤプロセスグループ16、18、2
0、及び22は、プロセスグループマネージャ10とハ
ンドシェークを行ない、アクティブ36あるいは待機3
4への起動に関するアクノレッジを行なう。
【0057】プロセスグループ対24は、プラットフォ
ームレイヤプロセスグループ16が、そのプロセスグル
ープ対24に含まれるプライマリプロセスグループ20
及びオルタネートプロセスグループ22の双方に対する
ホストとして機能しているコンピュータ6上で正常に動
作している場合にのみ、生成される。
【0058】プロセスグループマネージャ10による起
動の開始のアクノレッジにプライマリあるいはオルタネ
ートプロセスグループ20あるいは22が失敗した場合
には、起動が開始されたプライマリあるいはオルタネー
トプロセスグループ20あるいは22が利用不可能状態
30へ遷移させられる。同様に、アクティブ36から待
機34への停止処理の開始のアクノレッジにアプリケー
ションレイヤプライマリあるいはオルタネートプロセス
グループ20あるいは22が失敗した場合には、停止処
理が開始されたプライマリあるいはオルタネートプロセ
スグループ20あるいは22が利用不可能状態30へ遷
移させられる。
【0059】開始されたとしても、待機状態にあったプ
ロセスグループ20あるいは22の起動は、起動が開始
されている、その待機状態にあったプロセスグループ2
0あるいは22が、プロセスグループマネージャ10と
ハンドシェークを行なって起動の開始をアクノレッジす
るまでは、実際には行なわれない。
【0060】同一のプロセスグループ対24に属してい
るプライマリ及びオルタネートプロセスグループ20及
び22は、緩やかに結合されたコンピュータ6のいずれ
において実行されている他のプロセスグループ18、2
0、及び22に影響を及ぼすことなくメンテナンスを行
なうために、オフライン状態38に移行させられ得る。
【0061】同一のコンピュータ6あるいは相異なった
コンピュータ6上で実行されている個々のアプリケーシ
ョンレイヤプロセスグループ18、20、及び22は、
他の外部アプリケーションのホストとして機能すること
が可能である。例えば、単一あるいは複数個のアプリケ
ーションレイヤプロセスグループ18、20、あるいは
22が符号分割多重アクセス(CDMA)セルラ電話通
話処理を制御しており、単一あるいは複数個のプロセス
グループ18、20、あるいは22が時分割多重アクセ
ス(TDMA)セルラ電話通話処理を制御しており、単
一あるいは複数個のプロセスグループ18、20、ある
いは22がグループスペシャルモーバイル(GSM)セ
ルラ電話通話処理を制御しており、単一あるいは複数個
のプロセスグループ18、20、あるいは22がセルラ
デジタルパケットデータ(CDPD)セルラ電話通話処
理を制御しており、単一あるいは複数個のプロセスグル
ープ18、20、あるいは22がアナログ移動体電話サ
ービス(AMPS)セルラ電話通話処理を制御している
等である。同様に、同一のコンピュータ6あるいは相異
なったコンピュータ6上で実行されている個別のアプリ
ケーションレイヤプロセスグループ18、20、及び2
2は、別個の外部アプリケーションのホストとして機能
することが可能である。
【0062】当業者には明らかであるが、本発明は、2
つあるいはそれ以上の緩やかに結合されたコンピュータ
6に亘って単一あるいは複数個のプロセスグループ対2
4を、例えばアクティブ/待機、アクティブ/アクティ
ブ、及び通常のn+k間隔配置などを含む種々の高利用
可能性計算エレメント6配置に配置するフレキシビリテ
ィを有している。
【0063】以上の説明は、本発明の一実施例に関する
もので,この技術分野の当業者であれば、本発明の種々
の変形例が考え得るが、それらはいずれも本発明の技術
的範囲に包含される。
【0064】
【発明の効果】以上述べたごとく、本発明によれば、市
販の相互接続手段を用いて緩やかに結合された単一ある
いは複数個の市販の計算システムにわたって種々のレベ
ルの高利用可能性を同時に実現する計算システムアーキ
テクチャ及びその実現方法が提供される。
【図面の簡単な説明】
【図1】 4つの緩やかに結合させられたコンピュー
タ、独立したコンピュータ、及び管理端末を有する本発
明に係る計算システムを模式的に示すブロック図。
【図2】 本発明に係るプロセスグループが遷移してい
く状態シーケンスを模式的に示す図。
【符号の説明】
2 管理端末 4 独立コンピュータ 6 ホストコンピュータ 8 相互接続 10 プロセスグループマネージャ 12 インターフェース 13 システムレイヤ 14 システムレイヤプロセスグループ 15 プラットフォームレイヤ 16 プラットフォームレイヤプロセスグループ 17 アプリケーションレイヤ 18 アプリケーションレイヤプロセスグループ 20 プライマリアプリケーションレイヤプロセスグル
ープ 22 オルタネートアプリケーションレイヤプロセスグ
ループ 24 アプリケーションレイヤプロセスグループ対 30 利用不可能状態 32 初期化状態 34 待機状態 36 アクティブ状態
───────────────────────────────────────────────────── フロントページの続き (71)出願人 596077259 600 Mountain Avenue, Murray Hill, New Je rsey 07974−0636U.S.A. (72)発明者 デブラ ケー ハダッド アメリカ合衆国,60440 イリノイ,オー ロラ,アップルツリー レイン 1317 (72)発明者 スーザン エー リー アメリカ合衆国,60517 イリノイ,ウッ ドリッジ,スネード コート 6316 (72)発明者 ジョン エイチ ポクロピンスキー アメリカ合衆国,60517 イリノイ,ウッ ドリッジ,キャタルパ アベニュー 7824 (72)発明者 ボニー エル プロコポウィッズ アメリカ合衆国,60302 イリノイ,オー シャンパーク,フェアー オークス アベ ニュー (72)発明者 デール エフ ラサンデ アメリカ合衆国,60134 イリノイ,ジェ ネバ,クリスタル ツリー コート 1909 (72)発明者 ジェームス ピー スクーナバー アメリカ合衆国,60187−6536 イリノイ, ウェトン,ネルソン サークル 1319 (72)発明者 レイモンド ディー スミス アメリカ合衆国,60515 イリノイ,ダウ ナーズ グルーブ,ハイランド アベニュ ー 3944

Claims (88)

    【特許請求の範囲】
  1. 【請求項1】 高利用可能性アプリケーション実現方法
    において、当該方法が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する段階;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略(フォールトリカバリストラテ
    ジ)を有する単一あるいは複数個のプロセスを有してい
    る; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する段
    階; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて、少なくとも一つのプロセスグ
    ループを有するシステムレイヤを実現する段階; D.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする段階; E.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動(リブート)する段階; F.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する段階;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上の前記単一あるいは
    複数個のプロセスグループのうちの一つと対を構成して
    いる;及び、 G.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した場合に前記第二コンピュータ上
    で前記対になったプロセスグループを起動(アクティベ
    ート)する段階;を組み合わせて有することを特徴とす
    るアプリケーション実現方法。
  2. 【請求項2】 前記方法が、さらに、前記システムレイ
    ヤプロセスグループ故障を回復する目的での前記第一コ
    ンピュータの前記再起動が失敗した場合に前記第一コン
    ピュータの電源の切断・再投入を行なう目的で独立した
    コンピュータを用いる段階;を組み合わせて有すること
    を特徴とする請求項1記載のアプリケーション実現方
    法。
  3. 【請求項3】 前記方法が、さらに、前記システムレイ
    ヤプロセスグループ故障を回復する目的での前記第一コ
    ンピュータの前記前記第一コンピュータの電源の切断・
    再投入が失敗した場合に前記第一コンピュータの電源を
    切断する目的で独立したコンピュータを用いる段階;を
    組み合わせて有することを特徴とする請求項2記載のア
    プリケーション実現方法。
  4. 【請求項4】 高利用可能性アプリケーション実現方法
    において、当該方法が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する段階;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する段
    階; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて、少なくとも一つのプロセスグ
    ループを有するシステムレイヤを実現する段階; D.前記第一コンピュータ上の前記システムレイヤプロ
    セスグループのうちの少なくとも一つが依存しているリ
    ソースにおける故障が発生した場合に前記第一コンピュ
    ータ上の前記プロセスグループの全てを機能停止にする
    段階; E.前記第一コンピュータ上の前記システムレイヤプロ
    セスグループのうちの少なくとも一つが依存している前
    記リソースの前記故障の際に前記第一コンピュータを再
    起動する段階; F.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する段階;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上の前記プロセスグル
    ープのうちの一つと対を構成している;及び、 G.前記第一コンピュータ上の前記システムレイヤプロ
    セスグループのうちの少なくとも一つが依存している前
    記リソースの前記故障の際に前記第二コンピュータ上で
    前記対になったプロセスグループを起動する段階;を有
    することを特徴とするアプリケーション実現方法。
  5. 【請求項5】 前記方法が、さらに、前記第一コンピュ
    ータ上の前記システムレイヤプロセスグループのうちの
    少なくとも一つが依存している前記リソースの前記故障
    を回復する目的での前記第一コンピュータの前記再起動
    が失敗した場合に前記第一コンピュータの電源の切断・
    再投入を行なう独立コンピュータを用いる段階;を組み
    合わせて有することを特徴とする請求項4記載のアプリ
    ケーション実現方法。
  6. 【請求項6】 前記方法が、さらに、前記第一コンピュ
    ータ上の前記システムレイヤプロセスグループのうちの
    少なくとも一つが依存している前記リソースの前記故障
    を回復する目的での前記第一コンピュータの前記電源切
    断・再投入が失敗した場合に前記第一コンピュータの電
    源を切断する独立コンピュータを用いる段階;を組み合
    わせて有することを特徴とする請求項5記載のアプリケ
    ーション実現方法。
  7. 【請求項7】 高利用可能性アプリケーション実現方法
    において、当該方法が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する段階;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する段
    階; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて、少なくとも一つのプロセスグ
    ループを有するシステムレイヤを実現する段階; D.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする段階; E.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する段階; F.少なくとも前記第一コンピュータ上で少なくとも一
    つのプロセスグループを有するプラットフォームレイヤ
    を実現する段階; G.前記第一コンピュータ上でプラットフォームレイヤ
    プロセスグループ故障が発生した場合に前記第一コンピ
    ュータ上の、前記システムレイヤ内の前記少なくとも一
    つのプロセスグループの各々を除く全てのプロセスグル
    ープを機能停止にする段階; H.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する段階;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上の前記プロセスグル
    ープのうちの一つと対を構成している;及び、 I.前記第一コンピュータ上で前記プラットフォームレ
    イヤプロセスグループ故障が発生した場合に前記第二コ
    ンピュータ上で前記対になったプロセスグループを起動
    する段階;を組み合わせて有することを特徴とするアプ
    リケーション実現方法。
  8. 【請求項8】 前記方法が、さらに、前記第一コンピュ
    ータ上で前記プラットフォームレイヤプロセスグループ
    故障が発生した場合に、前記第一コンピュータ上の前記
    システムレイヤ内の前記少なくとも一つのプロセスグル
    ープの各々を除く全てのプロセスグループを再初期化
    (リイニシャライズ)する段階;を組み合わせて有する
    ことを特徴とする請求項7記載のアプリケーション実現
    方法。
  9. 【請求項9】 前記方法が、さらに、前記プラットフォ
    ームレイヤプロセスグループ故障を回復する目的の前記
    再初期化が失敗した場合に前記第一コンピュータを再起
    動する段階;を組み合わせて有することを特徴とする請
    求項8記載のアプリケーション実現方法。
  10. 【請求項10】 前記方法が、さらに、前記プラットフ
    ォームレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記再起動が失敗した場合に前
    記第一コンピュータの電源の切断・再投入を行なう独立
    コンピュータを用いる段階;を組み合わせて有すること
    を特徴とする請求項9記載のアプリケーション実現方
    法。
  11. 【請求項11】 前記方法が、さらに、前記プラットフ
    ォームレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記電源切断・再投入が失敗し
    た場合に前記第一コンピュータの電源を切断する独立コ
    ンピュータを用いる段階;を組み合わせて有することを
    特徴とする請求項10記載のアプリケーション実現方
    法。
  12. 【請求項12】 高利用可能性アプリケーション実現方
    法において、当該方法が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する段階;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する段
    階; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて、少なくとも一つのプロセスグ
    ループを有するシステムレイヤを実現する段階; D.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする段階; E.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する段階; F.前記少なくとも2つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも一つのプロセスグル
    ープを有するプラットフォームレイヤを実現する段階; G.前記第一コンピュータ上の前記プラットフォームレ
    イヤプロセスグループのうちの少なくとも一つが依存し
    ているリソースが故障した際に前記第一コンピュータ上
    の前記システムレイヤにおける前記少なくとも一つのプ
    ロセスグループのうちの各々を除く全ての前記プロセス
    を機能停止にする段階; H.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する段階;ここで、前記少なくとも一つの対
    になったプロセスグループは前記第一コンピュータ上の
    前記プロセスグループのうちの一つと対を構成ししてい
    る;及び、 I.前記第一コンピュータ上の前記プラットフォームレ
    イヤプロセスグループのうちの少なくとも一つが依存し
    ている前記リソースの前記故障の際に前記第二コンピュ
    ータ上の前記少なくとも一つの対になったプロセスグル
    ープを起動する段階;を有することを特徴とするアプリ
    ケーション実現方法。
  13. 【請求項13】 前記方法が、さらに、 A.前記故障を有する前記リソースを再初期化する段
    階;及び、 B.前記第一コンピュータ上の前記プラットフォームレ
    イヤプロセスグループのうちの少なくとも一つが依存し
    ている前記リソースの前記故障の際に前記第一コンピュ
    ータ上の前記システムレイヤにおける前記少なくとも一
    つのプロセスグループの各々を除く全てのプロセスを再
    初期化する段階;を組み合わせて有することを特徴とす
    る請求項12記載のアプリケーション実現方法。
  14. 【請求項14】 前記方法が、さらに、前記第一コンピ
    ュータ上の前記プラットフォームレイヤプロセスグルー
    プのうちの少なくとも一つが依存している前記リソース
    の前記故障を回復する目的での前記再初期化が失敗した
    場合に前記第一コンピュータを再起動する段階;を組み
    合わせて有することを特徴とする請求項13記載のアプ
    リケーション実現方法。
  15. 【請求項15】 前記方法が、さらに、前記第一コンピ
    ュータ上の前記プラットフォームレイヤプロセスグルー
    プのうちの少なくとも一つが依存している前記リソース
    の前記故障を回復する目的での前記第一コンピュータの
    前記再起動が失敗した場合に前記第一コンピュータの電
    源の切断・再投入を行なう独立コンピュータを用いる段
    階;を組み合わせて有することを特徴とする請求項14
    記載のアプリケーション実現方法。
  16. 【請求項16】 前記方法が、さらに、前記第一コンピ
    ュータ上の前記プラットフォームレイヤプロセスグルー
    プのうちの少なくとも一つが依存している前記リソース
    の前記故障を回復する目的での前記第一コンピュータの
    前記電源切断・再投入が失敗した場合に前記第一コンピ
    ュータの電源を切断する独立コンピュータを用いる段
    階;を組み合わせて有することを特徴とする請求項15
    記載のアプリケーション実現方法。
  17. 【請求項17】 高利用可能性アプリケーション実現方
    法において、当該方法が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する段階;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する段
    階; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて、少なくとも一つのプロセスグ
    ループを有するシステムレイヤを実現する段階; D.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする段階; E.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する段階; F.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも一つのプロセスグル
    ープを有するプラットフォームレイヤを実現する段階; G.前記第一コンピュータ上で発生したプラットフォー
    ムレイヤ故障の際に前記プラットフォームレイヤプロセ
    スグループのうちの少なくとも一つを再始動(リスター
    ト)する段階; H.前記プラットフォームレイヤ故障を回復する目的で
    の前記再始動が失敗した際に前記第一コンピュータ上の
    前記システムレイヤ内の前記少なくとも一つのプロセス
    グループの各々を除く前記プロセスグループの全てを機
    能停止にする段階; I.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する段階;ここで、前記少なくとも一つの対
    になったプロセスグループは前記第一コンピュータ上の
    前記プロセスグループのうちの一つと対を構成ししてい
    る;及び、 J.前記プラットフォームレイヤプロセスグループ故障
    を回復する目的での前記再始動が失敗した際に前記第二
    コンピュータ上の前記少なくとも一つの対になったプロ
    セスグループを起動する段階;を組み合わせて有するこ
    とを特徴とするアプリケーション実現方法。
  18. 【請求項18】 前記方法が、さらに、前記プラットフ
    ォームレイヤプロセスグループ故障を回復する目的での
    前記再始動が失敗した際に前記第一コンピュータ上の前
    記システムレイヤ内の前記少なくとも一つのプロセスグ
    ループの各々を除く前記プロセスグループの全てを再初
    期化する段階;を組み合わせて有することを特徴とする
    請求項17記載のアプリケーション実現方法。
  19. 【請求項19】 前記方法が、さらに、前記プラットフ
    ォームレイヤプロセスグループ故障を回復する目的での
    前記再初期化が失敗した際に前記第一コンピュータを再
    起動する段階;を組み合わせて有することを特徴とする
    請求項18記載のアプリケーション実現方法。
  20. 【請求項20】 前記方法が、さらに、前記プラットフ
    ォームレイヤプロセスグループ故障を回復する目的での
    前記再起動が失敗した際に前記第一コンピュータの電源
    を切断・再投入する目的で独立コンピュータを利用する
    段階;を組み合わせて有することを特徴とする請求項1
    9記載のアプリケーション実現方法。
  21. 【請求項21】 前記方法が、さらに、前記プラットフ
    ォームレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記電源切断・再投入が失敗し
    た際に前記第一コンピュータの電源を切断する目的で独
    立コンピュータを利用する段階;を組み合わせて有する
    ことを特徴とする請求項20記載のアプリケーション実
    現方法。
  22. 【請求項22】 高利用可能性アプリケーション実現方
    法において、当該方法が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する段階;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する段
    階; C.前記少なくとも第一コンピュータにおいて、少なく
    とも一つのプロセスグループを有するシステムレイヤを
    実現する段階; D.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする段階; E.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する段階; F.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも一つのプロセスグル
    ープを有するアプリケーションレイヤを実現する段階; G.前記第一コンピュータにおける前記少なくとも一つ
    のアプリケーションレイヤプロセスグループの故障の際
    に前記第一コンピュータ上の前記少なくとも一つのアプ
    リケーションレイヤプロセスグループを機能停止にする
    段階; H.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する段階;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上の機能停止にさせら
    れた前記少なくとも一つのアプリケーションレイヤプロ
    セスグループのうちの一つと対を構成している; I.前記第一コンピュータ上の前記少なくとも一つのア
    プリケーションレイヤプロセスグループの前記故障の際
    に前記第二コンピュータ上の前記対になったプロセス留
    グループを起動する段階;及び、 J.前記第一コンピュータ上の前記故障を有する前記ア
    プリケーションレイヤプロセスグループを機能停止にす
    ることが不可能である際に前記第一コンピュータ上の前
    記システムレイヤ内の前記少なくとも一つのプロセスグ
    ループの各々を除く前記プロセスグループの全てを再初
    期化する段階;を組み合わせて有することを特徴とする
    アプリケーション実現方法。
  23. 【請求項23】 前記方法が、さらに、前記アプリケー
    ションレイヤプロセスグループ故障を回復する目的での
    前記再初期化が失敗した際に前記第一コンピュータを再
    起動する段階;を組み合わせて有することを特徴とする
    請求項22記載のアプリケーション実現方法。
  24. 【請求項24】 前記方法が、さらに、前記アプリケー
    ションレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記再起動が失敗した際に前記
    第一コンピュータの電源を切断・再投入する目的で独立
    コンピュータを利用する段階;を組み合わせて有するこ
    とを特徴とする請求項23記載のアプリケーション実現
    方法。
  25. 【請求項25】 前記方法が、さらに、前記アプリケー
    ションレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記電源切断・再投入が失敗し
    た際に前記第一コンピュータの電源を切断する目的で独
    立コンピュータを利用する段階;を組み合わせて有する
    ことを特徴とする請求項24記載のアプリケーション実
    現方法。
  26. 【請求項26】 高利用可能性アプリケーション実現方
    法において、当該方法が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する段階;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する段
    階; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも二つのプロセスグル
    ープを有するアプリケーションレイヤを実現する段階; D.前記少なくとも二つのアプリケーションレイヤプロ
    セスグループのうちの少なくとも第二のものに対する前
    記少なくとも二つのアプリケーションレイヤプロセスグ
    ループのうちの少なくとも第一のものからの依存関係を
    規定する段階; E.前記第一コンピュータ上の前記第二アプリケーショ
    ンレイヤプロセスグループの故障の際に前記第一コンピ
    ュータ上の前記第一及び第二アプリケーションレ イヤプロセスグループを機能停止にする段階;F.前記
    少なくとも二つのコンピュータのうちの第二のものにお
    いて少なくとも一つの対になったプロセスグループを実
    現する段階;ここで、前記対になったプロセスグループ
    は前記第一コンピュータ上の前記第二アプリケーション
    レイヤプロセスグループと対を構成している;及び、 G.前記第一コンピュータ上の前記第二アプリケーショ
    ンレイヤプロセスグループの前記故障の際に前記第二コ
    ンピュータ上の前記対になったプロセスグループを起動
    する段階;を組み合わせて有することを特徴とするアプ
    リケーション実現方法。
  27. 【請求項27】 前記方法が、さらに、 A.少なくとも前記第一コンピュータにおいて少なくと
    も一つのプロセスグループを有するシステムレイヤを実
    現する段階; B.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする段階; C.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する段階;及び、 D.前記第一コンピュータ上の前記第一アプリケーショ
    ンレイヤプロセスグループを機能停止にすることが不可
    能である際に前記第一コンピュータ上の前記システムレ
    イヤ内の前記少なくとも一つのプロセスグループの各々
    を除く前記プロセスグループ全てを再初期化する段階;
    を組み合わせて有することを特徴とする請求項26記載
    のアプリケーション実現方法。
  28. 【請求項28】 前記方法が、さらに、前記第二アプリ
    ケーションレイヤプロセスグループの前記故障を回復す
    る目的での前記再初期化が失敗した際に前記第一コンピ
    ュータを再起動する段階;を組み合わせて有することを
    特徴とする請求項27記載のアプリケーション実現方
    法。
  29. 【請求項29】 前記方法が、さらに、前記第二アプリ
    ケーションレイヤプロセスグループの前記故障を回復す
    る目的での前記第一コンピュータの前記再起動が失敗し
    た際に前記第一コンピュータの電源を切断・再投入する
    目的で独立コンピュータを利用する段階;を組み合わせ
    て有することを特徴とする請求項28記載のアプリケー
    ション実現方法。
  30. 【請求項30】 前記方法が、さらに、前記第二アプリ
    ケーションレイヤプロセスグループの前記故障を回復す
    る目的での前記第一コンピュータの前記電源切断・再投
    入が失敗した際に前記第一コンピュータの電源を切断す
    る目的で独立コンピュータを利用する段階;を組み合わ
    せて有することを特徴とする請求項29記載のアプリケ
    ーション実現方法。
  31. 【請求項31】 高利用可能性アプリケーション実現方
    法において、当該方法が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する段階;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する段
    階; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも二つのプロセスグル
    ープを有するアプリケーションレイヤを実現する段階; D.前記少なくとも一つのアプリケーションレイヤプロ
    セスグループが依存しているリソースの故障の際に前記
    第一コンピュータ上の前記少なくとも一つのアプリケー
    ションレイヤプロセスグループを機能停止にする段階; E.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する段階;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上の前記少なくとも一
    つのアプリケーションレイヤプロセスグループのうちの
    一つと対を構成している;及び、 F.前記少なくとも一つのアプリケーションレイヤプロ
    セスグループが依存している前記リソースの前記故障の
    際に前記第二コンピュータ上の前記対になったプロセス
    グループを起動する段階;を組み合わせて有することを
    特徴とするアプリケーション実現方法。
  32. 【請求項32】 前記方法が、さらに、 A.少なくとも前記第一コンピュータにおいて少なくと
    も一つのプロセスグループを有するシステムレイヤを実
    現する段階; B.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする段階; C.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する段階; D.前記故障を有する前記リソースを再初期化する段
    階;及び、 E.前記第一コンピュータ上の前記少なくとも一つのア
    プリケーションレイヤプロセスグループを機能停止にす
    ることが不可能である場合に前記第一コンピュータ上の
    前記システムレイヤ内の前記少なくとも一つのプロセス
    グループの各々を除く前記プロセスグループ全てを再初
    期化する段階;を組み合わせて有することを特徴とする
    請求項31記載のアプリケーション実現方法。
  33. 【請求項33】前記方法が、さらに、前記少なくとも一
    つのアプリケーションレイヤプロセスグループが依存し
    ている前記リソースの前記故障を回復する目的での前記
    再初期化が失敗した際に前記第一コンピュータを再起動
    する段階;を組み合わせて有することを特徴とする請求
    項32記載のアプリケーション実現方法。
  34. 【請求項34】前記方法が、さらに、前記少なくとも一
    つのアプリケーションレイヤプロセスグループが依存し
    ている前記リソースの前記故障を回復する目的での前記
    第一コンピュータの前記再起動が失敗した際に前記第一
    コンピュータの電源を切断・再投入する目的で独立コン
    ピュータを利用する段階;を組み合わせて有することを
    特徴とする請求項33記載のアプリケーション実現方
    法。
  35. 【請求項35】前記方法が、さらに、前記少なくとも一
    つのアプリケーションレイヤプロセスグループが依存し
    ている前記リソースの前記故障を回復する目的での前記
    第一コンピュータの前記電源切断・再投入がが失敗した
    際に前記第一コンピュータの電源を切断する目的で独立
    コンピュータを利用する段階;を組み合わせて有するこ
    とを特徴とする請求項34記載のアプリケーション実現
    方法。
  36. 【請求項36】 高利用可能性アプリケーション実現方
    法において、当該方法が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する段階;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する段
    階; C.前記少なくとも第一コンピュータにおいて、少なく
    とも一つのプロセスグループを有するシステムレイヤを
    実現する段階; D.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする段階; E.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する段階; F.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも一つのプロセスグル
    ープを有するアプリケーションレイヤを実現する段階; G.前記少なくとも一つのアプリケーションレイヤプロ
    セスグループにおける故障の際に前記第一コンピュータ
    上の前記少なくとも一つのアプリケーションレイヤプロ
    セスグループを再始動する段階; H.前記少なくとも一つのアプリケーションレイヤプロ
    セスグループにおける前記故障を回復する目的での前記
    再始動が失敗した際に前記第一コンピュータ上の前記少
    なくとも一つのアプリケーションレイヤプロセスグルー
    プを機能停止にする段階; I.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する段階;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上で機能停止にさせら
    れた前記少なくとも一つのアプリケーションレイヤプロ
    セスグループのうちの一つと対を構成している; J.前記第一コンピュータ上の機能停止にさせられた前
    記少なくとも一つのアプリケーションレイヤプロセスグ
    ループの前記故障を回復する目的での前記再始動が失敗
    した際に前記第二コンピュータ上の前記対になったプロ
    セスグループを起動する段階;及び、 K.前記第一コンピュータ上の前記欠陥を有する前記ア
    プリケーションレイヤプロセスグループを機能停止にす
    ることが不可能である場合に前記第一コンピュータ上の
    前記システムレイヤ内の前記少なくとも一つのプロセス
    グループの各々を除く前記プロセスグループ全てを再初
    期化する段階;を組み合わせて有することを特徴とする
    アプリケーション実現方法。
  37. 【請求項37】 前記方法が、さらに、前記アプリケー
    ションレイヤプロセスグループ故障を回復する目的での
    前記再初期化が失敗した場合に前記第一コンピュータを
    再起動する段階;を組み合わせて有することを特徴とす
    る請求項36記載のアプリケーション実現方法。
  38. 【請求項38】 前記方法が、さらに、前記アプリケー
    ションレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記再起動が失敗した場合に前
    記第一コンピュータの電源を切断・再投入する目的で独
    立コンピュータを利用する段階;を組み合わせて有する
    ことを特徴とする請求項37記載のアプリケーション実
    現方法。
  39. 【請求項39】 前記方法が、さらに、前記アプリケー
    ションレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記電源切断・再投入が失敗し
    た場合に前記第一コンピュータの電源を切断する目的で
    独立コンピュータを利用する段階;を組み合わせて有す
    ることを特徴とする請求項38記載のアプリケーション
    実現方法。
  40. 【請求項40】 高利用可能性アプリケーション実現方
    法において、当該方法が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する段階;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する段
    階; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも二つのプロセスグル
    ープを有するアプリケーションレイヤを実現する段階; D.前記少なくとも二つのアプリケーションレイヤプロ
    セスグループのうちの少なくとも第二のものに対する前
    記少なくとも二つのアプリケーションレイヤプロセスグ
    ループのうちの少なくとも第一のものからの依存関係を
    規定する段階; E.前記第二アプリケーションレイヤプロセスグループ
    内の故障の際に前記第一コンピュータ上の前記第二アプ
    リケーションレイヤプロセスグループを再始動する段
    階; F.前記第一コンピュータ上の前記第二アプリケーショ
    ンレイヤプロセスグループの故障の際に前記第一コンピ
    ュータ上の前記第一及び第二アプリケーションレイヤプ
    ロセスグループを機能停止にする段階; G.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する段階;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上の前記第二アプリケ
    ーションレイヤプロセスグループと対を構成している;
    及び、 H.前記第二アプリケーションレイヤプロセスグループ
    内の前記故障を回復する目的での前記再始動が失敗した
    際に前記第二コンピュータ上の前記少なくとも一つの対
    になったプロセスグループを起動する段階;を組み合わ
    せて有することを特徴とするアプリケーション実現方
    法。
  41. 【請求項41】 前記方法が、さらに、 A.少なくとも前記第一コンピュータにおいて少なくと
    も一つのプロセスグループを有するシステムレイヤを実
    現する段階; B.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする段階; C.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する段階;及び、 D.前記第一コンピュータ上の前記第一アプリケーショ
    ンレイヤプロセスグループを機能停止にすることが不可
    能である際に前記第一コンピュータ上の前記システムレ
    イヤ内の前記少なくとも一つのプロセスグループの各々
    を除く前記プロセスグループ全てを再初期化する段階;
    を組み合わせて有することを特徴とする請求項40記載
    のアプリケーション実現方法。
  42. 【請求項42】 前記方法が、さらに、前記第二アプリ
    ケーションレイヤプロセスグループの前記故障を回復す
    る目的での前記再初期化が失敗した際に前記第一コンピ
    ュータを再起動する段階;を組み合わせて有することを
    特徴とする請求項41記載のアプリケーション実現方
    法。
  43. 【請求項43】 前記方法が、さらに、前記第二アプリ
    ケーションレイヤプロセスグループの前記故障を回復す
    る目的での前記第一コンピュータの前記再起動が失敗し
    た際に前記第一コンピュータの電源を切断・再投入する
    目的で独立コンピュータを利用する段階;を組み合わせ
    て有することを特徴とする請求項42記載のアプリケー
    ション実現方法。
  44. 【請求項44】 前記方法が、さらに、前記第二アプリ
    ケーションレイヤプロセスグループの前記故障を回復す
    る目的での前記第一コンピュータの前記電源切断・再投
    入が失敗した際に前記第一コンピュータの電源を切断す
    る目的で独立コンピュータを利用する段階;を組み合わ
    せて有することを特徴とする請求項43記載のアプリケ
    ーション実現方法。
  45. 【請求項45】 高利用可能性アプリケーション実現装
    置において、当該装置が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する手段;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略(フォールトリカバリストラテ
    ジ)を有する単一あるいは複数個のプロセスを有してい
    る; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する手
    段; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて、少なくとも一つのプロセスグ
    ループを有するシステムレイヤを実現する手段; D.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする手段; E.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動(リブート)する手段; F.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する手段;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上の前記単一あるいは
    複数個のプロセスグループのうちの一つと対を構成して
    いる;及び、 G.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した場合に前記第二コンピュータ上
    で前記対になったプロセスグループを起動(アクティベ
    ート)する手段;を組み合わせて有することを特徴とす
    るアプリケーション実現装置。
  46. 【請求項46】 前記装置が、さらに、前記システムレ
    イヤプロセスグループ故障を回復する目的での前記第一
    コンピュータの前記再起動が失敗した場合に前記第一コ
    ンピュータの電源の切断・再投入を行なう目的で独立し
    たコンピュータを用いる手段;を組み合わせて有するこ
    とを特徴とする請求項45記載のアプリケーション実現
    装置。
  47. 【請求項47】 前記装置が、さらに、前記システムレ
    イヤプロセスグループ故障を回復する目的での前記第一
    コンピュータの前記前記第一コンピュータの電源の切断
    ・再投入が失敗した場合に前記第一コンピュータの電源
    を切断する目的で独立したコンピュータを用いる手段;
    を組み合わせて有することを特徴とする請求項46記載
    のアプリケーション実現装置。
  48. 【請求項48】 高利用可能性アプリケーション実現装
    置において、当該装置が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する手段;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する手
    段; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて、少なくとも一つのプロセスグ
    ループを有するシステムレイヤを実現する手段; D.前記第一コンピュータ上の前記システムレイヤプロ
    セスグループのうちの少なくとも一つが依存しているリ
    ソースにおける故障が発生した場合に前記第一コンピュ
    ータ上の前記プロセスグループの全てを機能停止にする
    手段; E.前記第一コンピュータ上の前記システムレイヤプロ
    セスグループのうちの少なくとも一つが依存している前
    記リソースの前記故障の際に前記第一コンピュータを再
    起動する手段; F.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する手段;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上の前記プロセスグル
    ープのうちの一つと対を構成している;及び、 G.前記第一コンピュータ上の前記システムレイヤプロ
    セスグループのうちの少なくとも一つが依存している前
    記リソースの前記故障の際に前記第二コンピュータ上で
    前記対になったプロセスグループを起動する手段;を有
    することを特徴とするアプリケーション実現装置。
  49. 【請求項49】 前記装置が、さらに、前記第一コンピ
    ュータ上の前記システムレイヤプロセスグループのうち
    の少なくとも一つが依存している前記リソースの前記故
    障を回復する目的での前記第一コンピュータの前記再起
    動が失敗した場合に前記第一コンピュータの電源の切断
    ・再投入を行なう独立コンピュータを用いる手段;を組
    み合わせて有することを特徴とする請求項48記載のア
    プリケーション実現装置。
  50. 【請求項50】 前記装置が、さらに、前記第一コンピ
    ュータ上の前記システムレイヤプロセスグループのうち
    の少なくとも一つが依存している前記リソースの前記故
    障を回復する目的での前記第一コンピュータの前記電源
    切断・再投入が失敗した場合に前記第一コンピュータの
    電源を切断する独立コンピュータを用いる手段;を組み
    合わせて有することを特徴とする請求項49記載のアプ
    リケーション実現装置。
  51. 【請求項51】 高利用可能性アプリケーション実現装
    置において、当該装置が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する手段;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する手
    段; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて、少なくとも一つのプロセスグ
    ループを有するシステムレイヤを実現する手段; D.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする手段; E.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する手段; F.少なくとも前記第一コンピュータ上で少なくとも一
    つのプロセスグループを有するプラットフォームレイヤ
    を実現する手段; G.前記第一コンピュータ上でプラットフォームレイヤ
    プロセスグループ故障が発生した場合に前記第一コンピ
    ュータ上の、前記システムレイヤ内の前記少なくとも一
    つのプロセスグループの各々を除く全てのプロセスグル
    ープを機能停止にする手段; H.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する手段;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上の前記プロセスグル
    ープのうちの一つと対を構成している;及び、 I.前記第一コンピュータ上で前記プラットフォームレ
    イヤプロセスグループ故障が発生した場合に前記第二コ
    ンピュータ上で前記対になったプロセスグループを起動
    する手段;を組み合わせて有することを特徴とするアプ
    リケーション実現装置。
  52. 【請求項52】 前記装置が、さらに、前記第一コンピ
    ュータ上で前記プラットフォームレイヤプロセスグルー
    プ故障が発生した場合に、前記第一コンピュータ上の前
    記システムレイヤ内の前記少なくとも一つのプロセスグ
    ループの各々を除く全てのプロセスグループを再初期化
    (リイニシャライズ)する手段;を組み合わせて有する
    ことを特徴とする請求項51記載のアプリケーション実
    現装置。
  53. 【請求項53】 前記装置が、さらに、前記プラットフ
    ォームレイヤプロセスグループ故障を回復する目的の前
    記再初期化が失敗した場合に前記第一コンピュータを再
    起動する手段;を組み合わせて有することを特徴とする
    請求項52記載のアプリケーション実現装置。
  54. 【請求項54】 前記装置が、さらに、前記プラットフ
    ォームレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記再起動が失敗した場合に前
    記第一コンピュータの電源の切断・再投入を行なう独立
    コンピュータを用いる手段;を組み合わせて有すること
    を特徴とする請求項53記載のアプリケーション実現装
    置。
  55. 【請求項55】 前記装置が、さらに、前記プラットフ
    ォームレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記電源切断・再投入が失敗し
    た場合に前記第一コンピュータの電源を切断する独立コ
    ンピュータを用いる手段;を組み合わせて有することを
    特徴とする請求項54記載のアプリケーション実現装
    置。
  56. 【請求項56】 高利用可能性アプリケーション実現装
    置において、当該装置が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する手段;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する手
    段; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて、少なくとも一つのプロセスグ
    ループを有するシステムレイヤを実現する手段; D.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする手段; E.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する手段; F.前記少なくとも2つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも一つのプロセスグル
    ープを有するプラットフォームレイヤを実現する手段; G.前記第一コンピュータ上の前記プラットフォームレ
    イヤプロセスグループのうちの少なくとも一つが依存し
    ているリソースが故障した際に前記第一コンピュータ上
    の前記システムレイヤにおける前記少なくとも一つのプ
    ロセスグループのうちの各々を除く全ての前記プロセス
    を機能停止にする手段; H.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する手段;ここで、前記少なくとも一つの対
    になったプロセスグループは前記第一コンピュータ上の
    前記プロセスグループのうちの一つと対を構成ししてい
    る;及び、 I.前記第一コンピュータ上の前記プラットフォームレ
    イヤプロセスグループのうちの少なくとも一つが依存し
    ている前記リソースの前記故障の際に前記第二コンピュ
    ータ上の前記少なくとも一つの対になったプロセスグル
    ープを起動する手段;を有することを特徴とするアプリ
    ケーション実現装置。
  57. 【請求項57】 前記装置が、さらに、 A.前記故障を有する前記リソースを再初期化する手
    段;及び、 B.前記第一コンピュータ上の前記プラットフォームレ
    イヤプロセスグループのうちの少なくとも一つが依存し
    ている前記リソースの前記故障の際に前記第一コンピュ
    ータ上の前記システムレイヤにおける前記少なくとも一
    つのプロセスグループの各々を除く全てのプロセスを再
    初期化する手段;を組み合わせて有することを特徴とす
    る請求項56記載のアプリケーション実現装置。
  58. 【請求項58】 前記装置が、さらに、前記第一コンピ
    ュータ上の前記プラットフォームレイヤプロセスグルー
    プのうちの少なくとも一つが依存している前記リソース
    の前記故障を回復する目的での前記再初期化が失敗した
    場合に前記第一コンピュータを再起動する手段;を組み
    合わせて有することを特徴とする請求項57記載のアプ
    リケーション実現装置。
  59. 【請求項59】 前記装置が、さらに、前記第一コンピ
    ュータ上の前記プラットフォームレイヤプロセスグルー
    プのうちの少なくとも一つが依存している前記リソース
    の前記故障を回復する目的での前記第一コンピュータの
    前記再起動が失敗した場合に前記第一コンピュータの電
    源の切断・再投入を行なう独立コンピュータを用いる手
    段;を組み合わせて有することを特徴とする請求項58
    記載のアプリケーション実現装置。
  60. 【請求項60】 前記装置が、さらに、前記第一コンピ
    ュータ上の前記プラットフォームレイヤプロセスグルー
    プのうちの少なくとも一つが依存している前記リソース
    の前記故障を回復する目的での前記第一コンピュータの
    前記電源切断・再投入が失敗した場合に前記第一コンピ
    ュータの電源を切断する独立コンピュータを用いる手
    段;を組み合わせて有することを特徴とする請求項59
    記載のアプリケーション実現装置。
  61. 【請求項61】 高利用可能性アプリケーション実現装
    置において、当該装置が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する手段;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する手
    段; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて、少なくとも一つのプロセスグ
    ループを有するシステムレイヤを実現する手段; D.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする手段; E.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する手段; F.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも一つのプロセスグル
    ープを有するプラットフォームレイヤを実現する手段; G.前記第一コンピュータ上で発生したプラットフォー
    ムレイヤ故障の際に前記プラットフォームレイヤプロセ
    スグループのうちの少なくとも一つを再始動(リスター
    ト)する手段; H.前記プラットフォームレイヤ故障を回復する目的で
    の前記再始動が失敗した際に前記第一コンピュータ上の
    前記システムレイヤ内の前記少なくとも一つのプロセス
    グループの各々を除く前記プロセスグループの全てを機
    能停止にする手段; I.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する手段;ここで、前記少なくとも一つの対
    になったプロセスグループは前記第一コンピュータ上の
    前記プロセスグループのうちの一つと対を構成ししてい
    る;及び、 J.前記プラットフォームレイヤプロセスグループ故障
    を回復する目的での前記再始動が失敗した際に前記第二
    コンピュータ上の前記少なくとも一つの対になったプロ
    セスグループを起動する手段;を組み合わせて有するこ
    とを特徴とするアプリケーション実現装置。
  62. 【請求項62】 前記装置が、さらに、前記プラットフ
    ォームレイヤプロセスグループ故障を回復する目的での
    前記再始動が失敗した際に前記第一コンピュータ上の前
    記システムレイヤ内の前記少なくとも一つのプロセスグ
    ループの各々を除く前記プロセスグループの全てを再初
    期化する手段;を組み合わせて有することを特徴とする
    請求項61記載のアプリケーション実現装置。
  63. 【請求項63】 前記装置が、さらに、前記プラットフ
    ォームレイヤプロセスグループ故障を回復する目的での
    前記再初期化が失敗した際に前記第一コンピュータを再
    起動する手段;を組み合わせて有することを特徴とする
    請求項62記載のアプリケーション実現装置。
  64. 【請求項64】 前記装置が、さらに、前記プラットフ
    ォームレイヤプロセスグループ故障を回復する目的での
    前記再起動が失敗した際に前記第一コンピュータの電源
    を切断・再投入する目的で独立コンピュータを利用する
    手段;を組み合わせて有することを特徴とする請求項6
    3記載のアプリケーション実現装置。
  65. 【請求項65】 前記装置が、さらに、前記プラットフ
    ォームレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記電源切断・再投入が失敗し
    た際に前記第一コンピュータの電源を切断する目的で独
    立コンピュータを利用する手段;を組み合わせて有する
    ことを特徴とする請求項64記載のアプリケーション実
    現装置。
  66. 【請求項66】 高利用可能性アプリケーション実現装
    置において、当該装置が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する手段;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する手
    段; C.前記少なくとも第一コンピュータにおいて、少なく
    とも一つのプロセスグループを有するシステムレイヤを
    実現する手段; D.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする手段; E.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する手段; F.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも一つのプロセスグル
    ープを有するアプリケーションレイヤを実現する手段; G.前記第一コンピュータにおける前記少なくとも一つ
    のアプリケーションレイヤプロセスグループの故障の際
    に前記第一コンピュータ上の前記少なくとも一つのアプ
    リケーションレイヤプロセスグループを機能停止にする
    手段; H.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する手段;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上の機能停止にさせら
    れた前記少なくとも一つのアプリケーションレイヤプロ
    セスグループのうちの一つと対を構成している; I.前記第一コンピュータ上の前記少なくとも一つのア
    プリケーションレイヤプロセスグループの前記故障の際
    に前記第二コンピュータ上の前記対になったプロセス留
    グループを起動する手段;及び、 J.前記第一コンピュータ上の前記故障を有する前記ア
    プリケーションレイヤプロセスグループを機能停止にす
    ることが不可能である際に前記第一コンピュータ上の前
    記システムレイヤ内の前記少なくとも一つのプロセスグ
    ループの各々を除く前記プロセスグループの全てを再初
    期化する手段;を組み合わせて有することを特徴とする
    アプリケーション実現装置。
  67. 【請求項67】 前記装置が、さらに、前記アプリケー
    ションレイヤプロセスグループ故障を回復する目的での
    前記再初期化が失敗した際に前記第一コンピュータを再
    起動する手段;を組み合わせて有することを特徴とする
    請求項66記載のアプリケーション実現装置。
  68. 【請求項68】 前記装置が、さらに、前記アプリケー
    ションレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記再起動が失敗した際に前記
    第一コンピュータの電源を切断・再投入する目的で独立
    コンピュータを利用する手段;を組み合わせて有するこ
    とを特徴とする請求項67記載のアプリケーション実現
    装置。
  69. 【請求項69】 前記装置が、さらに、前記アプリケー
    ションレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記電源切断・再投入が失敗し
    た際に前記第一コンピュータの電源を切断する目的で独
    立コンピュータを利用する手段;を組み合わせて有する
    ことを特徴とする請求項68記載のアプリケーション実
    現装置。
  70. 【請求項70】 高利用可能性アプリケーション実現装
    置において、当該装置が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する手段;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している;B.前記少なくとも二つのコンピ
    ュータのうちの少なくとも一つにおいて、前記単一ある
    いは複数個のプロセスグループのうちの少なくとも一つ
    に対する故障回復戦略を開始するプロセスグループマネ
    ージャを実行する手段; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも二つのプロセスグル
    ープを有するアプリケーションレイヤを実現する手段; D.前記少なくとも二つのアプリケーションレイヤプロ
    セスグループのうちの少なくとも第二のものに対する前
    記少なくとも二つのアプリケーションレイヤプロセスグ
    ループのうちの少なくとも第一のものからの依存関係を
    規定する手段; E.前記第一コンピュータ上の前記第二アプリケーショ
    ンレイヤプロセスグループの故障の際に前記第一コンピ
    ュータ上の前記第一及び第二アプリケーションレイヤプ
    ロセスグループを機能停止にする手段; F.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する手段;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上の前記第二アプリケ
    ーションレイヤプロセスグループと対を構成している;
    及び、 G.前記第一コンピュータ上の前記第二アプリケーショ
    ンレイヤプロセスグループの前記故障の際に前記第二コ
    ンピュータ上の前記対になったプロセスグループを起動
    する手段;を組み合わせて有することを特徴とするアプ
    リケーション実現装置。
  71. 【請求項71】 前記装置が、さらに、 A.少なくとも前記第一コンピュータにおいて少なくと
    も一つのプロセスグループを有するシステムレイヤを実
    現する手段; B.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする手段; C.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する手段;及び、 D.前記第一コンピュータ上の前記第一アプリケーショ
    ンレイヤプロセスグループを機能停止にすることが不可
    能である際に前記第一コンピュータ上の前記システムレ
    イヤ内の前記少なくとも一つのプロセスグループの各々
    を除く前記プロセスグループ全てを再初期化する手段;
    を組み合わせて有することを特徴とする請求項70記載
    のアプリケーション実現装置。
  72. 【請求項72】 前記装置が、さらに、前記第二アプリ
    ケーションレイヤプロセスグループの前記故障を回復す
    る目的での前記再初期化が失敗した際に前記第一コンピ
    ュータを再起動する手段;を組み合わせて有することを
    特徴とする請求項71記載のアプリケーション実現装
    置。
  73. 【請求項73】 前記装置が、さらに、前記第二アプリ
    ケーションレイヤプロセスグループの前記故障を回復す
    る目的での前記第一コンピュータの前記再起動が失敗し
    た際に前記第一コンピュータの電源を切断・再投入する
    目的で独立コンピュータを利用する手段;を組み合わせ
    て有することを特徴とする請求項72記載のアプリケー
    ション実現装置。
  74. 【請求項74】 前記装置が、さらに、前記第二アプリ
    ケーションレイヤプロセスグループの前記故障を回復す
    る目的での前記第一コンピュータの前記電源切断・再投
    入が失敗した際に前記第一コンピュータの電源を切断す
    る目的で独立コンピュータを利用する手段;を組み合わ
    せて有することを特徴とする請求項73記載のアプリケ
    ーション実現装置。
  75. 【請求項75】 高利用可能性アプリケーション実現装
    置において、当該装置が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する手段;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する手
    段; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも二つのプロセスグル
    ープを有するアプリケーションレイヤを実現する手段; D.前記少なくとも一つのアプリケーションレイヤプロ
    セスグループが依存しているリソースの故障の際に前記
    第一コンピュータ上の前記少なくとも一つのアプリケー
    ションレイヤプロセスグループを機能停止にする手段; E.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する手段;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上の前記少なくとも一
    つのアプリケーションレイヤプロセスグループのうちの
    一つと対を構成している;及び、 F.前記少なくとも一つのアプリケーションレイヤプロ
    セスグループが依存している前記リソースの前記故障の
    際に前記第二コンピュータ上の前記対になったプロセス
    グループを起動する手段;を組み合わせて有することを
    特徴とするアプリケーション実現装置。
  76. 【請求項76】 前記装置が、さらに、 A.少なくとも前記第一コンピュータにおいて少なくと
    も一つのプロセスグループを有するシステムレイヤを実
    現する手段; B.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする手段; C.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する手段; D.前記故障を有する前記リソースを再初期化する手
    段;及び、 E.前記第一コンピュータ上の前記少なくとも一つのア
    プリケーションレイヤプロセスグループを機能停止にす
    ることが不可能である場合に前記第一コンピュータ上の
    前記システムレイヤ内の前記少なくとも一つのプロセス
    グループの各々を除く前記プロセスグループ全てを再初
    期化する手段;を組み合わせて有することを特徴とする
    請求項75記載のアプリケーション実現装置。
  77. 【請求項77】前記装置が、さらに、前記少なくとも一
    つのアプリケーションレイヤプロセスグループが依存し
    ている前記リソースの前記故障を回復する目的での前記
    再初期化が失敗した際に前記第一コンピュータを再起動
    する手段;を組み合わせて有することを特徴とする請求
    項76記載のアプリケーション実現装置。
  78. 【請求項78】前記装置が、さらに、前記少なくとも一
    つのアプリケーションレイヤプロセスグループが依存し
    ている前記リソースの前記故障を回復する目的での前記
    第一コンピュータの前記再起動が失敗した際に前記第一
    コンピュータの電源を切断・再投入する目的で独立コン
    ピュータを利用する手段;を組み合わせて有することを
    特徴とする請求項77記載のアプリケーション実現装
    置。
  79. 【請求項79】前記装置が、さらに、前記少なくとも一
    つのアプリケーションレイヤプロセスグループが依存し
    ている前記リソースの前記故障を回復する目的での前記
    第一コンピュータの前記電源切断・再投入がが失敗した
    際に前記第一コンピュータの電源を切断する目的で独立
    コンピュータを利用する手段;を組み合わせて有するこ
    とを特徴とする請求項78記載のアプリケーション実現
    装置。
  80. 【請求項80】 高利用可能性アプリケーション実現装
    置において、当該装置が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する手段;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する手
    段; C.前記少なくとも第一コンピュータにおいて、少なく
    とも一つのプロセスグループを有するシステムレイヤを
    実現する手段; D.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする手段; E.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する手段; F.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも一つのプロセスグル
    ープを有するアプリケーションレイヤを実現する手段; G.前記少なくとも一つのアプリケーションレイヤプロ
    セスグループにおける故障の際に前記第一コンピュータ
    上の前記少なくとも一つのアプリケーションレイヤプロ
    セスグループを再始動する手段; H.前記少なくとも一つのアプリケーションレイヤプロ
    セスグループにおける前記故障を回復する目的での前記
    再始動が失敗した際に前記第一コンピュータ上の前記少
    なくとも一つのアプリケーションレイヤプロセスグルー
    プを機能停止にする手段; I.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する手段;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上で機能停止にさせら
    れた前記少なくとも一つのアプリケーションレイヤプロ
    セスグループのうちの一つと対を構成している; J.前記第一コンピュータ上の機能停止にさせられた前
    記少なくとも一つのアプリケーションレイヤプロセスグ
    ループの前記故障を回復する目的での前記再始動が失敗
    した際に前記第二コンピュータ上の前記対になったプロ
    セスグループを起動する手段;及び、 K.前記第一コンピュータ上の前記欠陥を有する前記ア
    プリケーションレイヤプロセスグループを機能停止にす
    ることが不可能である場合に前記第一コンピュータ上の
    前記システムレイヤ内の前記少なくとも一つのプロセス
    グループの各々を除く前記プロセスグループ全てを再初
    期化する手段;を組み合わせて有することを特徴とする
    アプリケーション実現装置。
  81. 【請求項81】 前記装置が、さらに、前記アプリケー
    ションレイヤプロセスグループ故障を回復する目的での
    前記再初期化が失敗した場合に前記第一コンピュータを
    再起動する手段;を組み合わせて有することを特徴とす
    る請求項80記載のアプリケーション実現装置。
  82. 【請求項82】 前記装置が、さらに、前記アプリケー
    ションレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記再起動が失敗した場合に前
    記第一コンピュータの電源を切断・再投入する目的で独
    立コンピュータを利用する手段;を組み合わせて有する
    ことを特徴とする請求項81記載のアプリケーション実
    現装置。
  83. 【請求項83】 前記装置が、さらに、前記アプリケー
    ションレイヤプロセスグループ故障を回復する目的での
    前記第一コンピュータの前記電源切断・再投入が失敗し
    た場合に前記第一コンピュータの電源を切断する目的で
    独立コンピュータを利用する手段;を組み合わせて有す
    ることを特徴とする請求項82記載のアプリケーション
    実現装置。
  84. 【請求項84】 高利用可能性アプリケーション実現装
    置において、当該装置が、 A.少なくとも二つのコンピュータにおいて単一あるい
    は複数個のプロセスグループを実行する手段;ここで、
    前記プロセスグループのうちの少なくとも一つは前記プ
    ロセスグループのうちの前記少なくとも一つに対して共
    通である故障回復戦略を有する単一あるいは複数個のプ
    ロセスを有している; B.前記少なくとも二つのコンピュータのうちの少なく
    とも一つにおいて、前記単一あるいは複数個のプロセス
    グループのうちの少なくとも一つに対する故障回復戦略
    を開始するプロセスグループマネージャを実行する手
    段; C.前記少なくとも二つのコンピュータのうちの少なく
    とも第一のものにおいて少なくとも二つのプロセスグル
    ープを有するアプリケーションレイヤを実現する手段; D.前記少なくとも二つのアプリケーションレイヤプロ
    セスグループのうちの少なくとも第二のものに対する前
    記少なくとも二つのアプリケーションレイヤプロセスグ
    ループのうちの少なくとも第一のものからの依存関係を
    規定する手段; E.前記第二アプリケーションレイヤプロセスグループ
    内の故障の際に前記第一コンピュータ上の前記第二アプ
    リケーションレイヤプロセスグループを再始動する手
    段; F.前記第一コンピュータ上の前記第二アプリケーショ
    ンレイヤプロセスグループの故障の際に前記第一コンピ
    ュータ上の前記第一及び第二アプリケーションレイヤプ
    ロセスグループを機能停止にする手段; G.前記少なくとも二つのコンピュータのうちの第二の
    ものにおいて少なくとも一つの対になったプロセスグル
    ープを実現する手段;ここで、前記対になったプロセス
    グループは前記第一コンピュータ上の前記第二アプリケ
    ーションレイヤプロセスグループと対を構成している;
    及び、 H.前記第二アプリケーションレイヤプロセスグループ
    内の前記故障を回復する目的での前記再始動が失敗した
    際に前記第二コンピュータ上の前記少なくとも一つの対
    になったプロセスグループを起動する手段;を組み合わ
    せて有することを特徴とするアプリケーション実現装
    置。
  85. 【請求項85】 前記装置が、さらに、 A.少なくとも前記第一コンピュータにおいて少なくと
    も一つのプロセスグループを有するシステムレイヤを実
    現する手段; B.前記第一のコンピュータ上でシステムレイヤプロセ
    スグループ故障が発生した際に前記第一コンピュータ上
    の前記プロセスグループの全てを機能停止にする手段; C.前記第一コンピュータ上でシステムレイヤプロセス
    グループ故障が発生した際に前記第一コンピュータを再
    起動する手段;及び、 D.前記第一コンピュータ上の前記第一アプリケーショ
    ンレイヤプロセスグループを機能停止にすることが不可
    能である際に前記第一コンピュータ上の前記システムレ
    イヤ内の前記少なくとも一つのプロセスグループの各々
    を除く前記プロセスグループ全てを再初期化する手段;
    を組み合わせて有することを特徴とする請求項84記載
    のアプリケーション実現装置。
  86. 【請求項86】 前記装置が、さらに、前記第二アプリ
    ケーションレイヤプロセスグループの前記故障を回復す
    る目的での前記再初期化が失敗した際に前記第一コンピ
    ュータを再起動する手段;を組み合わせて有することを
    特徴とする請求項85記載のアプリケーション実現装
    置。
  87. 【請求項87】 前記装置が、さらに、前記第二アプリ
    ケーションレイヤプロセスグループの前記故障を回復す
    る目的での前記第一コンピュータの前記再起動が失敗し
    た際に前記第一コンピュータの電源を切断・再投入する
    目的で独立コンピュータを利用する手段;を組み合わせ
    て有することを特徴とする請求項86記載のアプリケー
    ション実現装置。
  88. 【請求項88】 前記装置が、さらに、前記第二アプリ
    ケーションレイヤプロセスグループの前記故障を回復す
    る目的での前記第一コンピュータの前記電源切断・再投
    入が失敗した際に前記第一コンピュータの電源を切断す
    る目的で独立コンピュータを利用する手段;を組み合わ
    せて有することを特徴とする請求項87記載のアプリケ
    ーション実現装置。
JP11280799A 1998-04-21 1999-04-20 アプリケーション実現方法及びアプリケーション実現装置 Expired - Fee Related JP3844621B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/063560 1998-04-21
US09/063,560 US6058490A (en) 1998-04-21 1998-04-21 Method and apparatus for providing scaleable levels of application availability

Publications (2)

Publication Number Publication Date
JPH11345219A true JPH11345219A (ja) 1999-12-14
JP3844621B2 JP3844621B2 (ja) 2006-11-15

Family

ID=22050024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11280799A Expired - Fee Related JP3844621B2 (ja) 1998-04-21 1999-04-20 アプリケーション実現方法及びアプリケーション実現装置

Country Status (3)

Country Link
US (1) US6058490A (ja)
EP (1) EP0953911A3 (ja)
JP (1) JP3844621B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004509002A (ja) * 2000-09-07 2004-03-25 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング 車両のための電子システムおよび動作ファンクションのためのシステムレイヤ
JP2005339300A (ja) * 2004-05-28 2005-12-08 Hitachi Ltd データベース処理方法およびシステム並びにその処理プログラム
WO2006054573A1 (ja) * 2004-11-17 2006-05-26 Nec Corporation 情報処理装置及びこのプログラムと、モジュラー型システムの運用管理システムと、コンポーネント選択方法
JPWO2005071522A1 (ja) * 2004-01-27 2007-09-13 日本電気株式会社 高速再起動方法および情報処理装置ならびにプログラム
US7587453B2 (en) * 2006-01-05 2009-09-08 International Business Machines Corporation Method and system for determining application availability
JP2010160822A (ja) * 2010-04-23 2010-07-22 Hitachi Ltd データベース処理方法、データベース処理システム及びデータベース管理プログラム

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6314526B1 (en) * 1998-07-10 2001-11-06 International Business Machines Corporation Resource group quorum scheme for highly scalable and highly available cluster system management
US6427163B1 (en) * 1998-07-10 2002-07-30 International Business Machines Corporation Highly scalable and highly available cluster system management scheme
US6708224B1 (en) * 1999-01-19 2004-03-16 Netiq Corporation Methods, systems and computer program products for coordination of operations for interrelated tasks
US6622260B1 (en) 1999-12-30 2003-09-16 Suresh Marisetty System abstraction layer, processor abstraction layer, and operating system error handling
AU2001257484A1 (en) * 2000-05-02 2001-11-12 Sun Microsystems, Inc. Method and system for managing high-availability-aware components in a networked computer system
US6865591B1 (en) * 2000-06-30 2005-03-08 Intel Corporation Apparatus and method for building distributed fault-tolerant/high-availability computed applications
DE10040467A1 (de) * 2000-08-18 2002-02-28 Siemens Ag Verfahren und Vorrichtung zur Koordinierung von Umschalt- und Ablösevorgängen zwischen Teilfunktionen
US7222268B2 (en) 2000-09-18 2007-05-22 Enterasys Networks, Inc. System resource availability manager
WO2002023338A2 (en) * 2000-09-18 2002-03-21 Tenor Networks, Inc. System resource availability manager
US20020073409A1 (en) * 2000-12-13 2002-06-13 Arne Lundback Telecommunications platform with processor cluster and method of operation thereof
US7203755B2 (en) * 2000-12-29 2007-04-10 Webex—Communications, Inc. System and method for application sharing in collaborative setting
WO2002054264A1 (en) 2000-12-29 2002-07-11 Webex Communications, Inc. Distributed network system architecture for collaborative computing
US7069298B2 (en) * 2000-12-29 2006-06-27 Webex Communications, Inc. Fault-tolerant distributed system for collaborative computing
US20030164853A1 (en) 2000-12-29 2003-09-04 Min Zhu Distributed document sharing
US6901448B2 (en) * 2000-12-29 2005-05-31 Webex Communications, Inc. Secure communications system for collaborative computing
US6925645B2 (en) * 2000-12-29 2005-08-02 Webex Communications, Inc. Fault tolerant server architecture for collaborative computing
US6717073B2 (en) 2000-12-29 2004-04-06 Intel Corporation Wireless display systems, styli, and associated methods
US20030167302A1 (en) * 2000-12-29 2003-09-04 Min Zhu Scalable distributed network system for collaborative computing
US20030167418A1 (en) * 2000-12-29 2003-09-04 Min Zhu Fault-tolerant server for collaborative computing
IES20010064A2 (en) * 2001-01-29 2002-04-17 Eland Technologies Inc Computer network system
DE10110472C2 (de) * 2001-03-05 2003-10-09 Jens Rehsack Verfahren zum Steuern einer Vielzahl von Computern beim Auftreten eines Stromausfalls
US6804803B2 (en) 2001-04-05 2004-10-12 International Business Machines Corporation Method for testing integrated logic circuits
US7279646B2 (en) 2001-05-25 2007-10-09 Intel Corporation Digital signature collection and authentication
GB0119146D0 (en) * 2001-08-06 2001-09-26 Nokia Corp Controlling processing networks
US7124320B1 (en) * 2002-08-06 2006-10-17 Novell, Inc. Cluster failover via distributed configuration repository
US6920320B2 (en) * 2002-09-30 2005-07-19 Lucent Technologies Inc. Method and apparatus for stable call preservation
US7302477B2 (en) * 2003-07-31 2007-11-27 International Business Machines Corporation Administration tool for gathering information about systems and applications including the feature of high availability
US20050068888A1 (en) * 2003-09-26 2005-03-31 Komarla Eshwari P. Seamless balde failover in platform firmware
US7451201B2 (en) * 2003-09-30 2008-11-11 International Business Machines Corporation Policy driven autonomic computing-specifying relationships
US8892702B2 (en) 2003-09-30 2014-11-18 International Business Machines Corporation Policy driven autonomic computing-programmatic policy definitions
US7533173B2 (en) * 2003-09-30 2009-05-12 International Business Machines Corporation Policy driven automation - specifying equivalent resources
US7234075B2 (en) * 2003-12-30 2007-06-19 Dell Products L.P. Distributed failover aware storage area network backup of application data in an active-N high availability cluster
US7451347B2 (en) * 2004-10-08 2008-11-11 Microsoft Corporation Failover scopes for nodes of a computer cluster
WO2006084510A1 (de) * 2005-02-08 2006-08-17 Nokia Siemens Networks Gmbh & Co. Kg Verfahren zur fehlererkennung eines nachrichteninterfaces in einer kommunikationseinrichtung
US8521853B2 (en) * 2007-06-29 2013-08-27 Alcatel Lucent Apparatus and method for server network management to provide zero planned retrofit downtime
EP2538612A4 (en) * 2010-12-13 2013-01-02 Huawei Tech Co Ltd METHOD AND DEVICE FOR SERVICE MANAGEMENT
US8903960B2 (en) 2010-12-21 2014-12-02 Cisco Technology, Inc. Activate attribute for service profiles in unified computing system
FR2973185B1 (fr) * 2011-03-22 2013-03-29 Sagem Defense Securite Procede et dispositif de connexion a un reseau de haute securite
WO2012131761A1 (ja) * 2011-03-28 2012-10-04 富士通株式会社 情報処理システム及び情報処理システムの処理方法
US20140157253A1 (en) * 2011-03-31 2014-06-05 Alcatel-Lucent India Limited Retrofitting a processor cluster
US9027098B2 (en) * 2013-03-14 2015-05-05 Genband Us Llc Systems, methods, and computer program products for recording service status of applications

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4965717A (en) * 1988-12-09 1990-10-23 Tandem Computers Incorporated Multiple processor system having shared memory with private-write capability
JP2923702B2 (ja) * 1991-04-01 1999-07-26 株式会社日立製作所 記憶装置及びそのデータ修復方法
US5633857A (en) * 1992-07-15 1997-05-27 Goldstar Information & Communications, Ltd. Apparatus and method for controlling data transmissions in a communication network
US5560033A (en) * 1994-08-29 1996-09-24 Lucent Technologies Inc. System for providing automatic power control for highly available n+k processors
US5621885A (en) * 1995-06-07 1997-04-15 Tandem Computers, Incorporated System and method for providing a fault tolerant computer program runtime support environment
US5790775A (en) * 1995-10-23 1998-08-04 Digital Equipment Corporation Host transparent storage controller failover/failback of SCSI targets and associated units
US5958065A (en) * 1997-02-18 1999-09-28 Micron Electronics, Inc. Content addressable bit replacement memory
US5935258A (en) * 1997-03-04 1999-08-10 Micron Electronics, Inc. Apparatus for allowing data transfers with a memory having defective storage locations
US5951693A (en) * 1997-09-29 1999-09-14 Emc Corporation Data storage system having data reconstruction

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004509002A (ja) * 2000-09-07 2004-03-25 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング 車両のための電子システムおよび動作ファンクションのためのシステムレイヤ
JPWO2005071522A1 (ja) * 2004-01-27 2007-09-13 日本電気株式会社 高速再起動方法および情報処理装置ならびにプログラム
US9298472B2 (en) 2004-01-27 2016-03-29 Nec Corporation High-speed restart method, information processing device, and program
JP2005339300A (ja) * 2004-05-28 2005-12-08 Hitachi Ltd データベース処理方法およびシステム並びにその処理プログラム
JP4572581B2 (ja) * 2004-05-28 2010-11-04 株式会社日立製作所 データベース処理方法およびシステム並びにその処理プログラム
WO2006054573A1 (ja) * 2004-11-17 2006-05-26 Nec Corporation 情報処理装置及びこのプログラムと、モジュラー型システムの運用管理システムと、コンポーネント選択方法
JPWO2006054573A1 (ja) * 2004-11-17 2008-05-29 日本電気株式会社 情報処理装置及びこのプログラムと、モジュラー型システムの運用管理システムと、コンポーネント選択方法
US7856572B2 (en) 2004-11-17 2010-12-21 Nec Corporation Information processing device, program thereof, modular type system operation management system, and component selection method
US7587453B2 (en) * 2006-01-05 2009-09-08 International Business Machines Corporation Method and system for determining application availability
JP2010160822A (ja) * 2010-04-23 2010-07-22 Hitachi Ltd データベース処理方法、データベース処理システム及びデータベース管理プログラム

Also Published As

Publication number Publication date
EP0953911A3 (en) 2000-09-13
US6058490A (en) 2000-05-02
EP0953911A2 (en) 1999-11-03
JP3844621B2 (ja) 2006-11-15

Similar Documents

Publication Publication Date Title
JPH11345219A (ja) アプリケ―ション実現方法及びアプリケ―ション実現装置
US7788524B2 (en) Fault-tolerant networks
US8230256B1 (en) Method and apparatus for achieving high availability for an application in a computer cluster
US6477663B1 (en) Method and apparatus for providing process pair protection for complex applications
US7251736B2 (en) Remote power control in a multi-node, partitioned data processing system via network interface cards
CA2621249C (en) Application of virtual servers to high availability and disaster recovery solutions
US7472308B2 (en) Storage switch system, storage switch method, management server, management method, and management program
US20090070761A1 (en) System and method for data communication with data link backup
US7444335B1 (en) System and method for providing cooperative resource groups for high availability applications
CN111989681A (zh) 自动部署的信息技术(it)系统和方法
US7266815B2 (en) Automated control of a licensed internal code update on a storage controller
US20110141882A1 (en) System and method for providing a computer standby node
US20080301491A1 (en) Quorum-based power-down of unresponsive servers in a computer cluster
US7089413B2 (en) Dynamic computer system reset architecture
US9116861B2 (en) Cascading failover of blade servers in a data center
US8015432B1 (en) Method and apparatus for providing computer failover to a virtualized environment
JP2004334698A (ja) 計算機システム及び故障計算機代替制御プログラム
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
US11119872B1 (en) Log management for a multi-node data processing system
WO2011158367A1 (ja) 実行中のプログラムの更新技術
US20050138427A1 (en) Automatic virus fix using UUID based scheduling
CN114217905A (zh) 虚拟机高可用恢复处理方法及系统
CN113626147A (zh) 基于虚拟化技术的海洋平台计算机控制方法及系统
JP7495639B2 (ja) 更新装置、更新方法、および、プログラム
KR101564144B1 (ko) 펌웨어 관리 장치 및 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040225

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040525

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040528

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050704

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20050929

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20051006

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051228

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060502

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060601

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060724

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060816

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees