JP2005250840A - 耐障害システムのための情報処理装置 - Google Patents

耐障害システムのための情報処理装置 Download PDF

Info

Publication number
JP2005250840A
JP2005250840A JP2004060240A JP2004060240A JP2005250840A JP 2005250840 A JP2005250840 A JP 2005250840A JP 2004060240 A JP2004060240 A JP 2004060240A JP 2004060240 A JP2004060240 A JP 2004060240A JP 2005250840 A JP2005250840 A JP 2005250840A
Authority
JP
Japan
Prior art keywords
module
computer
resources
computers
emulator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004060240A
Other languages
English (en)
Inventor
Takeshi Matsumoto
健 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2004060240A priority Critical patent/JP2005250840A/ja
Publication of JP2005250840A publication Critical patent/JP2005250840A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】 耐障害性システムで効率的にハードウェアリソースを利用しつつ、耐障害性を向上する。
【解決手段】 リソース管理装置20は、複数のコンピュータC5〜C8のリソースの使用状況を示す情報を記憶したコンピュータテーブル23と、所定のコンピュータでアプリケーションAP5が所定の処理を行うために必要なリソースに関する情報を記憶したAPテーブル22と、アプリケーションAP5のAPモジュール105をバックアップするために待機していたAPモジュール205が、APモジュール105に代わって動作を開始する切り替えを検出すると、APテーブル22及びコンピュータテーブル23を参照して、コンピュータC5〜C8の中から一のコンピュータを選択し、選択されたコンピュータで動作している所定のコンピュータをエミュレートしたエミュレータ上で、APモジュール205をバックアップするためのAPモジュールを起動するよう指示をするコンピュータ選択部21と、を備える。
【選択図】 図5

Description

本発明は、障害発生時でも停止しない耐障害性システムに関し、特に、ハードウェアリソースを効率的に利用した耐障害性システムに関する。
耐障害性システムでは、一台のコンピュータであるアプリケーションを実行する場合、それをバックアップするためにバックアップ用のコンピュータを用意していることが多い。そして、ハードウェアの障害などにより現在動作しているアプリケーションが停止してしまうと、バックアップ用のコンピュータにおいて、同じアプリケーションが直ちに動作を開始して、外見上、業務処理などが停止しないようにしている。
この場合、バックアップ用のコンピュータは、障害が発生しない限りほとんど利用されることはない。つまり、障害が発生しない限り、バックアップのために待機するのみである。障害が発生しないことは、システムの運用上は非常に好ましいことではあるが、システム全体のハードウェアリソースの利用効率が低くなるという問題が生じる。これは、システム投資に対する費用対効果という点からみてもよくない。
障害が発生して、バックアップ用のコンピュータでアプリケーションが処理を開始すると、障害が回復するまでの間はさらなるバックアップがないことになり、耐障害性が低下する。これを克服するために、さらにバックアップ用のコンピュータを備えると、ハードウェアリソースの利用効率はさらに低下する。
上記の問題は、コンピュータの台数が増えるに従ってより深刻になる。
そこで、本発明の目的は、耐障害性システムでのハードウェアリソースの利用効率を向上することである。
本発明の他の目的は、耐障害性システムで効率的にハードウェアリソースを利用しつつ、耐障害性を向上することである。
本発明の一つの態様に従う耐障害システムのための情報処理装置は、複数のコンピュータのリソースの使用状況を示す情報を記憶した第1の記憶手段と、所定のコンピュータで、アプリケーションが所定の処理を行うために必要なリソースに関する情報を記憶した第2の記憶手段と、前記アプリケーションの第1のモジュールをバックアップするために待機していた第2のモジュールが、第1のモジュールに代わって前記所定の処理を開始する切り替えを検出する手段と、前記検出手段が前記切り替えを検出すると、前記第1及び第2の記憶手段を参照して、前記複数のコンピュータの中から一のコンピュータを選択する手段と、選択された前記一のコンピュータで動作している前記所定のコンピュータをエミュレートしたエミュレータ上で、第2のモジュールをバックアップするための第3のモジュールを起動するよう指示をする手段と、を備える。
好適な実施形態では、前記複数のコンピュータのそれぞれから、各コンピュータのリソースの使用状況を示す情報を定期または不定期に収集し、前記記憶手段を更新する手段を、さらに備えることができる。
好適な実施形態では、前記選択手段は、前記複数のコンピュータのリソースの空き状況と、前記アプリケーションで必要なリソースとを比較して、前記一のコンピュータを選択するようにしてもよい。
好適な実施形態では、前記第2のモジュールが、第1のモジュールをバックアップするために待機しているときは、第1のモジュールが使用しているよりも少ないリソースを使用しているようにしてもよい。
本発明の一つの態様に従う耐障害システムは、リソース管理装置と、所定のコンピュータをエミュレートした第1、第2及び第3のエミュレータを備えた第1、第2及び第3のコンピュータとを備える。そして、第1のコンピュータは、第1のエミュレータ上で、所定の処理を実行するための第1のモジュールを備える。第2のコンピュータは、第2のエミュレータ上で、前記所定の処理を実行するための第2のモジュールを備える。このとき、第2のモジュールは、第1のモジュールが使用しているよりも少ないリソースを使用しながら待機しているときに、第1のモジュールでの障害発生を検知すると、第1のモジュールが使用しているリソースと同程度のリソースを確保する。前記リソース管理装置は、第2のモジュールが前記リソースの確保を行うと、第3のコンピュータに対して、第3のエミュレータ上で、前記所定の処理を実行するための第3のモジュールが、第2のモジュールが使用しているよりも少ないリソースを使用して、待機状態で起動するよう指示する手段を備える。
以下、本発明の一実施形態に係る耐障害機能を備えた情報処理システムついて、図面を用いて説明する。
第1の実施形態に係る耐障害システムは、図1に示すように、複数台のコンピュータC1〜C4と、RAID(Redundant Arrays of Inexpensive Disks)などで実現されたデータベースシステム10とを備え、ネットワーク9を介して接続されている。各コンピュータC1〜C4は、いずれも例えば汎用的なコンピュータシステムにより構成され、以下に説明する各コンピュータC1〜C4内の個々の構成要素または機能は、例えば、コンピュータプログラムを実行することにより実現される。
本システムでは、所定の業務処理を行うアプリケーションAP1、AP2、AP3が動作している。各アプリケーションAP1〜AP3は、例えば、データベースシステム10からデータを取得して処理を実行し、処理結果をデータベースシステム10へ格納する。本実施形態では、各アプリケーションAP1〜AP3は、それぞれ機種が異なるコンピュータC1〜C3上で動作するように実装されている。
さらに、本システムは耐障害機能を備えている。すなわち、各アプリケーションは、実際に動作している運用系のAPモジュール100(101,102,103)と、何らかの障害で運用系が正常に動作しなくなったときにそれをバックアップするために待機している待機系のAPモジュール200(201,202,203)とを備える。
運用系の各APモジュール100は、それぞれ、所定の業務処理を実行すると共に、定期的または不定期に、対応する待機系の各APモジュール200に対して所定の通知を行う。ここでは、この通知をハートビートと呼ぶ。待機系の各APモジュール200は、このハートビートを受信することにより、運用系APモジュール100が正常に動作していることを認識する。
本実施形態では、ハートビートには、例えば、各APモジュールが使用しているハードウェアリソース(以下、単にリソースということがある)に関する情報を含む。ハードウェアリソースには、例えば、CPU(Central Processing Unit)、メインメモリ、ディスクなどの外部記憶装置およびネットワークなどを含む。ここで、ハートビートのフォーマットの一例を図2に示す。ハートビート50は、例えば、同図に示すように、それぞれのAPモジュールでのCPU使用率51と、利用しているメモリ容量52と、利用しているディスク容量53と、利用しているネットワークの帯域幅54とを含む。運用系の各APモジュール100は、これらの情報を取得して、ハートビートとして、それぞれ対応する待機系のAPモジュール200へ通知する。
再び図1を参照すると、待機系の各APモジュール200は、いずれもコンピュータC4上に実現されている。コンピュータC4は、コンピュータC1〜C3のいずれとも機種が異なる。このため、コンピュータC4では、コンピュータC1をエミュレートしたエミュレータVM1と、コンピュータC2をエミュレートしたエミュレータVM2と、コンピュータC3をエミュレートしたエミュレータVM3とが動作している。そして、APモジュール101の待機系APモジュール201がエミュレータVM1、APモジュール102の待機系APモジュール202がエミュレータVM2、およびAPモジュール103の待機系APモジュール203がエミュレータVM3の上でそれぞれ待機している。なお、コンピュータC4がコンピュータC1〜C3のいずれかと同一機種であれば、同一機種用のエミュレータは不要である。
これにより、コンピュータC1上で動作するためのAPモジュール201であっても、コンピュータC4上で動作可能である。APモジュール202,203についても同様である。
なお、以下の説明において、コンピュータとエミュレータとの対比を明確にするために、それぞれを「物理コンピュータ」及び「仮想コンピュータ」と言うことがある。
待機系APモジュール200は、それぞれの運用系APモジュール100に代わってすべての業務処理を実行する機能を備えている。しかし、待機している(待機系でいる)間は業務処理を実行せず、対応する運用系100からのハートビートを受信し、運用系100の動作状態を監視するための処理のみを実行している。従って、待機系200は、ハートビートの受信に関連する処理に必要なリソースのみを使用していて、業務処理を開始するとき(運用系になるとき)に、必要なリソースを確保する。これにより、待機系のAPモジュールが使用するリソースは、運用系のAPモジュールが使用しているリソースより少なくて済む。
ここで、本システムは耐障害システムであるが、耐障害の考え方は種々ある。例えば、複数台のコンピュータが同時にハードウェア障害を起こす確率は極めて低いと考えられる。そこで、同時に複数台で障害が発生することを想定しない場合、コンピュータC4は、最もリソースを使用するアプリケーションのAPモジュールが一つ動作し、且つ、他の待機系APモジュールなどが動作可能なリソースを備えていればよい。これにより、待機系のために必要なリソースを節約できる。
コンピュータC4には、さらに、エミュレータ管理部11と、リソーステーブル12とを含む。
エミュレータ管理部11は、各エミュレータVM1〜VM3へのリソースの割り当てなどを行う。詳細な処理については後述する。
リソーステーブル12は、運用系の各APモジュール100が使用しているリソースを記憶する。例えば、図3に示すように、運用系の各APモジュールのCPU使用率121、利用メモリ容量122、利用ディスク容量123、利用ネットワーク帯域幅124を、それぞれ記憶する。リソーステーブル12に記憶されている情報は、待機系の各APモジュール200が受信したハートビート50に含まれている情報を格納したものである。
次に、コンピュータC4で待機している各APモジュール200が運用系に切り替わるときの処理手順について、図4のフローチャートを用いて説明する。この処理は、各APモジュール201,202,203について、それぞれ独立に行われる処理である。ここでは、アプリケーションAP1(運用系101、待機系201)について説明する。
待機系のAPモジュール201は、運用系のAPモジュール101で障害が発生したかどうかを監視する(S11)。例えば、APモジュール201が、APモジュール101から障害発生を知らせるための電文を受信したとき、あるいは、所定時間以上、APモジュール101からのハートビートを受信しないときなどは、APモジュール101で障害が発生したと判断する。この障害には、コンピュータC1のハードウェア障害によりAPモジュール101が動作しなくなる場合を含む。
APモジュール101で障害が発生すると(S11:Yes)、APモジュール201は、待機状態から運用系として動作可能な状態になるために、エミュレータ管理部11へリソースを確保するよう要求する。エミュレータ管理部11は、リソース確保の要求を受けると、リソーステーブル12を参照して、APモジュール101(AP1)で使用していたリソースの容量を取得する(S12)。そして、エミュレータ管理部11は、コンピュータC4のリソースを、ステップS12で取得した容量だけ確保する(S13)。
リソースが確保されると、APモジュール201は運用系として動作可能となる。そして、APモジュール201はデータベースシステム10を参照し、データの更新状況などに基づいて処理の進行状況を判定し、APモジュール101が行っていた業務処理を引き継いで行う(S14)。
これにより、1台の物理コンピュータ上に複数の仮想コンピュータを実現し、この物理コンピュータ上に複数のアプリケーションの待機系を実現できる。これにより、待機系のため用意しなければならないリソースを節約しつつ、耐障害性の高いシステムを実現できる。
次に、本発明の第2の実施形態に係る耐障害性を備えた情報処理システムについて説明する。第2の実施形態に係るシステムは、複数台の物理コンピュータのいずれかに、複数のアプリケーションの運用系及び待機系のAPモジュールを分散する。なお、第1の実施形態と同様の構成については、同一の符号を付して説明を省略する。
本システムは、例えば図5に示すように、複数台のコンピュータC5〜C8とデータベースシステム10と、リソース管理装置20とがネットワーク9を介して接続されている。本実施形態では、二つのアプリケーション(AP5、AP6)の運用系と待機系とがいずれかのコンピュータで動作している場合について説明するが、三つ以上のアプリケーションが動作する場合も同様である。なお、運用系と待機系との関係は、第1の実施形態と同様である。
アプリケーションAP5、AP6は、いずれも、コンピュータC5〜C8のいずれとも異なる機種のコンピュータC10、C11(図示しない)で動作可能に実装されているものとする。このため、コンピュータC5〜C8では、それぞれ、コンピュータC10をエミュレートしたエミュレータVM5、およびコンピュータC11をエミュレートしたエミュレータVM6が動作している。コンピュータC5〜C8は、さらに、エミュレータ管理部11及びリソーステーブル12を備える。
ここで、コンピュータC5上のエミュレータVM5では、AP5の運用系APモジュール105が動作している。コンピュータC6上のエミュレータVM6では、AP6の運用系APモジュール106が動作している。一方、コンピュータC6上のエミュレータVM5では、AP5の待機系APモジュール205が動作している。コンピュータC7上のエミュレータVM6では、AP6の待機系APモジュール206が動作している。
運用系APモジュール105、106は、第1の実施形態と同様にハートビートを出力する。本実施形態では、ハートビートは、それぞれ対応する待機系APモジュール205、206および以下に説明するリソース管理装置20が受信する。
リソース管理装置20は、例えば汎用的なコンピュータシステムにより構成され、以下に説明するリソース管理装置20内の個々の構成要素または機能は、例えば、コンピュータプログラムを実行することにより実現される。
リソース管理装置20は、コンピュータ選択部21と、APテーブル22と、コンピュータテーブル23と、ステータステーブル24とを有する。
コンピュータ選択部21は、コンピュータC5〜C8の中から待機系のAPモジュールを割り当てるコンピュータを一つ選択する。その詳細な処理は後述する。
APテーブル22は、運用系の各APモジュールについて、それぞれの動作状態に関する情報を記憶する。例えば、APテーブル22は、図6に示すように、運用系の各APモジュールが動作しているコンピュータ名221と、エミュレータ名222と、そのエミュレータがエミュレートしているコンピュータのCPUに関する情報223と、そのAPモジュールが動作するときに利用する可能性がある最大リソースに関する情報224と、そのAPモジュールが現在利用しているリソースに関する情報225とを、データ項目として含む。
最大リソースに関する情報224は、例えば、過去の実績の最大値でもよいし、過去の実績に基づいて統計的に算出し、適宜更新してもよいし、ジョブスケジュールなどに応じて時間帯ごとに変更してもよい。
現在利用しているリソースに関する情報225は、運用系APモジュールから受信したハートビートに含まれるリソースに関する情報に基づいて更新される。
コンピュータテーブル23は、それぞれの物理コンピュータに関する情報を記憶する。例えば、コンピュータテーブル23は、図7に示すように、コンピュータ名231と、コンピュータのリソースに関する仕様の情報232と、現在の空きリソースに関する情報233と、過去の故障回数234と、前回修理を行った日235と、ネットワーク距離236とを、データ項目として含む。
現在の空きリソースに関する情報233は、各運用系APモジュールから受信したハートビートに含まれるリソースに関する情報と、待機系APモジュールが使用しているリソースに基づいて更新される。
ステータステーブル24は、各アプリケーションの運用系及び待機系のAPモジュールが、どの物理コンピュータ上に存在するかを記憶する。ステータステーブル24の一例を図8に示す。
運用系のAPモジュールで何らかの障害が発生した場合、待機系のAPモジュールが必要なリソースを確保して運用系に切り替わる。このときの切り替えの手順は、第1の実施形態と同様に行われる。このとき、待機系であったAPモジュールが運用系に切り替わると、このAPモジュールをバックアップするための待機系が存在しないことになり、耐障害性が低下する。そこで、本実施形態では、新たに運用系となったAPモジュールの待機系APモジュールを起動する。以下、コンピュータC5の障害でAPモジュール105が停止し、APモジュール205が運用系に切り替わった場合を例にとり、その処理手順を図9のフローチャートを用いて説明する。
まず、APモジュール(AP5)205は、自らが運用系に切り替わると、リソース管理装置20へその旨を通知する。リソース管理装置20では、コンピュータ選択部21がこの通知を受信する(S21)。コンピュータ選択部21がこの通知により待機系から運用系への切り替えを検出すると、APテーブル22及びコンピュータテーブル23を参照して、アプリケーションAP5の待機系APモジュールを動作させるコンピュータを選択する(S22)。
コンピュータ選択部21は、例えば、ステータステーブル24において、アプリケーションA5の運用系及び待機系となっていないコンピュータ(ここではコンピュータC7、C8)を対象にして、最大リソース情報224と空きリソース情報233とを比較して、最大リソース以上の空きリソースを有するコンピュータを選択する。CPUの処理能力は、仕様232に含まれるCPU種別により定まるMIPS値及び周波数と、空きリソース233に含まれる空きCPU使用率とに基づいて判断する。ここで、複数の候補があがったときは、その中から信頼度の高いコンピュータを選択してもよい。例えば、故障回数234が少ないもの、前回修理日235からの経過日数が少ないものが、信頼度が高い。
ここでは、ステップS22でコンピュータC8が選択されたものとする。コンピュータ選択部21は、選択されたコンピュータC8に対して、アプリケーションAP5の待機系の立ち上げを指示する(S23)。
立ち上げ指示を受けると、コンピュータC8のエミュレータ管理部11がエミュレータVM5上に待機系として新たにアプリケーションAP5のAPモジュールを立ち上げる。
コンピュータ選択部21は、ステータステーブル24において、アプリケーションAP5の運用系をコンピュータC6、待機系をコンピュータC8に更新する。そして、新たに運用系となったAPモジュール205へ、待機系のアドレス情報(例えば、コンピュータC8のコンピュータ名、エミュレータ名、IPアドレスなど)を通知する(S24)。
上述のようにエミュレータを利用することにより、ハードウェアの制約を受けず、リソースの利用効率の高い耐障害性システムを実現できる。
上述した本発明の実施形態は、本発明の説明のための例示であり、本発明の範囲をそれらの実施形態にのみ限定する趣旨ではない。当業者は、本発明の要旨を逸脱することなしに、他の様々な態様で本発明を実施することができる。
本発明の第1の実施形態に係る耐障害システムの構成図である。 ハートビートのフォーマットの一例を示す図である。 リソーステーブルの一例を示す図である。 待機系から運用系への切り替え処理のフローチャートである。 本発明の第2の実施形態に係る耐障害システムの構成図である。 APテーブルの一例を示す図である。 コンピュータテーブルの一例を示す図である。 ステータステーブルの一例を示す図である。 新たな待機系の割り当て処理のフローチャートである。
符号の説明
C1〜C8…コンピュータ、VM1〜6…エミュレータ、10…データベースシステム、20…リソース管理装置、101〜106、201〜206…APモジュール。

Claims (8)

  1. 複数のコンピュータのリソースの使用状況を示す情報を記憶した第1の記憶手段と、
    所定のコンピュータで、アプリケーションが所定の処理を行うために必要なリソースに関する情報を記憶した第2の記憶手段と、
    前記アプリケーションの第1のモジュールをバックアップするために待機していた第2のモジュールが、第1のモジュールに代わって前記所定の処理を開始する切り替えを検出する手段と、
    前記検出手段が前記切り替えを検出すると、前記第1及び第2の記憶手段を参照して、前記複数のコンピュータの中から一のコンピュータを選択する手段と、
    選択された前記一のコンピュータで動作している前記所定のコンピュータをエミュレートしたエミュレータ上で、第2のモジュールをバックアップするための第3のモジュールを起動するよう指示をする手段と、を備える耐障害システムのための情報処理装置。
  2. 前記複数のコンピュータのそれぞれから、各コンピュータのリソースの使用状況を示す情報を定期または不定期に収集し、前記記憶手段を更新する手段を、さらに備える請求項1記載の耐障害システムのための情報処理装置。
  3. 前記選択手段は、
    前記複数のコンピュータのリソースの空き状況と、前記アプリケーションで必要なリソースとを比較して、前記一のコンピュータを選択する請求項1記載の耐障害システムのための情報処理装置。
  4. 前記第2のモジュールが、第1のモジュールをバックアップするために待機しているときは、第1のモジュールが使用しているよりも少ないリソースを使用している、請求項1記載の耐障害システムのための情報処理装置。
  5. リソース管理装置と、
    所定のコンピュータをエミュレートした第1、第2及び第3のエミュレータを備えた第1、第2及び第3のコンピュータとを備えた耐障害システムであって、
    第1のコンピュータは、
    第1のエミュレータ上で、所定の処理を実行するための第1のモジュールを備え、
    第2のコンピュータは、
    第2のエミュレータ上で、前記所定の処理を実行するための第2のモジュールを備え、
    第2のモジュールは、第1のモジュールが使用しているよりも少ないリソースを使用しながら待機しているときに、第1のモジュールでの障害発生を検知すると、第1のモジュールが使用しているリソースと同程度のリソースを確保し、
    前記リソース管理装置は、
    第2のモジュールが前記リソースの確保を行うと、第3のコンピュータに対して、第3のエミュレータ上で、前記所定の処理を実行するための第3のモジュールが、第2のモジュールが使用しているよりも少ないリソースを使用して、待機状態で起動するよう指示する手段を備える、耐障害システム。
  6. 複数のコンピュータのリソースの使用状況を示す情報を第1の記憶手段に格納し、
    所定のコンピュータで、アプリケーションが所定の処理を行うために必要なリソースに関する情報を第2の記憶手段に格納し、
    前記アプリケーションの第1のモジュールをバックアップするために待機していた第2のモジュールが、第1のモジュールに代わって前記所定の処理を開始する切り替えを検出し、
    前記切り替えを検出すると、前記第1及び第2の記憶手段を参照して、前記複数のコンピュータの中から一のコンピュータを選択し、
    選択された前記一のコンピュータで動作している前記所定のコンピュータをエミュレートしたエミュレータ上で、第2のモジュールをバックアップするための第3のモジュールを起動するよう指示をする、耐障害性のための方法。
  7. コンピュータに実行されると、
    複数のコンピュータのリソースの使用状況を示す情報を第1の記憶手段に格納し、
    所定のコンピュータで、アプリケーションが所定の処理を行うために必要なリソースに関する情報を第2の記憶手段に格納し、
    前記アプリケーションの第1のモジュールをバックアップするために待機していた第2のモジュールが、第1のモジュールに代わって前記所定の処理を開始する切り替えを検出し、
    前記切り替えを検出すると、前記第1及び第2の記憶手段を参照して、前記複数のコンピュータの中から一のコンピュータを選択し、
    選択された前記一のコンピュータで動作している前記所定のコンピュータをエミュレートしたエミュレータ上で、第2のモジュールをバックアップするための第3のモジュールを起動するよう指示をする、耐障害性のためのコンピュータプログラム。
  8. リソース管理装置と、所定のコンピュータをエミュレートしたエミュレータが動作している第1,第2及び第3のコンピュータとを備えた情報処理システムにおいて、
    第1のコンピュータの前記エミュレータ上で、所定の処理を実行するための第1のモジュールを動作させ、
    第2のコンピュータの前記エミュレータ上で、前記第1のモジュールをバックアップするために、前記所定の処理を実行するための第2のモジュールが、第1のモジュールが使用しているよりも少ないリソースを使用しながら待機しているときに、第1のモジュールでの障害発生を検知すると、第2のモジュールは第1のモジュールが使用しているリソースと同程度のリソースを確保し、
    前記リソース管理装置は、第3のコンピュータに対して、第3のコンピュータの前記エミュレータ上で、前記第2のモジュールをバックアップするために、前記所定の処理を実行するための第3のモジュールを、第2のモジュールが使用しているよりも少ないリソースを使用して、待機状態で起動するよう指示する、耐障害性のための方法。
JP2004060240A 2004-03-04 2004-03-04 耐障害システムのための情報処理装置 Pending JP2005250840A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004060240A JP2005250840A (ja) 2004-03-04 2004-03-04 耐障害システムのための情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004060240A JP2005250840A (ja) 2004-03-04 2004-03-04 耐障害システムのための情報処理装置

Publications (1)

Publication Number Publication Date
JP2005250840A true JP2005250840A (ja) 2005-09-15

Family

ID=35031265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004060240A Pending JP2005250840A (ja) 2004-03-04 2004-03-04 耐障害システムのための情報処理装置

Country Status (1)

Country Link
JP (1) JP2005250840A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007148839A (ja) * 2005-11-29 2007-06-14 Hitachi Ltd 障害回復方法
JP2007157060A (ja) * 2005-12-08 2007-06-21 Nec Corp マルチプロセッサシステムと初期立ち上げ方法およびプログラム
JP2007207219A (ja) * 2006-01-06 2007-08-16 Hitachi Ltd 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
JP2007219757A (ja) * 2006-02-15 2007-08-30 Fujitsu Ltd 仮想計算機システムを機能させるためのプログラム
JP2007265013A (ja) * 2006-03-28 2007-10-11 Fujitsu Ltd クラスタ制御プログラム、クラスタ制御方法およびクラスタ制御装置
WO2009081657A1 (ja) * 2007-12-21 2009-07-02 Nec Corporation ノードシステム、サーバ切換え方法、サーバ装置、およびデータ引き継ぎ方法
JP2010211819A (ja) * 2010-04-26 2010-09-24 Hitachi Ltd 障害回復方法
JP2012190175A (ja) * 2011-03-09 2012-10-04 Nec Corp フォールトトレラントシステム、サーバ、フォールトトレラント化方法およびプログラム
WO2012176337A1 (ja) * 2011-06-24 2012-12-27 富士通株式会社 情報処理システム、情報処理システムの制御方法、管理装置および系切替プログラム
JPWO2012176337A1 (ja) * 2011-06-24 2015-02-23 富士通株式会社 情報処理システム、情報処理システムの制御方法、管理装置および系切替プログラム
JP2019008340A (ja) * 2017-06-20 2019-01-17 日本電信電話株式会社 冗長化システムおよびハードウェア障害検出方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981409A (ja) * 1995-09-14 1997-03-28 Nec Corp 相互ホットスタンバイシステム待機系選択方式
JP2001155003A (ja) * 1999-11-30 2001-06-08 Ntt Comware Corp サービス復旧システムおよびその記録媒体
JP2002041305A (ja) * 2000-07-26 2002-02-08 Hitachi Ltd 仮想計算機システムにおける計算機資源の割当て方法および仮想計算機システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981409A (ja) * 1995-09-14 1997-03-28 Nec Corp 相互ホットスタンバイシステム待機系選択方式
JP2001155003A (ja) * 1999-11-30 2001-06-08 Ntt Comware Corp サービス復旧システムおよびその記録媒体
JP2002041305A (ja) * 2000-07-26 2002-02-08 Hitachi Ltd 仮想計算機システムにおける計算機資源の割当て方法および仮想計算機システム

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7934119B2 (en) 2005-11-29 2011-04-26 Hitachi, Ltd. Failure recovery method
JP2007148839A (ja) * 2005-11-29 2007-06-14 Hitachi Ltd 障害回復方法
US8694820B2 (en) 2005-11-29 2014-04-08 Hitachi, Ltd. Failure recovery method
JP4544146B2 (ja) * 2005-11-29 2010-09-15 株式会社日立製作所 障害回復方法
US8352778B2 (en) 2005-11-29 2013-01-08 Hitachi, Ltd. Failure recovery method
JP2007157060A (ja) * 2005-12-08 2007-06-21 Nec Corp マルチプロセッサシステムと初期立ち上げ方法およびプログラム
JP2007207219A (ja) * 2006-01-06 2007-08-16 Hitachi Ltd 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
JP2007219757A (ja) * 2006-02-15 2007-08-30 Fujitsu Ltd 仮想計算機システムを機能させるためのプログラム
JP4585463B2 (ja) * 2006-02-15 2010-11-24 富士通株式会社 仮想計算機システムを機能させるためのプログラム
JP2007265013A (ja) * 2006-03-28 2007-10-11 Fujitsu Ltd クラスタ制御プログラム、クラスタ制御方法およびクラスタ制御装置
JP4611922B2 (ja) * 2006-03-28 2011-01-12 富士通株式会社 制御プログラム、制御方法および制御装置
US8281007B2 (en) 2006-03-28 2012-10-02 Fujitsu Limited Cluster control apparatus, cluster control method, and computer product
WO2009081657A1 (ja) * 2007-12-21 2009-07-02 Nec Corporation ノードシステム、サーバ切換え方法、サーバ装置、およびデータ引き継ぎ方法
JP2010211819A (ja) * 2010-04-26 2010-09-24 Hitachi Ltd 障害回復方法
JP2012190175A (ja) * 2011-03-09 2012-10-04 Nec Corp フォールトトレラントシステム、サーバ、フォールトトレラント化方法およびプログラム
WO2012176337A1 (ja) * 2011-06-24 2012-12-27 富士通株式会社 情報処理システム、情報処理システムの制御方法、管理装置および系切替プログラム
US20140101320A1 (en) * 2011-06-24 2014-04-10 Fujitsu Limited Information processing system, control method, management apparatus and computer-readable recording medium
JPWO2012176337A1 (ja) * 2011-06-24 2015-02-23 富士通株式会社 情報処理システム、情報処理システムの制御方法、管理装置および系切替プログラム
JP2019008340A (ja) * 2017-06-20 2019-01-17 日本電信電話株式会社 冗長化システムおよびハードウェア障害検出方法

Similar Documents

Publication Publication Date Title
JP2005250839A (ja) 耐障害性システム
JP4496093B2 (ja) 高可用性システムの遠隔エンタープライズ管理
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
EP3400528B1 (en) Deferred server recovery in computing systems
US20210117219A1 (en) Service Provision System, Resource Allocation Method, and Resource Allocation Program
JP2006011992A (ja) クラスタ構成コンピュータシステムの系切替方法
JPWO2009133669A1 (ja) 仮想計算機制御装置、仮想計算機制御方法及び仮想計算機制御プログラム
JP2007207219A (ja) 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
JP4491482B2 (ja) 障害回復方法、計算機、クラスタシステム、管理計算機及び障害回復プログラム
JP2005115751A (ja) 計算機システム及び計算機システムの障害兆候の検知方法
JP2010067042A (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
JP2005250840A (ja) 耐障害システムのための情報処理装置
US9049101B2 (en) Cluster monitor, method for monitoring a cluster, and computer-readable recording medium
CN105589756A (zh) 批处理集群系统以及方法
JP2007304845A (ja) 仮想計算機システムおよびソフトウェア更新方法
CN102193780A (zh) 事务实现方法以及事务实现设备
JP2005301436A (ja) クラスタシステムおよびクラスタシステムにおける障害回復方法
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
JP2007080012A (ja) 再起動方法、システム及びプログラム
JP5839774B2 (ja) 計算機及び計算機管理方法並びに計算機管理プログラム
US8036105B2 (en) Monitoring a problem condition in a communications system
JP2009075710A (ja) 冗長化システム
US20210406058A1 (en) Atomic groups for configuring hci systems
JP6856574B2 (ja) サービス継続システムおよびサービス継続方法
JP3930455B2 (ja) 計算機システム、サービス継続制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061031

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090106

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090428