JP2005250839A - 耐障害性システム - Google Patents

耐障害性システム Download PDF

Info

Publication number
JP2005250839A
JP2005250839A JP2004060239A JP2004060239A JP2005250839A JP 2005250839 A JP2005250839 A JP 2005250839A JP 2004060239 A JP2004060239 A JP 2004060239A JP 2004060239 A JP2004060239 A JP 2004060239A JP 2005250839 A JP2005250839 A JP 2005250839A
Authority
JP
Japan
Prior art keywords
computer
application module
module
emulator
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004060239A
Other languages
English (en)
Inventor
Takeshi Matsumoto
健 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2004060239A priority Critical patent/JP2005250839A/ja
Publication of JP2005250839A publication Critical patent/JP2005250839A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

【課題】 耐障害性システムでのハードウェアリソースの利用効率を向上する。
【解決手段】 コンピュータC4と、所定の業務処理を行うAPモジュール101が動作しているコンピュータC1とを備える。コンピュータC4は、コンピュータC4とは異なるコンピュータをエミュレートしたエミュレータVM1と、APモジュール101が使用しているコンピュータC1のリソースに関する情報を記憶したリソーステーブル12と、エミュレータVM1上で動作し、APモジュール101をバックアップするために待機しているAPモジュール201と、を備える。そして、APモジュール201は、待機状態のときにリソーステーブル12を参照し、APモジュール101と同様のリソースをコンピュータC4上に確保し、所定の業務処理を実行可能な状態となる。
【選択図】 図1

Description

本発明は、障害発生時でも停止しない耐障害性システムに関し、特に、ハードウェアリソースを効率的に利用した耐障害性システムに関する。
耐障害性システムでは、一台のコンピュータであるアプリケーションを実行する場合、それをバックアップするためにバックアップ用のコンピュータを用意していることが多い。そして、ハードウェアの障害などにより現在動作しているアプリケーションが停止してしまうと、バックアップ用のコンピュータにおいて、同じアプリケーションが直ちに動作を開始して、外見上、業務処理などが停止しないようにしている。
この場合、バックアップ用のコンピュータは、障害が発生しない限りほとんど利用されることはない。つまり、障害が発生しない限り、バックアップのために待機するのみである。障害が発生しないことは、システムの運用上は非常に好ましいことではあるが、システム全体のハードウェアリソースの利用効率が低くなるという問題が生じる。これは、システム投資に対する費用対効果という点からみてもよくない。この問題はコンピュータの台数が増えるに従って、より深刻になる。
そこで、本発明の目的は、耐障害性システムでのハードウェアリソースの利用効率を向上することである。
本発明の一つの態様に従う耐障害性システムは、第1のコンピュータと、所定の業務処理を行う第1のアプリケーションモジュールが動作している第2のコンピュータとを備える。前記第1のコンピュータは、前記第1のコンピュータとは異なるコンピュータをエミュレートしたエミュレータと、前記第1のアプリケーションモジュールが使用している前記第2のコンピュータのリソースに関する情報を記憶した記憶手段と、前記エミュレータ上で動作し、前記第1のアプリケーションモジュールをバックアップするために待機している第2のアプリケーションモジュールと、を備える。そして、前記第2のアプリケーションモジュールは、待機状態のときに前記記憶手段を参照し、前記第1のアプリケーションモジュールと同様のリソースを前記第1のコンピュータ上に確保し、前記所定の業務処理を実行可能な状態となる。
好適な実施形態では、前記第1のアプリケーションモジュールは、前記第1のコンピュータに対して定期または不定期に、前記第1のアプリケーションモジュールが使用している前記第2のコンピュータのリソースに関する情報を通知するようにしてもよい。
好適な実施形態では、前記第2のアプリケーションモジュールは、待機状態のときに、前記第1のアプリケーションモジュールから、所定時間以上前記リソースに関する情報の通知がない場合、前記第1のコンピュータのリソースを確保して前記所定の業務処理を実行可能な状態となるようにしてもよい。
好適な実施形態では、前記エミュレータは、前記第2のコンピュータをエミュレートしていてもよい。
本発明の一つの態様に従うバックアップ用コンピュータは、第1のコンピュータをエミュレートした第1のエミュレータと、第2のコンピュータをエミュレートした第2のエミュレータと、第1のコンピュータで第1の処理を実行する第1のアプリケーションシステムをバックアップするために、前記第1のエミュレータ上で待機している第1のバックアップシステムと、第2のコンピュータで第2の処理を実行する第2のアプリケーションシステムをバックアップするために、前記第2のエミュレータ上で待機している第2のバックアップシステムと、前記第1及び第2のアプリケーションシステムが、それぞれ使用している第1及び第2のコンピュータのリソースに関する情報を記憶した記憶手段と、を備え、前記第1のバックアップシステムは、待機状態のときに前記第1のアプリケーションシステムでの障害発生を検知すると、前記記憶手段を参照して第1のアプリケーションシステムと同様のリソースを確保して前記第1の処理を実行可能な状態となり、前記第2のバックアップシステムは、待機状態のときに前記第2のアプリケーションシステムでの障害発生を検知すると、前記記憶手段を参照して第2のアプリケーションシステムと同様のリソースを確保して前記第2の処理を実行可能な状態となる。
以下、本発明の一実施形態に係る耐障害機能を備えた情報処理システムついて、図面を用いて説明する。
第1の実施形態に係る耐障害システムは、図1に示すように、複数台のコンピュータC1〜C4と、RAID(Redundant Arrays of Inexpensive Disks)などで実現されたデータベースシステム10とを備え、ネットワーク9を介して接続されている。各コンピュータC1〜C4は、いずれも例えば汎用的なコンピュータシステムにより構成され、以下に説明する各コンピュータC1〜C4内の個々の構成要素または機能は、例えば、コンピュータプログラムを実行することにより実現される。
本システムでは、所定の業務処理を行うアプリケーションAP1、AP2、AP3が動作している。各アプリケーションAP1〜AP3は、例えば、データベースシステム10からデータを取得して処理を実行し、処理結果をデータベースシステム10へ格納する。本実施形態では、各アプリケーションAP1〜AP3は、それぞれ機種が異なるコンピュータC1〜C3上で動作するように実装されている。
さらに、本システムは耐障害機能を備えている。すなわち、各アプリケーションは、実際に動作している運用系のAPモジュール100(101,102,103)と、何らかの障害で運用系が正常に動作しなくなったときにそれをバックアップするために待機している待機系のAPモジュール200(201,202,203)とを備える。
運用系の各APモジュール100は、それぞれ、所定の業務処理を実行すると共に、定期的または不定期に、対応する待機系の各APモジュール200に対して所定の通知を行う。ここでは、この通知をハートビートと呼ぶ。待機系の各APモジュール200は、このハートビートを受信することにより、運用系APモジュール100が正常に動作していることを認識する。
本実施形態では、ハートビートには、例えば、各APモジュールが使用しているハードウェアリソース(以下、単にリソースということがある)に関する情報を含む。ハードウェアリソースには、例えば、CPU(Central Processing Unit)、メインメモリ、ディスクなどの外部記憶装置およびネットワークなどを含む。ここで、ハートビートのフォーマットの一例を図2に示す。ハートビート50は、例えば、同図に示すように、それぞれのAPモジュールでのCPU使用率51と、利用しているメモリ容量52と、利用しているディスク容量53と、利用しているネットワークの帯域幅54とを含む。運用系の各APモジュール100は、これらの情報を取得して、ハートビートとして、それぞれ対応する待機系のAPモジュール200へ通知する。
再び図1を参照すると、待機系の各APモジュール200は、いずれもコンピュータC4上に実現されている。コンピュータC4は、コンピュータC1〜C3のいずれとも機種が異なる。このため、コンピュータC4では、コンピュータC1をエミュレートしたエミュレータVM1と、コンピュータC2をエミュレートしたエミュレータVM2と、コンピュータC3をエミュレートしたエミュレータVM3とが動作している。そして、APモジュール101の待機系APモジュール201がエミュレータVM1、APモジュール102の待機系APモジュール202がエミュレータVM2、およびAPモジュール103の待機系APモジュール203がエミュレータVM3の上でそれぞれ待機している。なお、コンピュータC4がコンピュータC1〜C3のいずれかと同一機種であれば、同一機種用のエミュレータは不要である。
これにより、コンピュータC1上で動作するためのAPモジュール201であっても、コンピュータC4上で動作可能である。APモジュール202,203についても同様である。
なお、以下の説明において、コンピュータとエミュレータとの対比を明確にするために、それぞれを「物理コンピュータ」及び「仮想コンピュータ」と言うことがある。
待機系APモジュール200は、それぞれの運用系APモジュール100に代わってすべての業務処理を実行する機能を備えている。しかし、待機している(待機系でいる)間は業務処理を実行せず、対応する運用系100からのハートビートを受信し、運用系100の動作状態を監視するための処理のみを実行している。従って、待機系200は、ハートビートの受信に関連する処理に必要なリソースのみを使用していて、業務処理を開始するとき(運用系になるとき)に、必要なリソースを確保する。これにより、待機系のAPモジュールが使用するリソースは、運用系のAPモジュールが使用しているリソースより少なくて済む。
ここで、本システムは耐障害システムであるが、耐障害の考え方は種々ある。例えば、複数台のコンピュータが同時にハードウェア障害を起こす確率は極めて低いと考えられる。そこで、同時に複数台で障害が発生することを想定しない場合、コンピュータC4は、最もリソースを使用するアプリケーションのAPモジュールが一つ動作し、且つ、他の待機系APモジュールなどが動作可能なリソースを備えていればよい。これにより、待機系のために必要なリソースを節約できる。
コンピュータC4には、さらに、エミュレータ管理部11と、リソーステーブル12とを含む。
エミュレータ管理部11は、各エミュレータVM1〜VM3へのリソースの割り当てなどを行う。詳細な処理については後述する。
リソーステーブル12は、運用系の各APモジュール100が使用しているリソースを記憶する。例えば、図3に示すように、運用系の各APモジュールのCPU使用率121、利用メモリ容量122、利用ディスク容量123、利用ネットワーク帯域幅124を、それぞれ記憶する。リソーステーブル12に記憶されている情報は、待機系の各APモジュール200が受信したハートビート50に含まれている情報を格納したものである。
次に、コンピュータC4で待機している各APモジュール200が運用系に切り替わるときの処理手順について、図4のフローチャートを用いて説明する。この処理は、各APモジュール201,202,203について、それぞれ独立に行われる処理である。ここでは、アプリケーションAP1(運用系101、待機系201)について説明する。
待機系のAPモジュール201は、運用系のAPモジュール101で障害が発生したかどうかを監視する(S11)。例えば、APモジュール201が、APモジュール101から障害発生を知らせるための電文を受信したとき、あるいは、所定時間以上、APモジュール101からのハートビートを受信しないときなどは、APモジュール101で障害が発生したと判断する。この障害には、コンピュータC1のハードウェア障害によりAPモジュール101が動作しなくなる場合を含む。
APモジュール101で障害が発生すると(S11:Yes)、APモジュール201は、待機状態から運用系として動作可能な状態になるために、エミュレータ管理部11へリソースを確保するよう要求する。エミュレータ管理部11は、リソース確保の要求を受けると、リソーステーブル12を参照して、APモジュール101(AP1)で使用していたリソースの容量を取得する(S12)。そして、エミュレータ管理部11は、コンピュータC4のリソースを、ステップS12で取得した容量だけ確保する(S13)。
リソースが確保されると、APモジュール201は運用系として動作可能となる。そして、APモジュール201はデータベースシステム10を参照し、データの更新状況などに基づいて処理の進行状況を判定し、APモジュール101が行っていた業務処理を引き継いで行う(S14)。
これにより、1台の物理コンピュータ上に複数の仮想コンピュータを実現し、この物理コンピュータ上に複数のアプリケーションの待機系を実現できる。これにより、待機系のため用意しなければならないリソースを節約しつつ、耐障害性の高いシステムを実現できる。
次に、本発明の第2の実施形態に係る耐障害性を備えた情報処理システムについて説明する。第2の実施形態に係るシステムは、複数台の物理コンピュータのいずれかに、複数のアプリケーションの運用系及び待機系のAPモジュールを分散する。なお、第1の実施形態と同様の構成については、同一の符号を付して説明を省略する。
本システムは、例えば図5に示すように、複数台のコンピュータC5〜C8とデータベースシステム10と、リソース管理装置20とがネットワーク9を介して接続されている。本実施形態では、二つのアプリケーション(AP5、AP6)の運用系と待機系とがいずれかのコンピュータで動作している場合について説明するが、三つ以上のアプリケーションが動作する場合も同様である。なお、運用系と待機系との関係は、第1の実施形態と同様である。
アプリケーションAP5、AP6は、いずれも、コンピュータC5〜C8のいずれとも異なる機種のコンピュータC10、C11(図示しない)で動作可能に実装されているものとする。このため、コンピュータC5〜C8では、それぞれ、コンピュータC10をエミュレートしたエミュレータVM5、およびコンピュータC11をエミュレートしたエミュレータVM6が動作している。コンピュータC5〜C8は、さらに、エミュレータ管理部11及びリソーステーブル12を備える。
ここで、コンピュータC5上のエミュレータVM5では、AP5の運用系APモジュール105が動作している。コンピュータC6上のエミュレータVM6では、AP6の運用系APモジュール106が動作している。一方、コンピュータC6上のエミュレータVM5では、AP5の待機系APモジュール205が動作している。コンピュータC7上のエミュレータVM6では、AP6の待機系APモジュール206が動作している。
運用系APモジュール105、106は、第1の実施形態と同様にハートビートを出力する。本実施形態では、ハートビートは、それぞれ対応する待機系APモジュール205、206および以下に説明するリソース管理装置20が受信する。
リソース管理装置20は、例えば汎用的なコンピュータシステムにより構成され、以下に説明するリソース管理装置20内の個々の構成要素または機能は、例えば、コンピュータプログラムを実行することにより実現される。
リソース管理装置20は、コンピュータ選択部21と、APテーブル22と、コンピュータテーブル23と、ステータステーブル24とを有する。
コンピュータ選択部21は、コンピュータC5〜C8の中から待機系のAPモジュールを割り当てるコンピュータを一つ選択する。その詳細な処理は後述する。
APテーブル22は、運用系の各APモジュールについて、それぞれの動作状態に関する情報を記憶する。例えば、APテーブル22は、図6に示すように、運用系の各APモジュールが動作しているコンピュータ名221と、エミュレータ名222と、そのエミュレータがエミュレートしているコンピュータのCPUに関する情報223と、そのAPモジュールが動作するときに利用する可能性がある最大リソースに関する情報224と、そのAPモジュールが現在利用しているリソースに関する情報225とを、データ項目として含む。
最大リソースに関する情報224は、例えば、過去の実績の最大値でもよいし、過去の実績に基づいて統計的に算出し、適宜更新してもよいし、ジョブスケジュールなどに応じて時間帯ごとに変更してもよい。
現在利用しているリソースに関する情報225は、運用系APモジュールから受信したハートビートに含まれるリソースに関する情報に基づいて更新される。
コンピュータテーブル23は、それぞれの物理コンピュータに関する情報を記憶する。例えば、コンピュータテーブル23は、図7に示すように、コンピュータ名231と、コンピュータのリソースに関する仕様の情報232と、現在の空きリソースに関する情報233と、過去の故障回数234と、前回修理を行った日235と、ネットワーク距離236とを、データ項目として含む。
現在の空きリソースに関する情報233は、各運用系APモジュールから受信したハートビートに含まれるリソースに関する情報と、待機系APモジュールが使用しているリソースに基づいて更新される。
ステータステーブル24は、各アプリケーションの運用系及び待機系のAPモジュールが、どの物理コンピュータ上に存在するかを記憶する。ステータステーブル24の一例を図8に示す。
運用系のAPモジュールで何らかの障害が発生した場合、待機系のAPモジュールが必要なリソースを確保して運用系に切り替わる。このときの切り替えの手順は、第1の実施形態と同様に行われる。このとき、待機系であったAPモジュールが運用系に切り替わると、このAPモジュールをバックアップするための待機系が存在しないことになり、耐障害性が低下する。そこで、本実施形態では、新たに運用系となったAPモジュールの待機系APモジュールを起動する。以下、コンピュータC5の障害でAPモジュール105が停止し、APモジュール205が運用系に切り替わった場合を例にとり、その処理手順を図9のフローチャートを用いて説明する。
まず、APモジュール(AP5)205は、自らが運用系に切り替わると、リソース管理装置20へその旨を通知する。リソース管理装置20では、コンピュータ選択部21がこの通知を受信する(S21)。コンピュータ選択部21がこの通知により待機系から運用系への切り替えを検出すると、APテーブル22及びコンピュータテーブル23を参照して、アプリケーションAP5の待機系APモジュールを動作させるコンピュータを選択する(S22)。
コンピュータ選択部21は、例えば、ステータステーブル24において、アプリケーションA5の運用系及び待機系となっていないコンピュータ(ここではコンピュータC7、C8)を対象にして、最大リソース情報224と空きリソース情報233とを比較して、最大リソース以上の空きリソースを有するコンピュータを選択する。CPUの処理能力は、仕様232に含まれるCPU種別により定まるMIPS値及び周波数と、空きリソース233に含まれる空きCPU使用率とに基づいて判断する。ここで、複数の候補があがったときは、その中から信頼度の高いコンピュータを選択してもよい。例えば、故障回数234が少ないもの、前回修理日235からの経過日数が少ないものが、信頼度が高い。
ここでは、ステップS22でコンピュータC8が選択されたものとする。コンピュータ選択部21は、選択されたコンピュータC8に対して、アプリケーションAP5の待機系の立ち上げを指示する(S23)。
立ち上げ指示を受けると、コンピュータC8のエミュレータ管理部11がエミュレータVM5上に待機系として新たにアプリケーションAP5のAPモジュールを立ち上げる。
コンピュータ選択部21は、ステータステーブル24において、アプリケーションAP5の運用系をコンピュータC6、待機系をコンピュータC8に更新する。そして、新たに運用系となったAPモジュール205へ、待機系のアドレス情報(例えば、コンピュータC8のコンピュータ名、エミュレータ名、IPアドレスなど)を通知する(S24)。
上述のようにエミュレータを利用することにより、ハードウェアの制約を受けず、リソースの利用効率の高い耐障害性システムを実現できる。
上述した本発明の実施形態は、本発明の説明のための例示であり、本発明の範囲をそれらの実施形態にのみ限定する趣旨ではない。当業者は、本発明の要旨を逸脱することなしに、他の様々な態様で本発明を実施することができる。
本発明の第1の実施形態に係る耐障害システムの構成図である。 ハートビートのフォーマットの一例を示す図である。 リソーステーブルの一例を示す図である。 待機系から運用系への切り替え処理のフローチャートである。 本発明の第2の実施形態に係る耐障害システムの構成図である。 APテーブルの一例を示す図である。 コンピュータテーブルの一例を示す図である。 ステータステーブルの一例を示す図である。 新たな待機系の割り当て処理のフローチャートである。
符号の説明
C1〜C8…コンピュータ、VM1〜6…エミュレータ、10…データベースシステム、20…リソース管理装置、101〜106、201〜206…APモジュール。

Claims (7)

  1. 第1のコンピュータと、所定の業務処理を行う第1のアプリケーションモジュールが動作している第2のコンピュータとを備え、
    前記第1のコンピュータは、
    前記第1のコンピュータとは異なるコンピュータをエミュレートしたエミュレータと、
    前記第1のアプリケーションモジュールが使用している前記第2のコンピュータのリソースに関する情報を記憶した記憶手段と、
    前記エミュレータ上で動作し、前記第1のアプリケーションモジュールをバックアップするために待機している第2のアプリケーションモジュールと、を備え、
    前記第2のアプリケーションモジュールは、待機状態のときに前記記憶手段を参照し、前記第1のアプリケーションモジュールと同様のリソースを前記第1のコンピュータ上に確保し、前記所定の業務処理を実行可能な状態となる、耐障害性システム。
  2. 前記第1のアプリケーションモジュールは、
    前記第1のコンピュータに対して定期または不定期に、前記第1のアプリケーションモジュールが使用している前記第2のコンピュータのリソースに関する情報を通知する、請求項1記載の耐障害性システム。
  3. 前記第2のアプリケーションモジュールは、
    待機状態のときに、前記第1のアプリケーションモジュールから、所定時間以上前記リソースに関する情報の通知がない場合、前記第1のコンピュータのリソースを確保して前記所定の業務処理を実行可能な状態となる、請求項2記載の耐障害性システム。
  4. 前記エミュレータは、前記第2のコンピュータをエミュレートしている、請求項1記載の耐障害性システム。
  5. 第1のコンピュータをエミュレートした第1のエミュレータと、
    第2のコンピュータをエミュレートした第2のエミュレータと、
    第1のコンピュータで第1の処理を実行する第1のアプリケーションシステムをバックアップするために、前記第1のエミュレータ上で待機している第1のバックアップシステムと、
    第2のコンピュータで第2の処理を実行する第2のアプリケーションシステムをバックアップするために、前記第2のエミュレータ上で待機している第2のバックアップシステムと、
    前記第1及び第2のアプリケーションシステムが、それぞれ使用している第1及び第2のコンピュータのリソースに関する情報を記憶した記憶手段と、を備え、
    前記第1のバックアップシステムは、待機状態のときに前記第1のアプリケーションシステムでの障害発生を検知すると、前記記憶手段を参照して第1のアプリケーションシステムと同様のリソースを確保して前記第1の処理を実行可能な状態となり、
    前記第2のバックアップシステムは、待機状態のときに前記第2のアプリケーションシステムでの障害発生を検知すると、前記記憶手段を参照して第2のアプリケーションシステムと同様のリソースを確保して前記第2の処理を実行可能な状態となる、バックアップ用コンピュータ。
  6. 第1のコンピュータと、所定の業務処理を行う第1のアプリケーションモジュールが動作している第2のコンピュータとを備えた情報処理システムにおいて、
    前記第1のコンピュータが、
    前記第1のコンピュータとは異なるコンピュータをエミュレートしたエミュレータを動作させ、
    前記第1のアプリケーションモジュールが使用している前記第2のコンピュータのリソースに関する情報を記憶手段に格納し、
    前記エミュレータ上で、前記第1のアプリケーションモジュールをバックアップするために待機している第2のアプリケーションモジュールを動作させ、
    前記第2のアプリケーションモジュールは、待機状態のときに前記記憶手段を参照し、前記第1のアプリケーションモジュールと同様のリソースを前記第1のコンピュータ上に確保して、前記所定の業務処理を実行可能な状態となる、耐障害性のための方法。
  7. 第1のコンピュータと、所定の業務処理を行う第1のアプリケーションモジュールが動作している第2のコンピュータとを備えた情報処理システムにおいて、
    前記第1のコンピュータが実行すると、
    前記第1のコンピュータとは異なるコンピュータをエミュレートしたエミュレータを動作させ、
    前記第1のアプリケーションモジュールが使用している前記第2のコンピュータのリソースに関する情報を記憶手段に格納し、
    前記エミュレータ上で、前記第1のアプリケーションモジュールをバックアップするために待機している第2のアプリケーションモジュールを動作させ、
    前記第2のアプリケーションモジュールは、待機状態のときに前記記憶手段を参照し、前記第1のアプリケーションモジュールと同様のリソースを前記第1のコンピュータ上に確保して、前記所定の業務処理を実行可能な状態となる、耐障害性のためのコンピュータプログラム。
JP2004060239A 2004-03-04 2004-03-04 耐障害性システム Pending JP2005250839A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004060239A JP2005250839A (ja) 2004-03-04 2004-03-04 耐障害性システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004060239A JP2005250839A (ja) 2004-03-04 2004-03-04 耐障害性システム

Publications (1)

Publication Number Publication Date
JP2005250839A true JP2005250839A (ja) 2005-09-15

Family

ID=35031264

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004060239A Pending JP2005250839A (ja) 2004-03-04 2004-03-04 耐障害性システム

Country Status (1)

Country Link
JP (1) JP2005250839A (ja)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008097276A (ja) * 2006-10-11 2008-04-24 Hitachi Ltd 障害回復方法、計算機システム及び管理サーバ
JP2008293245A (ja) * 2007-05-24 2008-12-04 Hitachi Ltd フェイルオーバ方法、計算機システム、管理サーバ及び予備サーバの設定方法
JP2008305070A (ja) * 2007-06-06 2008-12-18 Hitachi Communication Technologies Ltd 情報処理装置および情報処理装置システム
JP2011086316A (ja) * 2011-01-31 2011-04-28 Hitachi Ltd 引継方法、計算機システム及び管理サーバ
JP2011216072A (ja) * 2010-04-01 2011-10-27 Accenture Global Services Ltd 再目的化可能回復環境
JP2012027656A (ja) * 2010-07-22 2012-02-09 Intec Inc ディザスタリカバリシステムのための管理装置、方法及びプログラム
JP2012050255A (ja) * 2010-08-27 2012-03-08 Mitsubishi Electric Corp 変電所監視制御システムおよび操作卓の制御機能切替方法
JP2013037433A (ja) * 2011-08-04 2013-02-21 Fujitsu Ltd サーバ、サーバシステムおよびサーバの冗長切り替え方法
WO2013038475A1 (ja) * 2011-09-12 2013-03-21 株式会社日立製作所 遠隔バックアップシステム、及び遠隔バックアップ方法
JP2013196484A (ja) * 2012-03-21 2013-09-30 Toshiba Corp クラスタシステムの構成を管理する構成管理装置
JP2016151816A (ja) * 2015-02-16 2016-08-22 富士通株式会社 管理装置、情報処理システム及び管理プログラム
JP2016536690A (ja) * 2013-11-11 2016-11-24 アマゾン・テクノロジーズ・インコーポレーテッド パーティションベースのデータストリーム処理フレームワーク
JP2017072989A (ja) * 2015-10-07 2017-04-13 株式会社東芝 ロジック実行装置
US9794135B2 (en) 2013-11-11 2017-10-17 Amazon Technologies, Inc. Managed service for acquisition, storage and consumption of large-scale data streams
US9858322B2 (en) 2013-11-11 2018-01-02 Amazon Technologies, Inc. Data stream ingestion and persistence techniques
US10467105B2 (en) 2013-12-20 2019-11-05 Amazon Technologies, Inc. Chained replication techniques for large-scale data streams
US10691716B2 (en) 2013-11-11 2020-06-23 Amazon Technologies, Inc. Dynamic partitioning techniques for data streams
US10768830B1 (en) 2018-07-16 2020-09-08 Amazon Technologies, Inc. Streaming data service with isolated read channels
US10798140B1 (en) 2018-07-16 2020-10-06 Amazon Technologies, Inc. Stream data record reads using push-mode persistent connections
US10855754B1 (en) 2018-07-16 2020-12-01 Amazon Technologies, Inc. Isolated read channel categories at streaming data service
US10956246B1 (en) 2018-07-16 2021-03-23 Amazon Technologies, Inc. Isolated read channel management interfaces at streaming data service
US11070600B1 (en) 2018-07-16 2021-07-20 Amazon Technologies, Inc. Optimization techniques to support lagging readers at streaming data service
US11075984B1 (en) 2018-07-16 2021-07-27 Amazon Technologies, Inc. Workload management at streaming data service supporting persistent connections for reads

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008097276A (ja) * 2006-10-11 2008-04-24 Hitachi Ltd 障害回復方法、計算機システム及び管理サーバ
US8041986B2 (en) 2006-10-11 2011-10-18 Hitachi, Ltd. Take over method for computer system
US8296601B2 (en) 2006-10-11 2012-10-23 Hitachi, Ltd Take over method for computer system
JP2008293245A (ja) * 2007-05-24 2008-12-04 Hitachi Ltd フェイルオーバ方法、計算機システム、管理サーバ及び予備サーバの設定方法
JP2008305070A (ja) * 2007-06-06 2008-12-18 Hitachi Communication Technologies Ltd 情報処理装置および情報処理装置システム
JP2011216072A (ja) * 2010-04-01 2011-10-27 Accenture Global Services Ltd 再目的化可能回復環境
JP2012027656A (ja) * 2010-07-22 2012-02-09 Intec Inc ディザスタリカバリシステムのための管理装置、方法及びプログラム
JP2012050255A (ja) * 2010-08-27 2012-03-08 Mitsubishi Electric Corp 変電所監視制御システムおよび操作卓の制御機能切替方法
JP2011086316A (ja) * 2011-01-31 2011-04-28 Hitachi Ltd 引継方法、計算機システム及び管理サーバ
JP2013037433A (ja) * 2011-08-04 2013-02-21 Fujitsu Ltd サーバ、サーバシステムおよびサーバの冗長切り替え方法
WO2013038475A1 (ja) * 2011-09-12 2013-03-21 株式会社日立製作所 遠隔バックアップシステム、及び遠隔バックアップ方法
JP2013196484A (ja) * 2012-03-21 2013-09-30 Toshiba Corp クラスタシステムの構成を管理する構成管理装置
US10795905B2 (en) 2013-11-11 2020-10-06 Amazon Technologies, Inc. Data stream ingestion and persistence techniques
US10691716B2 (en) 2013-11-11 2020-06-23 Amazon Technologies, Inc. Dynamic partitioning techniques for data streams
JP2016536690A (ja) * 2013-11-11 2016-11-24 アマゾン・テクノロジーズ・インコーポレーテッド パーティションベースのデータストリーム処理フレームワーク
US9794135B2 (en) 2013-11-11 2017-10-17 Amazon Technologies, Inc. Managed service for acquisition, storage and consumption of large-scale data streams
US9858322B2 (en) 2013-11-11 2018-01-02 Amazon Technologies, Inc. Data stream ingestion and persistence techniques
US10635644B2 (en) 2013-11-11 2020-04-28 Amazon Technologies, Inc. Partition-based data stream processing framework
US10467105B2 (en) 2013-12-20 2019-11-05 Amazon Technologies, Inc. Chained replication techniques for large-scale data streams
JP2016151816A (ja) * 2015-02-16 2016-08-22 富士通株式会社 管理装置、情報処理システム及び管理プログラム
JP2017072989A (ja) * 2015-10-07 2017-04-13 株式会社東芝 ロジック実行装置
US10768830B1 (en) 2018-07-16 2020-09-08 Amazon Technologies, Inc. Streaming data service with isolated read channels
US10798140B1 (en) 2018-07-16 2020-10-06 Amazon Technologies, Inc. Stream data record reads using push-mode persistent connections
US10855754B1 (en) 2018-07-16 2020-12-01 Amazon Technologies, Inc. Isolated read channel categories at streaming data service
US10956246B1 (en) 2018-07-16 2021-03-23 Amazon Technologies, Inc. Isolated read channel management interfaces at streaming data service
US11070600B1 (en) 2018-07-16 2021-07-20 Amazon Technologies, Inc. Optimization techniques to support lagging readers at streaming data service
US11075984B1 (en) 2018-07-16 2021-07-27 Amazon Technologies, Inc. Workload management at streaming data service supporting persistent connections for reads
US11509700B2 (en) 2018-07-16 2022-11-22 Amazon Technologies, Inc. Stream data record reads using push-mode persistent connections
US11621999B2 (en) 2018-07-16 2023-04-04 Amazon Technologies, Inc. Isolated read channel categories at streaming data service
US11675501B2 (en) 2018-07-16 2023-06-13 Amazon Technologies, Inc. Streaming data service with isolated read channels

Similar Documents

Publication Publication Date Title
JP2005250839A (ja) 耐障害性システム
JP4496093B2 (ja) 高可用性システムの遠隔エンタープライズ管理
US7284236B2 (en) Mechanism to change firmware in a high availability single processor system
JP4897710B2 (ja) データセンタにおける複数個のサーバーを再起動するための最適の順序を決定する方法
US7188237B2 (en) Reboot manager usable to change firmware in a high availability single processor system
JP6840099B2 (ja) サービス提供システム、資源割り当て方法、及び資源割り当てプログラム
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
CN102341763A (zh) 由扩展为具有场管理服务器功能的平台管控器在本地虚拟机平台层级上在虚拟机场中进行的功率管理
JP4491482B2 (ja) 障害回復方法、計算機、クラスタシステム、管理計算機及び障害回復プログラム
JP2013171301A (ja) ジョブ継続管理装置、ジョブ継続管理方法、及び、ジョブ継続管理プログラム
JP2005250840A (ja) 耐障害システムのための情報処理装置
CN102193780A (zh) 事务实现方法以及事务实现设备
JP2011044110A (ja) ソフトウェアプログラム実行装置、ソフトウェアプログラム実行方法、及びプログラム
JP2007080012A (ja) 再起動方法、システム及びプログラム
JP2005301436A (ja) クラスタシステムおよびクラスタシステムにおける障害回復方法
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
US8036105B2 (en) Monitoring a problem condition in a communications system
JP2000222376A (ja) 計算機システムとその運用方法
US11593141B2 (en) Atomic groups for configuring HCI systems
CN116360865A (zh) 集群管理方法、设备及计算系统
JP3930455B2 (ja) 計算機システム、サービス継続制御プログラム
JP5353378B2 (ja) Haクラスタシステムおよびそのクラスタリング方法
US20220215001A1 (en) Replacing dedicated witness node in a stretched cluster with distributed management controllers
WO2021166229A1 (ja) 呼制御装置、呼処理継続方法、および、呼制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061031

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081021

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090310