JP5625243B2

JP5625243B2 - 情報処理システム、ディザスタリカバリ方法及びディザスタリカバリプログラム

Info

Publication number: JP5625243B2
Application number: JP2009043442A
Authority: JP
Inventors: 義郎内藤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2009-02-26
Filing date: 2009-02-26
Publication date: 2014-11-19
Anticipated expiration: 2029-02-26
Also published as: JP2010198404A

Description

本発明は、情報処理システム、ディザスタリカバリ方法及びディザスタリカバリプログラムに関し、特にジョブ実行環境におけるディザスタリカバリ技術に関する。

近年、ビジネス継続性の観点から自然災害などで被害を受けたシステムを復旧・修復するディザスタリカバリの重要性が高まっている。また、遠隔地の複数の拠点同士がＩＰ（Internet Protocol）網で常時接続される環境も珍しくなくなり、ディザスタリカバリを実現するための技術的土壌も整ってきたといえる。このような環境を背景に業務の基幹システムとして運用されることが多いジョブ実行、管理機能に適した、高度で柔軟なディザスタリカバリ機能を提案することが求められている。

ここで、特許文献１には、ネットワークを介して複数のノードを接続したクラスタシステム中に、ある特定業務を運用する唯一のサーバの存在を決定するノード決定方法が開示されている。当該ノード決定方法では、主サーバ候補ノード群に属するサーバの各々は、立上げ時に、主サーバの選出判断に必要な自己の広報情報を他の全てのノードに提示して立候補する。そして、主サーバ候補ノード群に属するサーバの各々は、自己の広報情報と立候補した他のノードの広報情報とを比較し、自己が適切でないと判断した場合に自己の広報情報の提示を停止して立候補を取下げ、主サーバ候補ノード群の中に他のサーバにより承認された唯一の主サーバを存在させている。

また、特許文献２には、適切なジョブの割当処理を行う通信ネットワークシステムにつちて開示されている。当該システムでは、性能テーブル等の情報を基に複数ドメインジョブを割り当てる計算機を決定している。また、当該システムでは、最適な計算機を決定して、障害ジョブに関する情報を送信し、障害ジョブの実行を依頼している。

再公表特許ＷＯ０1／０５７６８５号公報特開２００２−１０８８３９号公報

ジョブ実行環境の可用性を高めるために、クラスタソフトを利用して二重化構成を採用することが一般的である。しかしながら、この手法は同一システム内の冗長化であり、災害時にシステム全体が不全に陥ったときには役に立たないという問題がある。災害対策として、ディスク全体を遠隔地にミラーリングしておく手法も提案されているが、複数の遠隔地の拠点にミラーリングされている場合、どの拠点がジョブの引継ぎを行うかという問題がある。また、ジョブの実行環境という観点では、拠点間でジョブの実行環境や条件が異なる場合が考えられ、その場合ジョブの引継ぎをどの拠点が行うのが適切なのかを判断する手法がなかった。

本発明はかかる問題を解決するためになされたものであり、障害が発生した場合に、ジョブの引継を適切に行うことができる情報処理システム、ディザスタリカバリ方法及びディザスタリカバリプログラムを提供することを目的とする。

本発明にかかる情報処理システムは、相互にネットワークを介して接続された複数の拠点システムを備えた情報処理システムであって、前記拠点システムのそれぞれは、ジョブを実行するジョブ実行システムと、障害管理を実行する障害管理部を備え、当該障害管理部は、自拠点及び他拠点の障害を検出し、障害拠点情報を記憶手段に格納する障害検出復旧手段と、自拠点システムがマスタの場合には、前記記憶手段に格納された障害拠点情報により特定される障害拠点のジョブが引き継ぎ可能かを他の拠点システムに対して問い合わせ、自拠点システムがマスタでない場合には、ジョブの引継が可能かの問い合せに対して記憶手段に格納された当該障害拠点のジョブの実行環境定義書に基づいて当該ジョブの引継の可否について決定してマスタである拠点システムに対して回答するジョブ実行引継手段とを備えたものである。

本発明にかかるディザスタリカバリ方法は、マスタである拠点システムから、障害拠点情報により特定される障害拠点のジョブが引き継ぎ可能かを他の拠点システムに対して問い合わせるステップと、問い合わせを受けた拠点システムは、ジョブの引継が可能かの問い合せに対して、前記障害拠点のジョブの実行環境定義書に基づいて当該ジョブの引継の可否について決定し、マスタである拠点システムに対して回答するステップとを備えたものである。

本発明にかかるディザスタリカバリプログラムは、自拠点及び他拠点の障害を検出し、障害拠点情報を記憶手段に格納するステップと、自拠点システムがマスタの場合には、前記記憶手段に格納された障害拠点情報により特定される障害拠点のジョブが引き継ぎ可能かを他の拠点システムに対して問い合わせるステップと、自拠点システムがマスタでない場合には、ジョブの引継が可能かの問い合せに対して記憶手段に格納された当該障害拠点のジョブの実行環境定義書に基づいて当該ジョブの引継の可否について決定してマスタである拠点システムに対して回答するステップとをコンピュータに対して実行させるものである。

本発明によれば、障害が発生した場合に、ジョブの引継を適切に行うことができる情報処理システム、ディザスタリカバリ方法及びディザスタリカバリプログラムを提供することができる。

発明の実施の形態１にかかる情報処理システムの構成を示す構成図である。発明の実施の形態１におけるマスタの選出方法を説明するための説明図である。発明の実施の形態１におけるマスタの選出方法を説明するための説明図である。発明の実施の形態１におけるマスタの選出方法を説明するための説明図である。発明の実施の形態１におけるマスタの選出方法を説明するための説明図である。発明の実施の形態１にかかる情報処理システムのメタデータ収集配布手段の動作を説明するための説明図である。発明の実施の形態１にかかる情報処理システムのジョブ実行引継手段の動作を説明するための説明図である。発明の実施の形態１にかかる情報処理システムにおけるジョブの実行環境定義書の例を示す図である。発明の実施の形態２にかかる情報処理システムの構成を示す構成図である。

発明の実施の形態１．
本実施の形態１にかかる情報処理システムでは、ジョブに対してジョブの実行における実行環境の条件を定義する、実行環境定義書を用いている。また、当該情報処理システムでは、災害時に複数拠点が処理不能になった場合に、処理不能拠点のジョブの実行環境定義書に一番適合している拠点を探して、ジョブの引継ぎを行う機能を備えている。

また、当該情報処理システムでは、正常時には複数の拠点に分散するジョブ実行環境が、ひとつのマスタジョブ実行環境を中心としたひとつのマスタクラスタを構成し、マスタは全ての環境にジョブ定義、スケジュール、実行ログといった重要なメタデータをリアルタイムで収集、配布を実行している。ここで、実行環境定義書は、ジョブまたは複数のジョブの単位で定義することができる。実行環境定義書には、ジョブ実行における必須条件と付加条件、拠点間の優先度が定義されている。必須または付加条件には、ジョブ実行の前提となる環境の条件(アプリケーションやデータの存在有無)を記述する。これらの条件の確認のための情報は、本実施の形態１にかかる情報処理システム以外の外部システムから入手できる。

当該情報処理システムは、災害等でいくつかのジョブ実行環境が処理不能になったとき、各拠点が定期的なヘルスチェックで処理不能拠点を検知し、過半数以上が通信可能なとき、業務が継続可能と判断して、多数決でマスタを選出する。また、マスタは処理不能拠点のジョブについて、引継ぎ実行権を設定し、正常拠点に引き継ぎが可能かどうか問い合わせる。各拠点は当該ジョブの実行環境定義書を確認し必須条件と付加条件を満たしているか否かをマスタに伝える。マスタは各拠点の回答が揃ったところで、必須条件を満たしている拠点にジョブ引継ぎ実行権を委譲する。複数の拠点が必須条件を満たしているときは付加条件を確認する。付加条件の満たし具合も同じであれば、実行環境定義書の優先度を確認し、優先度の高い拠点にジョブの引継ぎ実行権を委譲する。

図１は、本実施の形態１にかかる情報処理システムの全体構成を示す図である。図に示されるように、当該情報処理システムは、ネットワークで相互接続された拠点Ａ（拠点システム１００）、拠点Ｂ（拠点システム２００）、拠点Ｃ（拠点システム３００）を備えている。図１においては、拠点Ａについてのみ、その内部を詳細に示している。

拠点Ａにおける拠点システム１００は、ジョブ実行システム１と、当該ジョブ実行システム１１と連携して動作する障害管理部２を備えている。ジョブ実行システム１は、従来よりある一般的な構成を有する。ジョブ実行システム１は、マネージャ１１とジョブ実行サーバ１２を備えている。障害管理部２は、本発明の特徴的な構成を有する。

障害管理部２は、障害検出復旧手段２１と、メタデータ収集配布手段２２と、ジョブ実行引継手段２３とを備えている。これらの手段２１〜２３は、いずれも、他の拠点の各拠点の障害管理部および自拠点のジョブ実行システム１と協調して動作を行う。また、それぞれの手段２１〜２３については後に詳述する。

障害管理部２は、マスタクラスタ領域２４（マスタクラスタ情報記憶手段）と、メタデータ領域２５（メタデータ記憶手段）と、引継領域２６（引継情報記憶手段）とを有する記憶手段を備えている。マスタクラスタ領域２４は、マスタやマスタクラスタの構成情報を格納する。メタデータ領域２５は、ジョブの定義、ジョブ実行のスケジュール定義、実行環境定義書を含むメタデータを格納する。引継領域２６は、引き継いだジョブに関する引継情報を格納する。

障害検出復旧手段２１は、自拠点の障害を検出した場合に、他の拠点に通知を行う機能を有する。障害検出の情報は、例えば、本実施の形態１にかかる情報処理システム以外のシステムから得られる。また、障害検出復旧手段２１は、定期的に各拠点のヘルスチェックを行い、各拠点が正常に動作していることを確認する。

他の拠点からネットワークを介して障害検出通知を受信した場合や、ヘルスチェックに対して一定時間応答がない場合には、当該障害検出復旧手段２１は、マスタの再選出処理を開始する。マスタの再選出処理においては、優先度アルゴリズムを使用する。この優先度アルゴリズムは、入れ替え可能であり、どのようにマスタを選出するかについては限定されない。ここで、優先度アルゴリズムの条件は、複数の拠点でいくつかの拠点が障害になったときに、ただひとつのマスタを選出できることである。

障害検出復旧手段２１は、マスタの再選出処理によって、マスタの選出を完了すると、新たに選出された新マスタに関する情報、新マスタと通信可能な拠点からなるマスタクラスタに関する情報、および障害拠点の情報が生成する。障害検出復旧手段２１は、生成したこれらの情報を、マスタクラスタ領域２４に格納する。その後、ジョブ実行引継手段２３が所定の処理を開始する。

メタデータ収集配布手段２２は、マスタクラスタ領域２４を確認し、自分がマスタでなければ、メタデータ領域２５に格納された、ジョブ実行のスケジュール定義、実行環境定義書といったメタデータを更新する。メタデータ収集配布手段２２は、ジョブ実行システム１から送付されたメタデータを受信した場合、受信したメタデータをメタデータ領域２５に格納するとともに、マスタにメタデータを送付する。また、メタデータ収集配布手段２２は、マスタから他拠点のメタデータを受信した場合は、受信したメタデータに基づいて、メタデータ領域２５に格納されたメタデータを更新する。

メタデータ収集配布手段２２は、マスタクラスタ領域２４を確認し、自分がマスタの場合は、他拠点からメタデータを受信すると、メタデータ領域２５に、受信したメタデータを格納することによりメタデータを更新する。さらに、メタデータ収集配布手段２２は、メタデータの送付元である拠点以外の拠点に対して、更新されたメタデータを配布する。また、メタデータ収集配布手段２２は、自拠点のジョブ実行システム１から送付されたメタデータを受信した場合、受信したメタデータに基づきメタデータ領域２５を更新するとともに、さらに、更新後のメタデータを他の拠点全てに対して配布する。

ジョブ実行引継手段２３は、自分がマスタの場合、マスタクラスタ領域２４を確認し、障害拠点を確認後、メタデータ領域２５を確認し、障害拠点のジョブ一覧および実行環境定義書を含むメタデータを取得する。ジョブ実行引継手段２３は、取得したメタデータに含まれるジョブ一覧により特定される各ジョブが引き継ぎ可能かを、自分以外の拠点（例えば、拠点Ｂ、Ｃ）に対して問い合わせる。ジョブ実行引継手段２３は、自分以外の各拠点からの回答が揃ったところで、各拠点の中からジョブ引継ぎ実行権の委譲先をひとつ決定し、各拠点に委譲通知を送付する。ジョブ実行引継手段２３は、委譲先として、まず必須条件を満たしている拠点を選択する。ここで、ジョブ実行引継手段２３は、複数の拠点が必須条件を満たしているときは付加条件を確認し、付加条件を満たしている項目数が最も多い拠点を選択する。また、付加条件も同じ場合、ジョブ実行引継手段２３は、実行環境定義書の優先度を確認し、優先度の高い拠点を選択する。

ジョブ実行引継手段２３は、自分がマスタでない場合、マスタから引継ぎ問い合わせを受信したときに、メタデータ領域２５を確認する。具体的には、ジョブ実行引継手段２３は、メタデータ領域２５に格納された当該ジョブの実行環境定義書を確認し、自拠点の環境が必須条件及び付加条件を満たしているか確認する。自拠点の環境の情報は、例えば、本実施の形態１にかかる情報処理システム以外のシステムから入手できる。

ジョブ実行引継手段２３は、条件確認が完了した場合には、マスタに対して、確認結果を回答する。ジョブ実行引継手段２３は、マスタから受信した委譲通知において、自拠点が委譲先に指定されていた場合は、当該ジョブを引き継いだ旨を、引継領域２６に格納する。また、ジョブ実行引継手段２３は、当該ジョブの定義情報、スケジュール情報をメタデータ領域２５から取得し、ジョブ実行システム１に対してそれらの情報を送付し、ジョブ実行の引継ぎを指示する。

続いて、図１〜図８を用いて、本実施の形態１にかかる情報処理システムの処理について、詳細に説明する。

まず、障害検出復旧手段２１が各障害パターンでどのようにマスタの選出を行うのかを図２〜図５を用いて説明する。
マスタの選出で用いる優先度アルゴリズムには、一般に多数決アルゴリズムと呼ばれているアルゴリズムを例に挙げて説明する。ここで、多数決アルゴリズムは、全拠点の過半数の投票を得た拠点をマスタとするアルゴリズムである。

図２に示すパターン１は、拠点Ｃに異常が発生した場合である。
まず、拠点Ａ及び拠点Ｂがそれぞれ障害検出復旧手段２１によりヘルスチェックを実行して拠点Ｃの異常を検知する（Ｓ２０１）。このとき、拠点Ａ、拠点Ｂのそれぞれは、障害検出復旧手段２１によって、マスタの再選出処理を開始する。拠点Ａ及び拠点Ｃの障害検出復旧手段２１は、多数決アルゴリズムによって過半数の拠点の正常を確認する（Ｓ２０２）。そして、本例では、多数決により拠点Ａが選出される。

この場合、拠点Ａと拠点Ｂによりマスタクラスタが構成され、障害拠点は拠点Ｃである。多数決において拠点Ａと拠点Ｂの票が同数の場合には、一般的な優先度アルゴリズムによって、マスタが決定される。

次に、図３に示すパターン２は、マスタである拠点Ａに異常が発生した場合である。
まず、拠点Ｂ及び拠点Ｃがそれぞれ障害検出復旧手段２１によりヘルスチェックを実行して、マスタである拠点Ａの異常を検知する（Ｓ３０１）。このとき、拠点Ｂ、拠点Ｃのそれぞれは、障害検出復旧手段２１によって、マスタの再選出処理を開始する。拠点Ｂ及び拠点Ｃの障害検出復旧手段２１は、多数決アルゴリズムによって過半数の拠点の正常を確認する（Ｓ３０２）。そして、本例では、多数決により拠点Ｂが新マスタに選出される。

図４に示すパターン３は、拠点Ａと拠点Ｃに異常が発生した場合である。
まず、拠点Ｂが障害検出復旧手段２１によりヘルスチェックを実行して、拠点Ａ及び拠点Ｃの異常を検知する（Ｓ４０１）。このとき、拠点Ｂは、障害検出復旧手段２１によって、マスタの再選出処理を開始する。拠点Ｂは多数決アルゴリズムにより、過半数の正常が確認できないため(Ｓ４０２)、マスタは選出せず、自業務のみの継続を行う（Ｓ４０３）。すなわち、拠点Ｂは、ジョブの引継ぎ実行は行わない。また、この場合も拠点Ｂは、障害検出復旧手段２１により、定期的にヘルスチェックを行い、拠点Ａ及び拠点Ｃが復旧するのを待ち、復旧が確認できた場合は、マスタの再選出を開始する。

パターン３の場合では、多数決アルゴリズムではマスタは選出されないが、他の優先度アルゴリズムを採用した場合には、パターン３でもマスタが選出されることがありうる。ただし、本実施の形態１にかかる情報処理システムでは、どの場合にも全ての拠点でマスタが複数選出されるような優先度アルゴリズムは、適用できない。

図５に示すパターン４は、ネットワークに異常が発生した場合である。
このパターン４は、基本的にはパターン３と同じでマスタは選出されず、各拠点は自業務のみの継続を行う。即ち、拠点Ｂが障害検出復旧手段２１によりヘルスチェックを実行して、ネットワークの異常を検知する（Ｓ５０１）。このとき、拠点Ｂは、障害検出復旧手段２１によって、マスタの再選出処理を開始する。拠点Ｂは多数決アルゴリズムにより、過半数の正常が確認できないため(Ｓ５０２)、マスタは選出せず、自業務のみの継続を行う（Ｓ５０３）。

続いて、図６を用いて、メタデータ収集配布手段２２の動作について、説明する。
まず、各拠点のメタデータ収集配布手段２２は、メタデータが更新された際にジョブ実行システム１からメタデータを受け取る。メタデータ収集配布手段２２は、受け取ったメタデータをメタデータ領域２５に格納する(Ｓ６０１)。次に、メタデータ収集配布手段２２は、マスタである拠点Ａに対してメタデータを送付する(Ｓ６０２）。

マスタである拠点Ａのメタデータ収集配布手段２２は、送付されたメタデータをメタデータ領域２５に格納する(Ｓ６０３）。その後、マスタである拠点Ａのメタデータ収集配布手段２２は、メタデータの送付拠点以外の拠点（本例では、拠点Ｂ）にメタデータを配布する（Ｓ６０４）。メタデータの配布を受けた拠点（本例では、拠点Ｂ）は、メタデータ収集配布手段２２により、メタデータ領域２５にメタデータを格納する。なお、マスタのメタデータが更新された場合は、ステップＳ６０３の手順から開始される。

続いて、図７を用いて、ジョブ実行引継手段２３の動作について、説明する。
まず、マスタである拠点Ａのジョブ実行引継手段２３は、マスタクラスタ領域２４から、障害拠点（本例では拠点Ｄ）の情報を読み取り、メタデータ領域２５からメタデータに含まれる障害拠点のジョブ情報及び実行環境定義書を取得する(Ｓ７０１)。

次に、マスタである拠点Ａのジョブ実行引継手段２３は、ジョブ毎に、障害拠点を除く各拠点（本例では、拠点Ｂと拠点Ｃ）に対してジョブが引き継ぎ可能かを問い合わせる(Ｓ７０２)。

各拠点（本例では、拠点Ｂと拠点Ｃ）のジョブ実行引継手段２３は、問い合わせられたジョブの実行環境定義書をそれぞれの拠点のメタデータ領域２５から取得し、実行環境定義書に記述されている必須条件及び付加条件を確認して、確認結果をマスタである拠点Ａに回答する（Ｓ７０３）。マスタである拠点Ａのジョブ実行引継手段２３は、回答結果を確認し、ジョブの引継ぎ実行権をどの拠点が獲得したか（本例では、拠点Ｃ）を各拠点（本例では、拠点Ｂと拠点Ｃ）に対して通知する（Ｓ７０４）。

各拠点（本例では、拠点Ｂと拠点Ｃ）のジョブ実行引継手段２３は、通知結果を確認する。引継ぎ実行権を獲得した拠点（本例では、拠点Ｃ）のジョブ実行引継手段２３は、メタデータ領域２５から引き継ぐジョブのメタデータを取得し、引継領域２６に格納する。そして、拠点Ｃのジョブ実行引継手段２３は、ジョブ実行システム１に対してメタデータの送付とジョブ実行の引継ぎ指示を行う。

ここで、図８にジョブの実行環境定義書の例を示す。この例では、必須条件に（１）１２：００以降のＤＩＳＫＡのバックアップと、（２）アプリケーションＡの存在が指定してある。また、付加条件にジョブ実行数が１００以下と指定してある。これらの条件の成立有無は、本実施の形態における障害管理部２以外のシステムから確認可能である。また優先度が、拠点Ａ、拠点Ｂ、拠点Ｃの順としているため、必須条件、付加条件が同じ場合にはこの順番で実行権の委譲順位が決定される。

以上、説明した本実施の形態にかかる情報処理システムによれば、次のような効果を奏する。
第一の効果は、ジョブの実行条件が異なる複数の拠点がある場合に、ジョブの引継ぎ実行が確実に行える拠点で行われることである。その理由は、一般的にジョブの実行環境は、ジョブが処理する業務データの有無やインストールされているアプリケーションや業務システムの違いで、特定の条件を満たした拠点でしか実行できない場合があると考えられるが、本発明では、各拠点に対してジョブが実行可能か問い合わせを行い、必須条件を満たしている条件の拠点に対して実行権を委譲しているからである。

第二の効果は、ジョブの実行環境定義書の付加条件や優先度を用いることによって、必須条件を満たした拠点の中からより、最適な拠点にジョブの引継ぎ実行権を委譲できることである。

第三の効果は、拠点が増えたり、拠点のジョブ実行環境が変わった場合でも、ジョブの引継ぎ実行が最適な拠点で行われることである。その理由は、障害発生時にジョブの実行環境定義書に従い、各拠点が条件の適合度を判断してマスタに回答するからである。

第四の効果は、マスタ選出の優先度アルゴリズムを変更することで、災害発生時にジョブの引継ぎ実行を行うかを柔軟に選択可能になることである。この理由は、例えば、本発明の実施の形態１では、多数決アルゴリズムを用いて、過半数以上の拠点が正常な場合に引継ぎ実行を行うとしていたが、特定の拠点の優先度を高くしたり、特定の拠点をマスタクラスタから排除したりすることも、優先度アルゴリズムを変更することで可能であり、各拠点の特性にあったアルゴリズムに変更することで、災害復旧を柔軟に行うことができる。

発明の実施の形態２．
図９は、本実施の形態２にかかる情報処理システムの全体構成を示す図である。図に示されるように、当該情報処理システムは、ネットワークで相互接続された拠点Ａ、拠点Ｂ、拠点Ｃを備えている。図１においては、拠点Ａについてのみ、その内部を詳細に示している。

拠点Ａにおける情報処理システム１０は、ジョブ実行システム１と、当該ジョブ実行システム１１と連携して動作する障害管理部２を備えている。ジョブ実行システム１は、従来よりある一般的な構成を有する。障害管理部２は、本発明の特徴的な構成を有する。

障害管理部２は、障害検出復旧手段２１と、ジョブ実行引継手段２３とを備えている。これらの手段２１、２３は、いずれも、他の拠点の各拠点の障害管理部および自拠点のジョブ実行システム１と協調して動作を行う。

また、障害管理部２は、マスタクラスタ領域２４（マスタクラスタ情報記憶手段）と、、引継領域２６（引継情報記憶手段）とを備えている。マスタクラスタ領域２４は、マスタやマスタクラスタの構成情報を格納する。引継領域２６は、引き継いだジョブに関する引継情報を格納する。

また、本実施の形態２にかかる情報処理システムでは、拠点１０とは別に、メタデータを管理するメタデータ管理部４０が存在する。メタデータ管理部４０は、メタデータ収集配布手段４１と、メタデータ領域４２を備えている。メタデータ収集配布手段４１と、メタデータ領域４２のそれぞれは、本実施の形態１におけるメタデータ収集配布手段２２と、メタデータ領域２５と同等の機能を有する。

このように、本実施の形態２が発明の実施の形態１と異なる点は、メタデータ収集配布手段を、障害管理部２から独立させてメタデータ管理部４０としたことである。このメタデータ管理部４０は、同一拠点内にある必要はなく、複数あってもよい。この構成により、メタデータをより信頼性の高い施設で管理したり、また、各拠点とは別にメタデータをより分散させて、冗長性を高め、信頼性を向上させることも可能となる。

１ジョブ実行システム
２障害管理部
１１マネージャ
１２ジョブ実行サーバ
２１障害検出復旧手段
２２メタデータ収集配布手段
２３ジョブ実行引継手段
２４マスタクラスタ領域
２５メタデータ領域
２６引継領域
１００拠点Ａ
２００拠点Ｂ
３００拠点Ｃ
４００拠点Ｄ

Claims

相互にネットワークを介して接続された複数の拠点システムを備えた情報処理システムであって、前記拠点システムのそれぞれは、
ジョブを実行するジョブ実行システムと、
障害管理を実行する障害管理部とを備え、
当該障害管理部は、
自拠点及び他拠点の障害を検出し、障害拠点情報を記憶手段に格納し、自拠点システム以外の他の各拠点システムとの間でジョブ実行のスケジュール定義及び実行環境定義書を含むメタデータの集取及び配布を行うマスタを選出する障害検出復旧手段と、
ジョブ実行引継手段とを備え、
前記ジョブ実行引継手段は、
前記マスタの選出の結果、自拠点システムが前記マスタの場合には、前記記憶手段に格納された障害拠点情報により特定される障害拠点のジョブが引き継ぎ可能かを他の拠点システムに対して問い合わせ、
前記マスタの選出の結果、自拠点システムが前記マスタでない場合には、ジョブの引継が可能かの問い合せに対して前記記憶手段に格納された当該障害拠点のジョブの実行可否の前提となる環境条件の情報を含む実行環境定義書に基づいて当該ジョブの引継の可否について決定し、前記マスタである拠点システムに対して回答する、
情報処理システム。
前記情報処理システムは、さらに、自拠点システムが前記マスタの場合には、前記メタデータを他拠点システムから取得したときにその他の拠点システムに配布し、自拠点システムが前記マスタでない場合には、自拠点システムにおけるメタデータの更新があったときに、マスタである拠点システムに対して送付するメタデータ収集配布手段を備えたことを特徴とする請求項１に記載の情報処理システム。
前記メタデータ収集配布手段は、各拠点システムに設けられていることを特徴とする請求項２に記載の情報処理システム。
前記メタデータ収集配布手段は、各拠点システムから独立して設けられていることを特徴とする請求項２に記載の情報処理システム。
前記障害検出復旧手段は、自拠点及び他拠点の障害を検出した場合に、マスタの再選出処理を実行することを特徴とする請求項１〜４いずれか１項に記載の情報処理システム。
前記障害検出復旧手段は、マスタの再選出処理において、優先度に応じてマスタを再選出することを特徴とする請求項５に記載の情報処理システム。
前記ジョブ実行引継手段は、自拠点システムがマスタの場合に、ジョブの引継に関する問い合せに対する回答に基づいて、委譲先を決定し、ジョブの委譲先となる拠点システムに対して、委譲先である旨を通知することを特徴とする請求項１〜６のいずれか１項に記載の情報処理システム。
前記ジョブ実行引継手段は、委譲先の決定を、実行環境定義書に記載された拠点システムの優先度に基づいて実行することを特徴とする請求項７に記載の情報処理システム。
自拠点及び他拠点の障害を検出し、障害拠点情報を自拠点システムが備える記憶手段に格納し、自拠点システム以外の他の各拠点システムとの間でジョブ実行のスケジュール定義及び実行環境定義書を含むメタデータの集取及び配布を行うマスタを選出するステップと、
マスタである拠点システムから、障害拠点情報により特定される障害拠点のジョブが引き継ぎ可能かを他の拠点システムに対して問い合わせるステップと、
問い合わせを受けた拠点システムは、ジョブの引継が可能かの問い合せに対して、前記障害拠点のジョブの実行環境定義書に基づいて当該ジョブの実行可否の前提となる環境条件の情報を含む実行環境定義書に基づいて引継の可否について決定し、前記マスタである拠点システムに対して回答するステップとを備えたディザスタリカバリ方法。
マスタ以外の拠点システムから、ジョブ実行のスケジュール定義及び実行環境定義書を含むメタデータの更新があったときに、マスタである拠点システムに対して送付するステップと、
マスタである拠点システムから、メタデータを他拠点システムから取得したときにその他の拠点システムに配布するシステムとを備えたことを特徴とする請求項９に記載のディザスタリカバリ方法。
自拠点及び他拠点の障害を検出した場合に、マスタの再選出処理を実行するステップを備えたことを特徴とする請求項９又は１０に記載のディザスタリカバリ方法。
マスタの再選出処理において、優先度に応じてマスタを再選出することを特徴とする請求項１１に記載のディザスタリカバリ方法。
マスタである拠点システムは、ジョブの引継に関する問い合せに対する回答に基づいて、委譲先を決定し、ジョブの委譲先となる拠点システムに対して、委譲先である旨を通知することを特徴とする請求項９〜１２のいずれか１項に記載のディザスタリカバリ方法。
委譲先の決定を、実行環境定義書に記載された拠点システムの優先度に基づいて実行することを特徴とする請求項１３に記載のディザスタリカバリ方法。
自拠点及び他拠点の障害を検出し、障害拠点情報を自拠点システムが備える記憶手段に格納し、自拠点システム以外の他の各拠点システムとの間でジョブ実行のスケジュール定義及び実行環境定義書を含むメタデータの集取及び配布を行うマスタを選出するステップと、
自拠点システムが前記マスタの場合には、前記記憶手段に格納された障害拠点情報により特定される障害拠点のジョブが引き継ぎ可能かを他の拠点システムに対して問い合わせるステップと、
自拠点システムが前記マスタでない場合には、ジョブの引継が可能かの問い合せに対して前記記憶手段に格納された当該障害拠点のジョブの実行可否の前提となる環境条件の情報を含む実行環境定義書に基づいて当該ジョブの引継の可否について決定して前記マスタである拠点システムに対して回答するステップとを自拠点が備えるコンピュータに対して実行させるディザスタリカバリプログラム。
自拠点システムがマスタの場合には、ジョブ実行のスケジュール定義及び実行環境定義書を含むメタデータを他拠点システムから取得したときにその他の拠点システムに配布するステップと、
自拠点システムがマスタでない場合には、自拠点システムにおけるメタデータの更新があったときに、マスタである拠点システムに対して送付するステップとを備えたことを特徴とする請求項１５に記載のディザスタリカバリプログラム。
自拠点及び他拠点の障害を検出した場合に、マスタの再選出処理を実行するステップを備えたことを特徴とする請求項１５又は１６に記載のディザスタリカバリプログラム。
マスタの再選出処理ステップにおいて、優先度に応じてマスタを再選出することを特徴とする請求項１７に記載のディザスタリカバリプログラム。
自拠点システムがマスタの場合に、ジョブの引継に関する問い合せに対する回答に基づいて、委譲先を決定し、ジョブの委譲先となる拠点システムに対して、委譲先である旨を通知するステップをさらに備えたことを特徴とする請求項１５〜１８のいずれか１項に記載のディザスタリカバリプログラム。
委譲先の決定を、実行環境定義書に記載された拠点システムの優先度に基づいて実行することを特徴とする請求項１９に記載のディザスタリカバリプログラム。