JP5625243B2 - 情報処理システム、ディザスタリカバリ方法及びディザスタリカバリプログラム - Google Patents
情報処理システム、ディザスタリカバリ方法及びディザスタリカバリプログラム Download PDFInfo
- Publication number
- JP5625243B2 JP5625243B2 JP2009043442A JP2009043442A JP5625243B2 JP 5625243 B2 JP5625243 B2 JP 5625243B2 JP 2009043442 A JP2009043442 A JP 2009043442A JP 2009043442 A JP2009043442 A JP 2009043442A JP 5625243 B2 JP5625243 B2 JP 5625243B2
- Authority
- JP
- Japan
- Prior art keywords
- master
- base
- job
- site
- metadata
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Description
本実施の形態1にかかる情報処理システムでは、ジョブに対してジョブの実行における実行環境の条件を定義する、実行環境定義書を用いている。また、当該情報処理システムでは、災害時に複数拠点が処理不能になった場合に、処理不能拠点のジョブの実行環境定義書に一番適合している拠点を探して、ジョブの引継ぎを行う機能を備えている。
マスタの選出で用いる優先度アルゴリズムには、一般に多数決アルゴリズムと呼ばれているアルゴリズムを例に挙げて説明する。ここで、多数決アルゴリズムは、全拠点の過半数の投票を得た拠点をマスタとするアルゴリズムである。
まず、拠点A及び拠点Bがそれぞれ障害検出復旧手段21によりヘルスチェックを実行して拠点Cの異常を検知する(S201)。このとき、拠点A、拠点Bのそれぞれは、障害検出復旧手段21によって、マスタの再選出処理を開始する。拠点A及び拠点Cの障害検出復旧手段21は、多数決アルゴリズムによって過半数の拠点の正常を確認する(S202)。そして、本例では、多数決により拠点Aが選出される。
まず、拠点B及び拠点Cがそれぞれ障害検出復旧手段21によりヘルスチェックを実行して、マスタである拠点Aの異常を検知する(S301)。このとき、拠点B、拠点Cのそれぞれは、障害検出復旧手段21によって、マスタの再選出処理を開始する。拠点B及び拠点Cの障害検出復旧手段21は、多数決アルゴリズムによって過半数の拠点の正常を確認する(S302)。そして、本例では、多数決により拠点Bが新マスタに選出される。
まず、拠点Bが障害検出復旧手段21によりヘルスチェックを実行して、拠点A及び拠点Cの異常を検知する(S401)。このとき、拠点Bは、障害検出復旧手段21によって、マスタの再選出処理を開始する。拠点Bは多数決アルゴリズムにより、過半数の正常が確認できないため(S402)、マスタは選出せず、自業務のみの継続を行う(S403)。すなわち、拠点Bは、ジョブの引継ぎ実行は行わない。また、この場合も拠点Bは、障害検出復旧手段21により、定期的にヘルスチェックを行い、拠点A及び拠点Cが復旧するのを待ち、復旧が確認できた場合は、マスタの再選出を開始する。
このパターン4は、基本的にはパターン3と同じでマスタは選出されず、各拠点は自業務のみの継続を行う。即ち、拠点Bが障害検出復旧手段21によりヘルスチェックを実行して、ネットワークの異常を検知する(S501)。このとき、拠点Bは、障害検出復旧手段21によって、マスタの再選出処理を開始する。拠点Bは多数決アルゴリズムにより、過半数の正常が確認できないため(S502)、マスタは選出せず、自業務のみの継続を行う(S503)。
まず、各拠点のメタデータ収集配布手段22は、メタデータが更新された際にジョブ実行システム1からメタデータを受け取る。メタデータ収集配布手段22は、受け取ったメタデータをメタデータ領域25に格納する(S601)。次に、メタデータ収集配布手段22は、マスタである拠点Aに対してメタデータを送付する(S602)。
まず、マスタである拠点Aのジョブ実行引継手段23は、マスタクラスタ領域24から、障害拠点(本例では拠点D)の情報を読み取り、メタデータ領域25からメタデータに含まれる障害拠点のジョブ情報及び実行環境定義書を取得する(S701)。
第一の効果は、ジョブの実行条件が異なる複数の拠点がある場合に、ジョブの引継ぎ実行が確実に行える拠点で行われることである。その理由は、一般的にジョブの実行環境は、ジョブが処理する業務データの有無やインストールされているアプリケーションや業務システムの違いで、特定の条件を満たした拠点でしか実行できない場合があると考えられるが、本発明では、各拠点に対してジョブが実行可能か問い合わせを行い、必須条件を満たしている条件の拠点に対して実行権を委譲しているからである。
図9は、本実施の形態2にかかる情報処理システムの全体構成を示す図である。図に示されるように、当該情報処理システムは、ネットワークで相互接続された拠点A、拠点B、拠点Cを備えている。図1においては、拠点Aについてのみ、その内部を詳細に示している。
2 障害管理部
11 マネージャ
12 ジョブ実行サーバ
21 障害検出復旧手段
22 メタデータ収集配布手段
23 ジョブ実行引継手段
24 マスタクラスタ領域
25 メタデータ領域
26 引継領域
100 拠点A
200 拠点B
300 拠点C
400 拠点D
Claims (20)
- 相互にネットワークを介して接続された複数の拠点システムを備えた情報処理システムであって、前記拠点システムのそれぞれは、
ジョブを実行するジョブ実行システムと、
障害管理を実行する障害管理部とを備え、
当該障害管理部は、
自拠点及び他拠点の障害を検出し、障害拠点情報を記憶手段に格納し、自拠点システム以外の他の各拠点システムとの間でジョブ実行のスケジュール定義及び実行環境定義書を含むメタデータの集取及び配布を行うマスタを選出する障害検出復旧手段と、
ジョブ実行引継手段とを備え、
前記ジョブ実行引継手段は、
前記マスタの選出の結果、自拠点システムが前記マスタの場合には、前記記憶手段に格納された障害拠点情報により特定される障害拠点のジョブが引き継ぎ可能かを他の拠点システムに対して問い合わせ、
前記マスタの選出の結果、自拠点システムが前記マスタでない場合には、ジョブの引継が可能かの問い合せに対して前記記憶手段に格納された当該障害拠点のジョブの実行可否の前提となる環境条件の情報を含む実行環境定義書に基づいて当該ジョブの引継の可否について決定し、前記マスタである拠点システムに対して回答する、
情報処理システム。 - 前記情報処理システムは、さらに、自拠点システムが前記マスタの場合には、前記メタデータを他拠点システムから取得したときにその他の拠点システムに配布し、自拠点システムが前記マスタでない場合には、自拠点システムにおけるメタデータの更新があったときに、マスタである拠点システムに対して送付するメタデータ収集配布手段を備えたことを特徴とする請求項1に記載の情報処理システム。
- 前記メタデータ収集配布手段は、各拠点システムに設けられていることを特徴とする請求項2に記載の情報処理システム。
- 前記メタデータ収集配布手段は、各拠点システムから独立して設けられていることを特徴とする請求項2に記載の情報処理システム。
- 前記障害検出復旧手段は、自拠点及び他拠点の障害を検出した場合に、マスタの再選出処理を実行することを特徴とする請求項1〜4いずれか1項に記載の情報処理システム。
- 前記障害検出復旧手段は、マスタの再選出処理において、優先度に応じてマスタを再選出することを特徴とする請求項5に記載の情報処理システム。
- 前記ジョブ実行引継手段は、自拠点システムがマスタの場合に、ジョブの引継に関する問い合せに対する回答に基づいて、委譲先を決定し、ジョブの委譲先となる拠点システムに対して、委譲先である旨を通知することを特徴とする請求項1〜6のいずれか1項に記載の情報処理システム。
- 前記ジョブ実行引継手段は、委譲先の決定を、実行環境定義書に記載された拠点システムの優先度に基づいて実行することを特徴とする請求項7に記載の情報処理システム。
- 自拠点及び他拠点の障害を検出し、障害拠点情報を自拠点システムが備える記憶手段に格納し、自拠点システム以外の他の各拠点システムとの間でジョブ実行のスケジュール定義及び実行環境定義書を含むメタデータの集取及び配布を行うマスタを選出するステップと、
マスタである拠点システムから、障害拠点情報により特定される障害拠点のジョブが引き継ぎ可能かを他の拠点システムに対して問い合わせるステップと、
問い合わせを受けた拠点システムは、ジョブの引継が可能かの問い合せに対して、前記障害拠点のジョブの実行環境定義書に基づいて当該ジョブの実行可否の前提となる環境条件の情報を含む実行環境定義書に基づいて引継の可否について決定し、前記マスタである拠点システムに対して回答するステップとを備えたディザスタリカバリ方法。 - マスタ以外の拠点システムから、ジョブ実行のスケジュール定義及び実行環境定義書を含むメタデータの更新があったときに、マスタである拠点システムに対して送付するステップと、
マスタである拠点システムから、メタデータを他拠点システムから取得したときにその他の拠点システムに配布するシステムとを備えたことを特徴とする請求項9に記載のディザスタリカバリ方法。 - 自拠点及び他拠点の障害を検出した場合に、マスタの再選出処理を実行するステップを備えたことを特徴とする請求項9又は10に記載のディザスタリカバリ方法。
- マスタの再選出処理において、優先度に応じてマスタを再選出することを特徴とする請求項11に記載のディザスタリカバリ方法。
- マスタである拠点システムは、ジョブの引継に関する問い合せに対する回答に基づいて、委譲先を決定し、ジョブの委譲先となる拠点システムに対して、委譲先である旨を通知することを特徴とする請求項9〜12のいずれか1項に記載のディザスタリカバリ方法。
- 委譲先の決定を、実行環境定義書に記載された拠点システムの優先度に基づいて実行することを特徴とする請求項13に記載のディザスタリカバリ方法。
- 自拠点及び他拠点の障害を検出し、障害拠点情報を自拠点システムが備える記憶手段に格納し、自拠点システム以外の他の各拠点システムとの間でジョブ実行のスケジュール定義及び実行環境定義書を含むメタデータの集取及び配布を行うマスタを選出するステップと、
自拠点システムが前記マスタの場合には、前記記憶手段に格納された障害拠点情報により特定される障害拠点のジョブが引き継ぎ可能かを他の拠点システムに対して問い合わせるステップと、
自拠点システムが前記マスタでない場合には、ジョブの引継が可能かの問い合せに対して前記記憶手段に格納された当該障害拠点のジョブの実行可否の前提となる環境条件の情報を含む実行環境定義書に基づいて当該ジョブの引継の可否について決定して前記マスタである拠点システムに対して回答するステップとを自拠点が備えるコンピュータに対して実行させるディザスタリカバリプログラム。 - 自拠点システムがマスタの場合には、ジョブ実行のスケジュール定義及び実行環境定義書を含むメタデータを他拠点システムから取得したときにその他の拠点システムに配布するステップと、
自拠点システムがマスタでない場合には、自拠点システムにおけるメタデータの更新があったときに、マスタである拠点システムに対して送付するステップとを備えたことを特徴とする請求項15に記載のディザスタリカバリプログラム。 - 自拠点及び他拠点の障害を検出した場合に、マスタの再選出処理を実行するステップを備えたことを特徴とする請求項15又は16に記載のディザスタリカバリプログラム。
- マスタの再選出処理ステップにおいて、優先度に応じてマスタを再選出することを特徴とする請求項17に記載のディザスタリカバリプログラム。
- 自拠点システムがマスタの場合に、ジョブの引継に関する問い合せに対する回答に基づいて、委譲先を決定し、ジョブの委譲先となる拠点システムに対して、委譲先である旨を通知するステップをさらに備えたことを特徴とする請求項15〜18のいずれか1項に記載のディザスタリカバリプログラム。
- 委譲先の決定を、実行環境定義書に記載された拠点システムの優先度に基づいて実行することを特徴とする請求項19に記載のディザスタリカバリプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009043442A JP5625243B2 (ja) | 2009-02-26 | 2009-02-26 | 情報処理システム、ディザスタリカバリ方法及びディザスタリカバリプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009043442A JP5625243B2 (ja) | 2009-02-26 | 2009-02-26 | 情報処理システム、ディザスタリカバリ方法及びディザスタリカバリプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010198404A JP2010198404A (ja) | 2010-09-09 |
JP5625243B2 true JP5625243B2 (ja) | 2014-11-19 |
Family
ID=42823050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009043442A Expired - Fee Related JP5625243B2 (ja) | 2009-02-26 | 2009-02-26 | 情報処理システム、ディザスタリカバリ方法及びディザスタリカバリプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5625243B2 (ja) |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2972232B2 (ja) * | 1989-08-30 | 1999-11-08 | 株式会社日立製作所 | 計算機ネツトワーク・システムの制御方式 |
JP3788832B2 (ja) * | 1996-10-04 | 2006-06-21 | 株式会社東芝 | 複合系計算機システム |
JPH10187638A (ja) * | 1996-10-28 | 1998-07-21 | Mitsubishi Electric Corp | クラスタ制御システム |
JP2000215177A (ja) * | 1999-01-26 | 2000-08-04 | Atr Ningen Joho Tsushin Kenkyusho:Kk | クライアント―サ―バシステム、サ―バ/クライアント装置、およびサ―バ/クライアントソフトウェアの管理プログラムを記録したコンピュ―タで読取可能な記録媒体 |
US7529822B2 (en) * | 2002-05-31 | 2009-05-05 | Symantec Operating Corporation | Business continuation policy for server consolidation environment |
JP2004118689A (ja) * | 2002-09-27 | 2004-04-15 | Ricoh Co Ltd | 監視システム、監視方法及びプログラム |
JP4163481B2 (ja) * | 2002-10-11 | 2008-10-08 | 株式会社東芝 | クラスタシステム及び同システムにおけるサービス制御方法 |
JP2005018510A (ja) * | 2003-06-27 | 2005-01-20 | Hitachi Ltd | データセンタシステム及びその制御方法 |
JP2005196683A (ja) * | 2004-01-09 | 2005-07-21 | Hitachi Ltd | 情報処理システム、情報処理装置、及び情報処理システムの制御方法 |
JP2005250626A (ja) * | 2004-03-02 | 2005-09-15 | Hitachi Ltd | コンピュータシステム及びそのプログラム。 |
JP4277873B2 (ja) * | 2006-05-23 | 2009-06-10 | 日本電気株式会社 | トランザクション処理装置、トランザクション処理方法 |
JP5235292B2 (ja) * | 2006-09-29 | 2013-07-10 | 富士通株式会社 | コンピュータシステム、バックアップシステムへの移行方法、バックアップシステムへの移行プログラム、監視装置、端末装置及びバックアップシステム |
US7917469B2 (en) * | 2006-11-08 | 2011-03-29 | Hitachi Data Systems Corporation | Fast primary cluster recovery |
-
2009
- 2009-02-26 JP JP2009043442A patent/JP5625243B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010198404A (ja) | 2010-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100930576B1 (ko) | 가상화 기반 고가용성 클러스터 시스템 및 고가용성클러스터 시스템에서 장애 관리 방법 | |
CN109729129A (zh) | 存储集群的配置修改方法、存储集群及计算机系统 | |
US8266474B2 (en) | Fast cluster failure detection | |
CN106059791B (zh) | 一种存储系统中业务的链路切换方法和存储设备 | |
CN109474465A (zh) | 一种基于服务器集群的可动态流转的高可用性的实现方法和系统 | |
CN104221004A (zh) | 对互连失效在群集范围内的一致性检测 | |
JP3887130B2 (ja) | 高可用性計算機システム及び同システムにおけるデータバックアップ方法 | |
JP5446405B2 (ja) | イベント検出制御方法及びシステム | |
US20070180287A1 (en) | System and method for managing node resets in a cluster | |
AU2001241700B2 (en) | Multiple network fault tolerance via redundant network control | |
CN111708668A (zh) | 集群故障的处理方法、装置及电子设备 | |
US20050234919A1 (en) | Cluster system and an error recovery method thereof | |
CN109189854B (zh) | 提供持续业务的方法及节点设备 | |
US7752493B2 (en) | High reliability system, redundant construction control method, and program | |
CN104794026B (zh) | 一种集群实例多数据源绑定的故障转移方法 | |
Zhang et al. | Reliability models for systems with internal and external redundancy | |
US20090138101A1 (en) | Method, System and Computer Program Product for Improving Information Technology Service Resiliency | |
Mitrović et al. | Improving fault-tolerance of distributed multi-agent systems with mobile network-management agents | |
JP5176231B2 (ja) | 計算機システム、計算機制御方法及び計算機制御プログラム | |
CN111309515B (zh) | 一种容灾控制方法、装置及系统 | |
JP5625243B2 (ja) | 情報処理システム、ディザスタリカバリ方法及びディザスタリカバリプログラム | |
JP4806382B2 (ja) | 冗長化システム | |
CN114328033A (zh) | 保持高可用设备组业务配置一致性的方法及装置 | |
WO2018037535A1 (ja) | 生存管理プログラム、生存管理方法、および生存管理装置 | |
KR100832543B1 (ko) | 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131105 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140617 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140805 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140902 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140915 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5625243 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |