JP2012027656A - ディザスタリカバリシステムのための管理装置、方法及びプログラム - Google Patents

ディザスタリカバリシステムのための管理装置、方法及びプログラム Download PDF

Info

Publication number
JP2012027656A
JP2012027656A JP2010165159A JP2010165159A JP2012027656A JP 2012027656 A JP2012027656 A JP 2012027656A JP 2010165159 A JP2010165159 A JP 2010165159A JP 2010165159 A JP2010165159 A JP 2010165159A JP 2012027656 A JP2012027656 A JP 2012027656A
Authority
JP
Japan
Prior art keywords
user system
resource
data center
backup
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010165159A
Other languages
English (en)
Other versions
JP5512442B2 (ja
Inventor
Kenichi Kanayama
健一 金山
Tomohiko Kusuda
友彦 楠田
Masaki Iida
正樹 飯田
Masakazu Hori
雅和 堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intec Inc Japan
Original Assignee
Intec Inc Japan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intec Inc Japan filed Critical Intec Inc Japan
Priority to JP2010165159A priority Critical patent/JP5512442B2/ja
Publication of JP2012027656A publication Critical patent/JP2012027656A/ja
Application granted granted Critical
Publication of JP5512442B2 publication Critical patent/JP5512442B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 バックアップリソースを共用として低コストを実現しつつ、地域に依存した災害等の障害発生時におけるユーザシステムに対するディザスタリカバリ機能を確実に提供する。
【解決手段】 本システム1の管理装置4は、複数のデータセンターの各々の現在のリソース量を記憶している。この管理装置4は、ユーザシステムが必要とするリソース量が入力されると、ユーザシステムを配置した平常時のデータセンターが属する地域で障害が発生したと仮定して、該障害の影響が及ばない地域に属するデータセンターにユーザシステムを配置できるだけのリソース量を、バックアップリソースとして確保しておけるか否かを判断する。バックアップリソース確保可能と判断されると、ユーザシステムの平常時の配置先となるデータセンター及び該データセンターにおいて該ユーザシステムに割り当てられるべきプライマリリソース量を特定する情報を出力する。
【選択図】 図1

Description

本発明は、例えば地震や洪水等の災害が起きた場合でも、情報通信システムによるサービスを継続できるよう、障害の生じたサービスを、災害の影響が及ばなかった場所にある設備により復旧させる、いわゆる「ディザスタリカバリ」の要請に対応するための技術に関する。
従来のディザスタリカバリ対応では、サービスを行うユーザシステム毎に、専用のバックアップ設備を用意することが一般的であり、障害時にのみ運用するバックアップシステムとして、平常時に運用するプライマリシステムと同等のサーバシステムを用意することになる。
このため、設備コストが、ディザスタリカバリ対応をしない場合と比較して、およそ2倍となってしまい、この導入コストの高さが、ディザスタリカバリ対応を進める上で大きな障害となっていた。
近年、サーバ仮想化技術の発達により、仮想化サーバに障害が発生した場合に、その仮想化サーバ上で動作する仮想マシンを、必要容量の空きリソースを有する他の(障害が発生していない)仮想化サーバ上で起動することが可能となってきている。このような技術の例として、非特許文献1に示される「VMware High Availability(HA)」が挙げられる。
また、非特許文献1には、「VMware Site Recovery Manager(SRM)」という技術も開示されている。これは、平常時に運用するプライマリシステムを動作させる「プロテクテッドサイト」とは別に、障害時に運用するバックアップシステムを動作させる「リカバリサイト」を設けて、「リカバリ・プラン」を実行することにより、簡単な操作で災害対策を行えるようにしたものである。
ヴイエムウェア株式会社著「VMware徹底入門」、2008年11月12日、株式会社翔泳社発行
上記の「VMware SRM」では、平常時の「リカバリサイト」において、災害対策の対象となるユーザシステム以外の仮想マシンを稼働させて、リソースを有効に活用することが可能である。また、一つの「リカバリサイト」のリソースを、複数の「プロテクテッドサイト」の共用のバックアップリソースとして利用することも可能であり、設備コストの高さという問題を解消できる可能性は、出てきている。
しかしながら、バックアップリソースを共用とする場合、同時期に障害の影響下にあるユーザシステムの数や使用するリソース量によって、バックアップリソースが足りないという事態が起こり得る。これに対し、各ユーザシステムにバックアップ優先度を設けて、優先度の高いユーザシステムはリカバリできるようにしておくという対策も考えられるが、どのユーザシステムにいつ障害が発生してもリカバリできるような確実なディザスタリカバリ対応が求められる場合には、不十分である。
また、実際の運用においては、仮想化サーバを収容するデータセンターが、地理的に広い範囲に分散して設置されることが一般的であるため、ユーザシステムを稼働させるデータセンターを、その中から自由に選択したいというユーザ(サービス提供者)の意向がある。しかし、上記の「VMware SRM」のような技術では、一つの「リカバリサイト」と、そのリソースを共用する複数の「プロテクテッドサイト」との関係が、固定されているため、選択の自由度に乏しい。
本発明は、以上のような事情を考慮し、複数のデータセンターが地域的に分散しているという環境を活用して、バックアップリソースを共用として低コストを実現しつつ、地域に依存した災害等の障害発生時におけるユーザシステムに対するディザスタリカバリ機能を、確実に提供できるよう、また、ユーザシステムを稼働させるデータセンターの選択に自由度を付与できるよう、ユーザシステムの配置及びデータセンターのリソース量を管理する機構を実現することを目的とする。
本発明の原理に従って、複数のデータセンターのうちの一つにユーザシステムを配置するための管理装置が設けられる。ここで、各データセンターは、少なくとも一つの仮想化サーバを含み、前記仮想化サーバは、該仮想化サーバで動作する少なくとも一つの仮想マシンにより、配置されたユーザシステムを動作させることが可能なものであり、各データセンターが有すリソースは、ユーザシステムが平常時に使用するプライマリリソースとして割り当てられるという用途と、障害時のためのバックアップリソースとして確保されるという用途の、いずれに供することも可能なものである。
前記管理装置は、前記複数のデータセンターの各々の現在のリソース量に関する第1の情報を記憶する記憶手段と、ユーザシステムの配置要求として、該ユーザシステムが必要とするリソース量を示す第2の情報を入力する入力手段と、前記ユーザシステムを配置した平常時のデータセンターが属する地域で障害が発生したと仮定して、該障害の影響が及ばない地域に属するデータセンターに前記ユーザシステムを配置できるだけのリソース量を、バックアップリソースとして確保しておけるか否かを、前記第1の情報及び前記第2の情報に基づいて、判断する判断手段と、前記判断手段によるバックアップリソース確保可能の判断に応じて、前記ユーザシステムの平常時の配置先となるデータセンター及び該データセンターにおいて該ユーザシステムに割り当てられるべきプライマリリソース量を特定する情報を出力し、前記判断手段によるバックアップリソース確保不能の判断に応じて、前記ユーザシステムの配置要求を拒否する出力手段とを備える。
上記の構成により、いつ、どの地域で、障害が発生しても、障害発生地域のユーザシステムが別の地域で復旧稼働できるだけのバックアップリソースが確保されている状態を保つことが可能になり、確実なディザスタリカバリ対応を提供することが可能となる。また、各地域のバックアップリソースが、他の地域間で共用されるため、その分の設備コストを節約することが可能になる。さらに、各データセンターが有するリソースのうち、プライマリリソースとして使用される分とバックアップリソースとして確保される分とを、所望の割合に配分可能にできるため、データシステムの配置先となるデータセンターの選択に自由度を付与することが可能になる。
前記管理装置の判断手段は、前記第1の情報に基づき、前記複数のデータセンター全体においてプライマリリソースとしての使用を許可するリソース量であるトータルプライマリリソース容量を定め、前記第2の情報が示す前記ユーザシステムが必要とするリソース量が、前記トータルプライマリリソース容量の範囲内で割り当て可能であるか否かを判断する手段を含むものとしてもよい。
この構成により、複数の地域のデータセンター間全体でユーザシステムを平常時に稼働させるために使用できるリソース量の上限値が定まり、その残りのリソースが共用のバックアップリソースとして確保された状態にすることができる。
上記の構成において、ある地域で障害が発生したと仮定して、該障害の影響が及ばない地域に属するデータセンターが有するリソースの容量を合計する処理を、複数の地域について行うことにより、複数の合計リソース容量を得、これら合計リソース容量のうち最も小さいものを、前記トータルプライマリリソース容量として定めるようにしてもよい。
これにより、複数の地域のデータセンター間全体でユーザシステムを平常時に稼働させるために使用できるリソース量の上限値を、どの地域で障害が発生しても、他の地域で障害復旧が可能なだけのバックアップリソースが確保されるように、算出することができる。これは、同時期に障害の影響を受けるのは一つの地域だけであるという特性を活かし、どの地域で障害が発生するかによってバックアップリソースが余ることはあっても、足りないことはないということを保証できる範囲でのみ、プライマリリソースの割り当てを許可するものである。
前記管理装置の判断手段は、前記第1の情報に基づき、前記ユーザシステムの平常時の配置先となるデータセンターにおいてプライマリリソースとしての使用を許可するリソース量である個別プライマリリソース容量を定め、前記第2の情報が示す前記ユーザシステムが必要とするリソース量が、前記個別プライマリリソース容量の範囲内で割り当て可能であるか否かを判断する手段を含むものとしてもよい。
この構成により、複数の地域のデータセンター間全体で共用のバックアップリソースが確保された状態で、配置要求のあったユーザシステムの平常時の配置先をどのデータセンターにするかを決めることが可能になる。
上記の構成において、所定の基準により選択されたデータセンターを、前記ユーザシステムの平常時の配置先となるデータセンターの候補として、前記判断手段における判断を行うようにしてもよい。
これにより、ユーザ(サービス提供者)の意向を反映させて、ユーザシステムの平常時の配置先となるデータセンターを決めることが可能になる。所定の基準としては、例えば、クライアントへの通信の遅延が少ない地域を優先する、自治体等の地域に関連する情報を同一地域のデータセンターに保存できるようにする、データセンター間で各種リソース間の使用量のバランスが取れるようにする、等があり得る。
前記管理装置は、前記ユーザシステムを配置した平常時のデータセンターが属する地域で障害が発生した場合に前記ユーザシステムが配置される障害時のデータセンターを、前記障害の影響が及ばない地域に属するデータセンターの中から選定する選定手段をさらに備えてもよい。
この構成により、複数の地域のデータセンター間全体で確保された共用のバックアップリソースから、障害の発生したユーザシステムを復旧稼働するためのリソースを、どのデータセンターにおいて割り当てるか決めることが可能になる。
上記の構成において、所定の基準により選択されたデータセンターを、前記ユーザシステムの障害時の配置先となるデータセンターの候補として、前記選定手段における選定を行うようにしてもよい。
これにより、ユーザ(サービス提供者)の意向を反映させて、ユーザシステムの障害時の配置先となるデータセンターを決めることが可能になる。所定の基準としては、例えば、クライアントへの通信の遅延が少ない地域を優先する、自治体等の地域に関連する情報を同一地域のデータセンターに保存できるようにする、データセンター間で各種リソース間の使用量のバランスが取れるようにする、等があり得る。障害時の配置先を決めるための基準と、平常時の配置先を決めるための基準は、同一であっても異なるものであってもよい。
上記の構成において、前記選定手段は、前記第1の情報に基づき、前記ユーザシステムの障害時の配置先となるデータセンターにおいてバックアップリソースとして使用可能なリソース量である個別バックアップリソース容量を定め、前記第2の情報が示す前記ユーザシステムが必要とするリソース量が、前記個別バックアップリソース容量の範囲内で割り当て可能であるか否かを判断する手段を含むものであってもよい。
これにより、ユーザシステムの障害時の配置先として、そのユーザシステムを復旧稼働するためのリソースを割り当て可能なデータセンターを選ぶことが可能になる。
上記の構成において、前記判断手段による判断を行う際に、前記選定手段による選定を行い、前記出力手段は、前記ユーザシステムの平常時の配置先となるデータセンターを特定する情報の出力に加えて、前記ユーザシステムの障害時の配置先となるデータセンターを特定する情報の出力を行うものであり、前記選定手段において前記ユーザシステムの障害時の配置先となるデータセンターが選定できなかった場合には、前記ユーザシステムの配置要求を拒否するようにしてもよい。
これにより、配置要求のあったユーザシステムの平常時の配置先データセンターを決める際に、そのユーザシステムの障害時の配置先データセンターも決めておくことができる。この選定タイミングは、例えば、後述する最小分割リソース量による制御を行う方式において、特に有用である。また、後述するバックアップリソース容量固定方式においても、有用である。
上記の構成において、前記障害が発生した際に、前記選定手段により選定を行い、前記ユーザシステムの障害時の配置先となるデータセンター及び該データセンターにおいて該ユーザシステムに割り当てられるべきバックアップリソース量を特定する情報を出力する追加出力手段をさらに備えるようにしてもよい。
これにより、障害が発生した際に、障害の発生したユーザシステムを復旧させる配置先データセンターを決めることができる。この選定タイミングは、例えば、後述するバックアップリソース容量非固定方式において、特に最小分割リソース量による制御を行わない場合に、有用である。また、最小分割リソース量による制御を行わないバックアップリソース容量固定方式においても、有用である。
上記の構成において、前記判断手段は、前記ユーザシステムの平常時の配置先となるデータセンターが有するリソースの容量までのリソース量が、プライマリリソースとしての使用が許可されているものとして、該データセンターにおいて前記ユーザシステムが必要とするリソース量が割り当て可能であるか否かを判断する手段を含み、前記選定手段は、前記ユーザシステムの障害時の配置先となるデータセンターが有するリソースの容量から、現在使用されているリソース量を除いた容量の範囲内で、該データセンターにおいて前記ユーザシステムが必要とするリソース量が割り当て可能であるか否かを判断する手段を含むようにしてもよい。
これが、バックアップリソース容量非固定方式であり、この方式によれば、各データセンターで固定的にバックアップリソース容量を予め確保しておくことはしないため、ユーザシステムの平常時の配置先データセンターを選ぶ際の自由度を高くすることが可能である。
バックアップリソース容量非固定方式の場合、前記管理装置が、前記ユーザシステムの平常時の配置先となるデータセンターを障害時の配置先とする他のユーザシステムが、該データセンターにおいて必要とするリソース量が、割り当て可能であるか否かを判断し、割り当て可能でない場合には、該他のユーザシステムの障害時の配置先となるデータセンターの選定をし直す再選定手段をさらに備えるようにしてもよい。
この再選定手段は、配置要求のあったユーザシステムの平常時の配置先データセンターを決める際に、そのユーザシステムの障害時の配置先データセンターも決めておく場合に、特に有用である。バックアップリソース容量非固定方式の場合、ユーザシステムを平常時の配置先データセンターで稼働させると、そのデータセンターにおけるバックアップリソース容量が減少するためである。なお、障害が発生した際に、障害の発生したユーザシステムを復旧させる配置先データセンターを決める場合には、この再選定手段はなくてよい。
代替的に、上記の構成において、前記判断手段は、前記ユーザシステムの平常時の配置先となるデータセンターが有するリソースの容量から、該データセンターにおいてバックアップリソースとして予め確保されているバックアップリソース容量を除いた容量までのリソース量が、プライマリリソースとしての使用が許可されているものとして、該データセンターにおいて前記ユーザシステムが必要とするリソース量が割り当て可能であるか否かを判断する手段を含み、前記選定手段は、前記ユーザシステムの障害時の配置先となるデータセンターにおいてバックアップリソースとして予め確保されているバックアップリソース容量の範囲内で、該データセンターにおいて前記ユーザシステムが必要とするリソース量が割り当て可能であるか否かを判断する手段を含むようにしてもよい。
これが、バックアップリソース容量固定方式であり、この方式によれば、各データセンターで固定的にバックアップリソース容量を予め確保しておくため、各ユーザシステムについて一度、障害時の配置先となるデータセンターを選定すればよく、再選定を不要とすることが可能である。
バックアップリソース容量固定方式の場合、前記複数のデータセンター全体においてバックアップリソースとして確保されるリソース量であるトータルバックアップリソース容量を、複数のデータセンターに割り振ることにより、各データセンターにおいてバックアップリソースとして予め確保される前記バックアップリソース容量が定められているようにしてもよい。
トータルバックアップリソース容量をどのような比率で複数のデータセンターに割り振るかは、各データセンターの特質や各ユーザ(サービス提供者)の意向等を考慮して、管理者が決めればよい。
前記管理装置は、前記ユーザシステムが平常時に配置されるデータセンターとして、二つ以上のデータセンターを選定し、前記ユーザシステムが必要とするリソース量を該二つ以上のデータセンターに割り振ることにより、プライマリリソース量の割り当てを可能とする分割手段をさらに備えてもよい。
この構成により、ユーザシステムを平常時に配置するデータセンターを決める際、複数のデータセンター全体としてのプライマリリソースは足りているのに、その中のどれか一つのデータセンターへユーザシステムを配置しようとすると容量が収まる先がないという事態になっても、ユーザシステムを分割して二つ以上のデータセンターに配置することによって、ユーザシステムの配置要求に肯定的に応えることが可能になる。
前記管理装置は、前記ユーザシステムが障害時に配置されるデータセンターとして、二つ以上のデータセンターを選定し、前記ユーザシステムが必要とするリソース量を該二つ以上のデータセンターに割り振ることにより、前記障害が発生した際のバックアップリソース量の割り当てを可能とする分割手段をさらに備えてもよい。
この構成により、ユーザシステムを障害時に配置するデータセンターを決める際、複数のデータセンター全体としてのバックアップリソースは足りているのに、その中のどれか一つのデータセンターへユーザシステムを配置しようとすると容量が収まる先がないという事態になっても、ユーザシステムを分割して二つ以上のデータセンターに配置することによって、ユーザシステムの配置要求に肯定的に応えることが可能になる。特に、障害が発生した時にユーザシステムの復旧を行う配置先データセンターを決める方式では、どこかのデータセンターでユーザシステムの障害復旧ができるという前提で、平常時の配置を行って配置要求を受け付けているのであるから、分割をしてでも障害時の配置を実現することが望ましい。
上記の構成において、前記第2の情報は、前記ユーザシステムが必要とするリソース量を二つ以上のデータセンターに割り振る場合に、各データセンターで最低限割り当てられるべき、最小分割リソース量を示す情報を含み、前記分割手段は、前記第2の情報を参照してリソース量の割り振りを行う手段を含むようにしてもよい。
この最小分割リソース量に従って、ユーザシステムの分割を行うことにより、ユーザシステムを過度に小さく分割してしまうと動作に支障が出る可能性があるところ、そのような事態を回避することが可能になる。
上記の構成において、前記出力手段は、前記ユーザシステムの平常時の配置先となるデータセンターを特定する情報の出力に加えて、前記ユーザシステムの障害時の配置先となるデータセンターを特定する情報の出力を行うものであり、前記管理装置が、前記分割手段において前記最小分割リソース量に従った割り振りができなかった場合には、他のユーザシステムの障害時の配置先となるデータセンターの選定をし直す再選定手段をさらに備えるようにしてもよい。
最小分割リソース量による制御を行う方式では、複数のデータセンター全体としてのプライマリリソースは足りているのに、最小分割リソース量以上の使用可能なリソース容量が残っているデータセンターがなく、障害時にユーザシステムを復旧させる配置先がないという事態が起こり得る。これを防ぐには、配置要求のあったユーザシステムの平常時の配置先データセンターを決める際に、そのユーザシステムの障害時の配置先データセンターも決めておくようにし、障害時の配置先を決めることができないならば、バックアップリソース確保不能であると判断して、ユーザシステムの配置要求を拒否することが望ましい。また、他のユーザシステムの障害時の配置先となるデータセンターの選定をし直して、配置要求のあったユーザシステムの障害時の配置先を決めることができる可能性を高くするようにしてもよい。
上記の構成において、前記ユーザシステムが必要とするリソース量を二つ以上の障害時の配置先となるデータセンターに割り振る場合の最小分割リソース量の条件が、平常時の配置先となるデータセンターに割り振る場合の条件よりも、緩和して設定されていてもよい。
これにより、ユーザシステムを小さく分割すると動作が遅くなる等の不利益を被る可能性があるところ、平常時は動作の快適性等を重視してなるべく大きく分割するようにし、障害時は配置先データセンターが見つかる可能性を重視して小さく分割することを許容するという、細かい制御が可能になる。
上述したユーザシステムは、少なくとも一つのアプリケーションサーバと、該アプリケーションサーバをネットワーク経由でクライアントからアクセス可能とするための手段(例えば、ゲートウェイ等の中継装置)とを含み、前記アプリケーションサーバは、前記仮想マシンにより実現されるものであってもよい。アプリケーションサーバがサービス処理に用いるデータは、アプリケーションサーバ内に格納してもよいし、別のサーバに格納してそのサーバにアクセスするためのゲートウェイをユーザシステムがさらに含むようにしてもよい。
ユーザシステムが複数のアプリケーションサーバを含む場合、各アプリケーションサーバに目安として割り当てられるリソース量の比率を予め定めておいてもよい。この比率を、そのユーザシステムを大規模なリソースにより稼働する必要が生じた際に、同じユーザシステムをコピーして複数配置することによって拡張が可能なように定めておくと、各ユーザシステムを最小リソース構成で登録しておき、それを必要に応じて拡張して大規模化するという運用が、可能になる。
前記管理装置が、前記ネットワークにおける名前解決サーバに、前記ユーザシステムのサービス公開用の名前と、前記ユーザシステムが配置されたデータセンターを前記ネットワークにおいて特定可能なアドレスとの対応を、登録することにより、前記クライアントからのアクセスを可能とする手段をさらに備えるようにしてもよい。
これにより、平常時の配置先データセンターでユーザシステムが稼働している間は、ユーザシステムの名前を基に問い合わせると、平常時の配置先データセンターのアドレスが得られ、障害が発生して障害時の配置先データセンターでユーザシステムが復旧稼働するようになると、登録内容が書き換わるため、同じユーザシステムの名前を基に問い合わせれば、障害時の配置先データセンターのアドレスが得られる。また、ユーザシステムを分割して配置する場合には、一つの名前に複数のアドレスが対応して登録され、負荷分散等の機構を用いて、いずれか一つのアドレスを得ることが可能になる。
上述した管理装置が、一つの地域で発生した障害が一つ以上の異なる地域に属するデータセンターに影響を与える可能性がある場合の、障害発生地域とその影響が及ぶデータセンターとの関係を示す第3の情報を記憶する記憶手段をさらに備え、前記判断手段は、前記第3の情報を参照して判断を行う手段を含むものとしてもよい。
この構成により、災害が発生すると各データセンターに影響を与える可能性のある各区域間に重複があるような場合でも、いつ、どの地域で、障害が発生しても、障害発生地域のユーザシステムが別の地域で復旧稼働できるだけのバックアップリソースが確保されている状態を保つことが可能になる。
代替的に、前記複数のデータセンターは、あるグループで発生した障害が他のグループのデータセンターには影響を与えないように、地域毎にグループ分けされており、各グループ内のデータセンターが有するリソースの合計容量のうち最も大きいものを、前記複数のデータセンター全体が有するリソースの容量から減算した容量を、前記複数のデータセンター全体においてプライマリリソースとしての使用を許可するリソース量としてもよい。
この構成によれば、災害が発生すると各データセンターに影響を与える可能性のある各区域間に重複がないようにできるため、いつ、どの地域で、障害が発生しても、障害発生地域のユーザシステムが別の地域で復旧稼働できるだけのバックアップリソースを、複数のデータセンター全体で確保するためのトータルプライマリリソース容量を、簡単に求めることが可能である。
以上に管理装置として記述した各発明は、複数のデータセンターのうちの一つにユーザシステムを配置するための管理方法の発明としても、コンピュータを上記の管理装置として動作させるための管理プログラムの発明としても、該管理プログラムを記憶した記憶媒体の発明としても、成立するものである。
以上のように、本発明によれば、複数のデータセンターが地域的に分散しているという環境を活用して、バックアップリソースを共用として低コストを実現しつつ、地域に依存した災害等の障害発生時におけるユーザシステムに対するディザスタリカバリ機能を、確実に提供することが可能になる。また、ユーザシステムを稼働させるデータセンターの選択に自由度を付与することも可能になる。
本発明の実施の形態における管理装置を備えるシステム(本システム)の説明図 データセンター間(DC間)のデータ同期の説明図 各リソース量(キャパシティ、プライマリリソース、バックアップリソース)の説明図 各リソース量の関係を示す説明図 (a)リソースユニット(RU)の一例を示す図 (b)各DC(DC1とDC2)のリソース量の算出の一例を示す図 データセンター関連の管理情報の一例を示す図 ユーザシステム関連の管理情報の一例を示す図 バックアップDC選定のタイミングの説明図 非固定方式で、最小分割リソース量の保証がない場合の処理フローの説明図 非固定方式で、最小分割リソース量の保証がある場合の処理フローの説明図 固定方式の場合の処理フローの説明図 エリアの定義の一例を示す図 災害発生エリアとその影響のあるDCの関係を示す図 各DCのリソース量の一例(TPの計算の具体例)を示す図 トータルプライマリリソース容量TPの計算結果の一例を示す図 単純なモデルの場合のトータルプライマリリソース容量TPの計算の説明図 プライマリDCの選定条件の一例を示す図 バックアップDCの満たすべき条件の一例を示す図 災害発生エリアと影響のあるDCの関係の一例を示す図 ユーザシステムの構成の説明図 ユーザシステムの管理情報と値の一例を示す図 配置先のDCに応じて決定する設定項目と値の一例を示す図 リソース利用効率が向上するような配置先DCの選択の説明図 バックアップリソース共有の効果の説明図 各地域のリソースのメイン用途とバックアップ用途の割り当ての例を示す図
(本システムの構成)
以下、本発明の一つの実施の形態の管理装置について、図面を用いて説明する。ここでは、管理装置を備えるシステム(以下、本システムという)を例示して説明する。図1は、本システムの構成を示す説明図である。図1に示すように、本システム1は、複数の地域(大阪、東京、富山など)に分散して配置された複数のデータセンター2を備えている。この例では、大阪に2つのデータセンター2(図では、DC−1、2)が設置され、東京に2つのデータセンター2(DC−3、4)が設置され、富山に2つのデータセンター2(DC−5、6)が設置されている。
各データセンター2では、それぞれユーザシステム3が稼働されている。例えば、DC−1では、ユーザシステム−1、2が稼働されており、DC−2では、ユーザシステム−3が稼働されている。また、DC−3では、ユーザシステム−4、5が稼働されており、DC−4では、ユーザシステム−6、7が稼働されている。さらに、DC−5では、ユーザシステム−8が稼働されており、DC−6では、ユーザシステム−9が稼働されている。
管理装置4は、各データセンター2とネットワーク接続されており、各データセンター2との間で情報通信をすることができる。この管理装置4は、コンピュータ装置などで構成されており、メモリやHDDなどで構成される記憶部5と、キーボードやマウスなどで構成される入力部6と、MPUやCPUなどで構成される処理部7と、液晶ディスプレイなどで構成される表示部8を備えている。そして、この管理装置4は、後述するように、障害発生時におけるユーザシステム3に対するディザスタリカバリ機能を提供するための各種の機能を備えている。これらの機能は、管理装置4のHDDやメモリ等に格納されたプログラムによって実現することができる。
(本システムの機能)
本システム1は、次の3つの機能を備えている。第1の機能は「地域規模の障害発生に確実に対応する機能」である。この機能により、「いつ」「どの地域」で障害が発生しても、障害発生地域のすべてのユーザシステム3が別地域で復旧稼働できるだけのバックアップリソースが常に確保されていることを保証することができ、障害時に迅速に復旧を行うことができるようになる。
第2の機能は「地域間のバックアップリソースの共用により、必要バックアップリソース量を最小限化できる機能」である。各地域のバックアップリソースをその他の地域間で共用することにより、そのような共有をしない場合と比較して、全体として必要なバックアップリソース量を削減することができる。
第3の機能は「ユーザシステムの配置先のデータセンターを自由に選択できる機能」である。例えば、通信遅延がなるべく少ない地域のデータセンター2にシステムを配置したい場合、地域に関連する情報処理(自治体の情報処理など)を同一地域のデータセンター2で実施したい場合、データセンター間で各種リソース(CPU、メモリ、ネットワーク等)間の使用量のバランスをとりながらデータセンター2を追加したい場合などに、この機能は有効である。
本システム1では、各データセンター2のリソースプールのうち、定常利用のプライマリリソースとその残りのバックアップリソースとして確保する量の配分を、第1の機能と第2の機能を実現できるような範囲で自由に設定することができるので、第3の機能を実現すること、すなわち、3つの機能をすべて実現することができる。
(本システムの特徴)
本システム1は、上記の3つの機能をすべて実現することができるように、以下の2つの特徴を備えているともいえる。第1の特徴は「全データセンターでのバックアップリソースの統合管理」である。各地域で必要なバックアップリソースの確保を個別に行ったのでは、地域間のバックアップリソースの共有を効果的に行うことはできない。そのため、本システム1では、まず「各地域のデータセンター間全体」でユーザシステム3を平常時に稼働させるために使用できるリソース量の上限値(トータルプライマリリソース容量)を算出し、その残りのリソースを共有バックアップリソースとして確保している。この上限値は、どの地域で障害が発生しても、その他の地域で障害復旧が可能なだけのバックアップリソースが確保されるように算出される。したがって、本システム1では、上記のデータセンター間全体の上限値を超えない範囲で、ユーザシステム3を、希望する地域のデータセンター2へ自由に配置することができる。
第2の特徴は「ユーザシステムの分散配置対応」である。ある程度以上のリソース量を必要とするユーザシステム3では、データセンター全体としてのプライマリリソース、あるいは、バックアップリソースは足りていても、個々のデータセンター2へ配置する際には容量が収まる先がないケースが発生するおそれがある。そのため、本システム1では、各ユーザシステム3を最小リソース構成で登録し、それを拡張技術(クラスタ化)によって、必要に応じて大規模リソースによる稼働にも展開可能としている。さらに、本システム1では、個別のデータセンターレベルでリソースが不足する場合には、複数のデータセンター上で合計値が必要なリソース量となるようにユーザシステム3を稼働し、それをDNS等の名前解決技術との連携によって、ユーザからは一つのシステムとして利用することができる。
(本システムの前提)
本システム1は、データセンター間(DC間)のデータ同期による機能の利用を前提としている。まず、DC間のデータ同期について、図2を参照しながら説明する。図2は、DC間のデータ同期の説明図である。図2に示すように、データセンター2は、ゲートウェイサーバ9とDNSサーバ10と仮想化サーバ11とデータベースサーバ12とストレージサーバ13を備えている。仮想化サーバ11としては、例えば「VMware Server」や「VMware ESX」等を利用することができる。各データセンター2のデータベースサーバ12とストレージサーバ13は、データ同期回線(専用線、VPN回線等)で接続されており、データが同期されている。ここでは、各DC間のデータ同期の方法や方式の詳細については特に言及しないが、例えば、既知のストレージ間のレプリケーション機能を利用することができる。各DC間でデータ同期されると、あるDC及びそのDCのストレージに障害が発生しても、同じユーザシステム3を再起動するのに必要なデータを別のDCのストレージから得ることができる。
本システム1のディザスタリカバリ機能は、各DC間のデータ同期による2つの機能が利用可能であることを前提としている。1つ目の機能は「全DCにおける各ユーザシステムのアプリケーションサーバを起動する機能」である。この機能により、各アプリケーションサーバ14の起動イメージは、DC間でデータ同期が行われるストレージサーバ13上に保存され、いずれのDCのストレージからでも起動することができるようになる。2つ目の機能は「全DCにおける各ユーザシステム3のアプリケーションデータへアクセスする機能」である。この機能により、アプリケーションデータは、DC間でデータ同期が行われているストレージまたはデータベースサーバ12上に保存され、いずれのDCにおいても、ユーザシステム3は、そのストレージまたはデータベースサーバ12からアプリケーションデータへアクセスすることができるようになる。
つぎに、各DCのリソース量の考え方について、図2〜図5を参照しながら説明する。図3は、各リソース量(キャパシティ、プライマリリソース、バックアップリソース)の説明図である。図3に示すように、各DCのリソース量には、n番目(n=1、2・・・)のデータセンター2(DC−n)の持つリソース全体の容量である「キャパシティCn」と、DC−nのプライマリリソース(ユーザシステム3により平常時に使用されるリソース)として使用可能な容量である「プライマリリソースPn」と、DC−nのバックアップリソース(平常時に使用されないリソース)としての容量である「バックアップリソースBn」が含まれる。
図4は、各リソース量の関係を示す説明図である。図4に示すように、各DCのリソース量(キャパシティCn、プライマリリソースPn、バックアップリソースBn)の関係は、以下の式(1)で表すことができる。
DCのリソースには、CPU、メモリ、ネットワークなど複数の種類のものが含まれる。したがって、DCのリソース量は、種類ごとに値を持ち、複数次元的である。これを処理の単純化等のために、次のように一次元化してもよい。
まず、各種リソースをひとまとめにして取り扱うための最小単位(リソースユニット、RU)を決定する。リソースユニットは、ユーザシステム3に対して割り当て量を保証する各リソース(CPU、メモリ、ネットワーク等)の最小単位の集合として任意に定めることができる。図5(a)には、リソースユニット(RU)の一例が示されている。この例では、CPUについては2.0GHzを1RUとし、メモリについては2.0GBを1RUとし、ネットワークについては1.0Mbpsを1RUとしている。
なお、ここでの最小単位(RU)は、ユーザシステム3に対する割り当て量であるため、ユーザシステム3には常に整数[RU]が割り当てられるが、ユーザシステム3が複数のアプリケーションサーバ14を含む場合には、各アプリケーションサーバ14に小数[RU]が割り当てられることも許容される。
次に、このようなリソースユニットという単位を用いて、各DCのリソース量を算出する。具体的には、リソース種別ごとに何RU分に相当するかを計算し、その中で最も値の小さなものを、そのDCのリソース量とする。図5(b)には、各DC(DC−1とDC−2)のリソース量の算出の一例が示されている。この例では、DC−1について、CPUのリソース量が350RUと換算され、メモリのリソース量が400RUと換算され、ネットワークのリソース量が400RUと換算されるので、その中の最小値である350RUが、DC−1のリソース量として算出される。また、DC−2については、CPUのリソース量が300RUと換算され、メモリのリソース量が250RUと換算され、ネットワークのリソース量が300RUと換算されるので、その中の最小値である250RUが、DC−2のリソース量として算出される。
なお、他の例として、全てのリソース種別は考慮せず、選択された種別のリソースのみに着目し、その種別のリソースの量をRU単位のリソース量としてもよい。例えば、図5(b)の例において、CPUのリソースのみに着目し、DC−1のリソース量を350RU(そのまま)とし、DC−2のリソース量を300RUとしてもよい。
(管理情報)
続いて、本システム1で用いられる管理情報について、図6と図7を参照して説明する。本システム1の管理情報には、データセンター関連の管理情報とユーザシステム関連の管理情報が含まれる。図6は、データセンター関連の管理情報の一例を示す図である。図6に示すように、データセンター関連の管理情報は、個々のデータセンター2(DCn)に関する個別DC関連の管理情報と、DC全体の管理情報とに大別される。
個別DC関連の管理情報には、DCの各リソース(CPU、メモリ、ネットワーク)の容量を示す「各種リソース容量Cn」と、DCのプライマリ用の各リソース(CPU、メモリ、ネットワーク)の容量を示す「プライマリリソース容量Pn」と、DCのバックアップ用の各リソース(CPU、メモリ、ネットワーク)の容量を示す「バックアップリソース容量Bn」と、DCのプライマリ用の各リソース(CPU、メモリ、ネットワーク)の使用量を示す「プライマリリソース使用量Un」が含まれる。また、個別DC関連の管理情報には、ユーザシステム3のDC配置時に用いられる「ユーザシステム用IPアドレスリスト」と「ユーザシステム用VLAN IDリスト」の情報が含まれる。
DC全体の管理情報には、DC全体のプライマリリソース容量を示す「トータルプライマリリソース容量TP」と、DC全体のバックアップリソース容量を示す「トータルバックアップリソース容量TB」の情報が含まれる。なお、「トータルプライマリリソース容量TP」と「トータルバックアップリソース容量TB」の算出方法については後述する。
個別DC関連の管理情報は、データセンター2の管理者の申告に基づいて登録される。例えば、「各種リソース容量Cn」と「ユーザシステム用IPアドレスリスト」と「ユーザシステム用VLAN IDリスト」については、データセンター2の管理者が申告した値が登録される。なお、「プライマリリソース容量Pn」と「バックアップリソース容量Bn」については、本システム1の管理装置4で算出または決定された値が登録される。「プライマリリソース使用量Un」は、ユーザシステムの追加による使用量の増加にあわせて、本システム1の管理装置4により更新することができる。
図7は、ユーザシステム関連の管理情報の一例を示す図である。図7に示すように、ユーザシステム関連の管理情報は、各ユーザシステム(Sm)に関するユーザシステム構成関連の管理情報と、ユーザシステム配置先DC関連の管理情報とに大別される。
ユーザシステム構成関連の管理情報には、ユーザシステム3が必要とするリソース量を示す「必要リソース量Rm」と、ユーザシステム3をDC分散配置する場合に分割された各ユーザシステム3に最低限割り当てるべきリソース量を示す「最小分割リソース量Rminm」が含まれる。なお、ユーザシステム3をDC分散配置する場合は、合計値として割り当てるべきリソース量が「必要リソース量Rm」となる。また、ユーザシステム構成関連の管理情報には、各種の構成情報が含まれる。構成情報には、サービス公開用ホスト名、サービス公開用プロトコル、サービスのヘルスチェック用プロトコル、アプリケーションサーバ関連などの情報が含まれる。アプリケーションサーバ関連の情報には、OS起動イメージ名や割当てリソース割合(AP1:80%、AP2:20%)などの情報が含まれる。
ユーザシステム配置先DC関連の管理情報には、プライマリデータセンターの管理情報と、バックアップデータセンターの管理情報が含まれる。プライマリデータセンターの管理情報には、プライマリとして配置先のデータセンター2の情報や、DC配置時のサービスフロント用IPアドレスが含まれる。バックアップデータセンターの管理情報には、障害時の配置先のデータセンター2の情報や、DC配置時のサービスフロント用IPアドレスの情報が含まれる。
なお、最小分割リソース量は、プライマリDC配置用とバックアップDC配置用で別々の値を設定できるようにしてもよい。例えば、緊急時用のバックアップDC選定の条件を緩めるために、バックアップ配置用の値をプライマリ配置用の値よりも小さく設定してもよい。
最小分割リソース量を大きく設定すれば、ユーザシステム3の動作環境が良好になる(例えば動作が速くなる)。一方、最小分割リソース量を小さく設定すれば、リソース利用効率が向上する(ユーザシステム3の配置要求が受け入れられる可能性が高まる)。また、最小分割リソース量を決める際に、そのユーザシステム3におけるアプリケーションサーバ14の割当てリソース割合を考慮してもよい。例えば、割合が小さい方に割り当てられるリソース量が過度に少なくならないようにしてもよい。
ユーザシステム構成関連の情報は、各ユーザシステム3を運営するユーザ(サービス提供者)の申告に基づいて登録される。また、ユーザシステム配置先DC関連の情報は、本システム1の管理装置4で決定された情報が登録される。
(本システムの処理フロー)
次に、本システム1の処理フローについて説明する。本システム1の処理フローは、各DCのバックアップ容量の指定方式によって異なる。したがって、ここでは、まず、バックアップ容量の指定方式について説明する。バックアップ容量の指定方式は、各DCのバックアップリソース容量を固定的に指定しない「非固定方式」と、各DCのバックアップリソース容量を固定的に指定する「固定方式」に分けられる。
非固定方式は、各DCのバックアップ容量が非固定(全DC間全体で一定の容量があればよい)のため、ユーザシステム3のプライマリ配置先のDCの選択の自由度が高い。ただし、非固定方式では、各DCのバックアップ容量が、ユーザシステム3の追加とともに変更される。そのため、ユーザシステム3が追加されると、その都度、リソース使用状況の変化に応じて、他のユーザシステム3のバックアップDCの選定結果が変わる可能性がある。
一方、固定方式は、バックアップDCは、プライマリDC選定時もしくは障害発生時等に一度選択するだけでよい。ただし、固定方式では、各DCのバックアップ容量がユーザシステム3の運用開始前に固定的に指定され、各DCは常のその分のリソースを空けておく必要がある。そのため、ユーザシステム3のプライマリ配置先のDCの選択の自由度は、非固定方式に比べて低い。
本システム1の処理フローは、最小分割リソース容量を担保するかどうかによっても異なる。具体的には、バックアップDC選定のタイミングが、最小分割リソース容量を担保するかどうかによって異なる。したがって、ここで、バックアップDC選定のタイミングについて説明しておく。
図8は、バックアップDC選定のタイミングの説明図である。図8に示すように、最小分割リソース量を担保する場合は、バックアップDCの選定時にNG判定(選択可能なDCがない)となる可能性があるため、プライマリDCの選択時に同時に選定を行うのが好ましい。最小分割リソース容量を担保しない場合には、非固定方式であるか固定方式であるかによって、バックアップDC選定のタイミングが異なる。非固定方式の場合には、障害発生時に選定するのが好ましい。一方、固定方式の場合には、いずれのタイミングでも構わない。
次に、本システム1の処理フローについて説明する。ここでは、非固定方式と固定方式のどちらの方式か、最小分割リソース容量を担保するかどうか、によって、場合分けして説明する。
図9は、非固定方式で、最小分割リソース量の保証がない場合の処理フローの説明図である。図9に示すように、まず、本システム1の運用開始準備の段階では、各DCの各種リソース容量を登録する処理を行う(S1)。具体的には、各DCについて、個別DC関連の管理情報DCnのうち、各種リソース容量Cnとユーザシステム用IPアドレスの登録を行う。その後、全DCのプライマリリソース容量(トータルプライマリリソース容量TP)を算出する(S2)。なお、トータルプライマリリソース容量TPの算出方法については後で詳しく説明する。
本システム1が定常運用されている段階では、まず、ユーザシステム情報の登録が行われる(S3)。具体的には、ユーザシステム構成関連の情報Smが登録される。つぎに、プライマリDCの選定が行われる(S4)。プライマリDCの選定方法については後で詳しく説明する。そして、プライマリDCの選定ができた場合には、ユーザシステム3のプライマリDCへの配置が行われる(S5)。ユーザシステム3のDC配置方法についても後で詳しく説明する。一方、プライマリDCの選定ができなかった場合には、そこで処理が終了される(S6)。
ある地域で障害が発生した場合、まず、定常監視によって障害が検出される(S7)。具体的には、プライマリDC上で稼働するユーザシステム3に対してヘルスチェックを行い、正常な応答が得られない場合に、障害発生とみなす。この場合、ヘルスチェックの対象IPアドレスは、ユーザシステム配置先DC関連の情報(プライマリデータセンターのDC配置時のサービスフロント用IPアドレス)から取得できる。また、ヘルスチェックの方法は、ユーザシステム構成関連の情報Sm(サービスのヘルスチェック用プロトコル)から決定できる。
本システム1では、つぎに、バックアップDCの選定が行われる(S8)。バックアップDCの選定方法については後で詳しく説明する。そして、バックアップDCの選定が完了すると、ユーザシステム3のバックアップDCへの配置が行われる(S9)。配置先のDCは、ユーザシステム配置先DC関連の情報(障害時の配置先のデータセンター2)に基づいて決定される。
なお、図9の例では、バックアップDCの選定の処理を、障害検出時に実行しているが、各DCのプライマリリソースの使用状況の変化に応じた選定が随時可能であれば、その他のタイミングで行ってもよい。例えば、毎日、ユーザシステム3の追加がない夜間に、バッチ処理によって全ユーザシステム3のバックアップDC選定を行ってもよい。
図10は、非固定方式で、最小分割リソース量の保証がある場合の処理フローの説明図である。図10に示すように、まず、本システム1の運用開始準備の段階では、図9の場合と同様に、各DCの各種リソース容量を登録する処理を行い(S1)、全DCのプライマリリソース容量(トータルプライマリリソース容量TP)を算出する処理を行う(S2)。
つぎに、本システム1が定常運用されている段階では、ユーザシステム情報の登録が行われ(S3)、プライマリDCの選定が行われる(S4)。この場合、最小分割リソース量の保証があるため、ユーザシステム3の追加時にプライマリDCの選択とともにバックアップDCの選定をしておく必要がある。ただし、各DCのバックアップリソース容量は非固定のため、ユーザシステム3の追加によるプライマリリソース使用量の増加が、その他のエリアのDCをプライマリとする他のユーザシステム3からのバックアップDCとしての利用に影響を与える可能性がある。(Bn=Cn−Pnであるため、プライマリリソース使用量が増加すると、バックアップリソースとしての容量が減少する。)そのため、図10のフローでは、プライマリDC選定後に、そのDCをバックアップDCとして選定している他のすべてのユーザシステム3に関してバックアップDCの再選定を実行する(S10)。このバックアップDCの再選定ができなかった場合には、そこで処理が終了される(S6)。
一方、他のすべてのユーザシステム3に関してバックアップDCの再選定ができた場合には、ステップS4でプライマリDCの選定を行ったユーザシステム3についてバックアップDCの選定が行われる(S8)。そして、バックアップDCの選定ができた場合には、ユーザシステム3のプライマリDCへの配置が行われる(S5)。そして、ある地域で障害が発生した場合には、定常監視によって障害が検出され(S7)、ユーザシステム3のバックアップDCへの配置が行われる(S9)。
図11は、固定方式の場合の処理フローの説明図である。図11に示すように、まず、本システム1の運用開始準備の段階では、各DCの各種リソース容量を登録する処理を行った後(S1)、トータルバックアップリソース容量TBに基づいて、各DCのバックアップリソース容量を算出する処理を行う(S2)。なお、トータルバックアップリソース容量TBの算出方法については後で詳しく説明する。
つぎに、本システム1が定常運用されている段階では、ユーザシステム情報の登録が行われ(S3)、プライマリDCの選定が行われる(S4)。プライマリDCの選定ができた場合には、バックアップDCの選定が行われ(S8)、ユーザシステム3のプライマリDCへの配置が行われる(S5)。最小分割リソース量の保証がある場合は、バックアップDCの選定ができずに処理終了となる場合がある。そして、ある地域で障害が発生した場合には、定常監視によって障害が検出され(S7)、ユーザシステム3のバックアップDCへの配置が行われる(S9)。なお、最小分割リソース量の保証がない場合には、バックアップDCの選定の処理を、障害発生時に行ってもよい。
(トータルプライマリ容量およびトータルバックアップ容量の算出)
ここで、トータルプライマリ容量TPとトータルバックアップ容量TBの算出方法について説明する。まず、前処理として、地域災害発生の各DCへの影響という視点からエリアを定義する。より具体的には、DCごとに地域災害発生時に影響を受ける可能性のある地理的範囲を「リージョン」と定め、そのリージョンの境界線で区切られる各区域を「エリア」と定める。
図12は、エリアの定義の一例を示す図である。図12の例で説明すると、DC−1については、地域災害発生時にDC−1に影響を与える可能性のある範囲が「リージョン」と定められる。この場合、DC−1のリージョンは、他のリージョンと重複する部分がないので、DC−1のリージョンの境界線で区切られる区域が「エリアA1」と定められる。
DC−2についても、地域災害発生時にDC−2に影響を与える可能性のある範囲が「リージョン」と定められる。この場合、DC−2のリージョンは、DC−3のリージョンとも重複しているので、DC−2のリージョンのうちDC−3のリージョンと重複しない区域が「エリアA2」と定められ、DC−2のリージョンとDC−3のリージョンが重複する区域が「エリアA2-3」と定められる。すなわち、リージョンが重複する部分は、それぞれ個別のエリアとなる。
図13は、災害が発生したエリアとその影響のあるDCの関係を示す図である。図13では、エリアA1で災害が発生したときには、DC−1に影響を与える可能性があることが示されている。また、エリアA2-3で災害が発生したときには、DC−2とDC−3に影響を与える可能性があること示されている。
なお、以上の説明では、1つの例として、各DCの地理座標を中心として、災害発生時に影響を受ける可能性のある距離を半径とした円形のリージョンを重ねることによってエリアを定めたが、本発明の範囲はこれに限定されるものではない。すなわち、想定する災害や地理状況によっては、必ずしも各リージョンは円形であるとは限らない。また、以上の説明では、各リージョンの形状や面積が同じである場合を例示したが、本発明の範囲はこれに限定されるものではなく、各リージョンの形状や面積は異なってもよい。
上記のようにして前処理(各エリアの定義)が完了したら、全DC間でユーザシステム3のプライマリ稼働に使用可能なリソース量(トータルプライマリリソース容量TP)を算出する(TPは、全DCのプライマリリソースの合計とも表現できる。下記の式(2)参照)。トータルプライマリリソース容量TPは、どのエリアで地域災害が発生してそのエリアのDC全てに障害が発生しても、その他のエリアで復旧用のバックアップリソースが確保されるように算出する。また、トータルプライマリリソース容量TPの残りを、全DC間のバックアップ用リソースとして確保するリソースの容量(トータルバックアップ容量TB)として算出する。
より具体的に説明すると、トータルプライマリリソース容量TPの計算では、どの地域で障害が発生しても、障害の影響を受けないその他の地域でのバックアップリソースが確保されるために、前処理で定めた全エリアに対して、下記の式(3)の条件を満たす必要がある。
上記の式(3)は、下記の式(4)と等価である。
上記の式(4)において、左辺は式(2)の定義からTPと同意である。ここで、全エリアに関する上記式の右辺の計算結果のうち最も小さい値が、すべてのエリアの条件を満たし、かつ最大の値であり、ここで求めるTPの値となる。
トータルバックアップリソース容量TBは、全DCのキャパシティ合計からトータルプライマリリソース容量TPを減算することにより算出される(下記の式(5)参照)。
トータルプライマリリソース容量TPの計算を具体例を挙げて説明する。図14は、各DCのリソース量の一例(TPの計算の具体例)を示す図であり、図15は、この具体例におけるトータルプライマリリソース容量TPの計算結果を示す図である。図14と図15の例では、トータルプライマリリソース容量TPの計算結果として、600RU(全エリアの最小値)が算出される。また、この場合、トータルバックアップリソース容量TBは、400RU(=1000RU−600RU)として算出される。
なお、従来のバックアップリソース非共有の場合は、全体リソースに対して、プライマリリソースは半分までしか使用できないが、本システム1では、半分以上の使用が可能である。例えば、図14と図15の場合には、全体リソースに対して6割の使用が可能である。
また、図12のように、DCが密集していなければ、さらに高い割合でプライマリリソースを使用することが可能である。例えば、各DC間の距離が離れていて、複数のリージョンが重複するエリアが存在しないモデル(単純なモデル)であれば、図15のA1〜A5の中で最も値が小さい650RUが、トータルプライマリリソース容量TPとして算出される。
なお、そのような単純なモデルの場合には、以下のようにトータルプライマリリソース容量TPを算出することも可能である。
まず、前処理として、全データセンター2を地域ごとにグループ分けする。そして、各地域グループのリソース量の合計を算出し、値の大きい地域から順番に並べる(図16参照)。このときN番目の地域グループ(地域Nグループ)のリソース量の合計をCNとする。
この場合、トータルプライマリリソース容量TPは、下記の式(6)を用いて算出することができる。また、トータルバックアップリソース容量TBは、下記の式(7)を用いて算出することができる。
なお、トータルプライマリリソース容量TPを可能な範囲の最大値とする場合(最も保守的な場合)には、TB=C1となる。図15の例では、DC−1〜DC−5のうち、最大のリソース量を有するDC−1のリソース量350RUが、トータルバックアップリソース容量TBとして求められる。これを、全DCのリソース量の合計1000RUから減算すると、トータルプライマリリソース容量TPが、650RU(=1000RU−350RU)として求められる。
(ユーザシステムの配置先DCの選定方法)
つぎに、ユーザシステム3の配置先DCの選定方法について説明する。図17は、プライマリDCの選定条件の一例を示す図である。ユーザシステム3のプライマリDC選定では、図17の4つの条件(条件ア〜エ)をすべて満たさなければならない。プライマリDCの候補とするDCの中に条件を満たすものがない場合は、ユーザシステム3の追加はNGとなる。なお、条件アは、非固定方式の場合のみ判定が必要であり、条件エは、最小分割リソース容量を保証する場合のみ判定が必要である。
以下、これらの4つの条件(条件ア〜エ)について具体的に説明する。条件アは、全DCのリソース使用量の合計が、トータルプライマリリソース容量を超えないことであり、下記の式(8)によって表すことができる。
条件イは、配置先DCのリソース使用量がプライマリリソース容量を超えないことであり、下記の式(9)によって表すことができる。ここで、Rm(DCn)は、Smの必要リソース量のうち、DCnから割り当てを受けるリソース量である。
なお、プライマリリソース容量は、非固定方式の場合には下記の式(10)により求められ、固定方式の場合には下記の式(11)により求められる。
条件ウは、ユーザシステム3の必要リソース量の条件を満たすことであり、具体的には、配置先DCからの割り当てリソース量(分散配置の場合は各DCからの合計)が、必要リソース量と同値であることである。例えば、配置先DCが1つ(DCn1)の場合には、下記の式(12)より表され、配置先DCが2つ(DCn1、DCn2)の場合には、下記の式(13)により表される。
条件エは、ユーザシステム3の最小分割リソース量の条件を満たすことであり、例えば、配置先DCが2つ(DCn1、DCn2)の場合には、下記の式(14)および(15)により表される。
図18は、バックアップDCの満たすべき条件の一例を示す図である。ユーザシステム3のバックアップDC選定では、図18の4つの条件(条件オ〜ク)をすべて満たさなければならない。なお、条件クは、最小分割リソース容量を保証する場合のみ判定が必要である。また、前述のとおり、ユーザシステム3の最小分割リソース量を保証する場合は、条件を満たすDCがない可能性がある。そのため、バックアップDCの選定は、ユーザシステム3の追加時に行い、バックアップDCとしての条件を満たすものがない場合は、ユーザシステム3の追加はNGとなる。
以下、これらの4つの条件(条件オ〜ク)について具体的に説明する。条件オは、配置先DCがプライマリDC災害時にも影響がないことである。より具体的には、プライマリDCに災害発生の影響のあるエリアの集合(Ap)とバックアップDCに災害発生の影響のあるエリアの集合(Ab)の積集合が空集合となることであり、下記の式(16)によって表すことができる。
図19は、災害発生エリアと影響のあるDCの関係の一例を示す図である。図19の例では、プライマリDCがDC−5のとき、上記の条件オを満たすバックアップDC候補は、DC−1とDC−2である。
条件カは、配置先DCのリソース予約量がバックアップリソース容量を超えないことである。具体的には、プライマリDCが災害発生の影響を受けるすべてのエリアに関して、追加ユーザシステム3を含めた災害発生の影響を受けるDCをプライマリDCとしている各ユーザシステム3の集合(Sp)と、追加ユーザシステム3を含め対象DCをバックアップDCとしている各ユーザシステム3の集合(Sb)の積集合(Sp&b)の要素である各ユーザシステム3の必要リソース量の合計が、対象DCのバックアップリソース容量(Bn)を超えないことであり、各エリアに関して満たすべき条件は、下記の式(17)によって表すことができる。
なお、対象DCのバックアップリソース容量(Bn)は、非固定方式の場合には下記の式(18)で表され、固定方式の場合には下記の式(19)で表される。
条件キは、ユーザシステム3の必要リソース量の条件を満たすことであり、条件ウと同じであるので、ここでは説明を省略する。また、条件クは、ユーザシステム3の最小分割リソース量の条件を満たすことであり、条件エと同じである。なお、最小分割リソース量として、プライマリDC用とバックアップDC用で別々の値を指定している場合は、バックアップDC用の値を使用する。
(ユーザシステムのDC配置方法)
まず、ユーザシステム3の構成について説明する。図20は、ユーザシステム3の構成の説明図である。図20に示すように、ユーザシステム3は、複数のアプリケーションサーバ14によって構成され、各アプリケーションサーバ14は、相互に通信可能な状態になっている(矢印(i)参照)。ユーザシステム3は、ユーザシステム3ごとにデータアクセスゲートウェイ15を備えており、データアクセスゲートウェイ15は、各アプリケーションサーバ14から共用のデータベースサーバ12、ストレージサーバ13内の所有データへのアクセスを転送する(矢印(ii)参照)。このユーザシステム3は、ユーザシステム3ごとにサービスゲートウェイ16を備えており、サービスゲートウェイ16は、提供サービスの利用者からのアクセスを、サービスフロントサーバとして指定されたアプリケーションサーバ14へ転送する(矢印(iii)参照)。また、ユーザシステム3では、セキュリティ確保の観点から、各サービスゲートウェイ16とデータアクセスゲートウェイ15は、ユーザシステム3をまたがる通信を遮断する(矢印(iv)参照)。さらに、このユーザシステム3では、DNSサーバ10にユーザシステム3のサービス公開用のホスト名とサービスゲートウェイ16のIPアドレスのマッチング情報を登録する(矢印(v)参照)。
サービスゲートウェイ16は、ユーザシステム3の配置の際に動的に提供される必要があるため、実際には仮想的な機能として必要に応じて構成する方法が好ましい。サービスフロントサーバが、複数台で構成されるクラスタ構成をとる場合、サービスゲートウェイ16は、サービスフロントサーバへの転送を負荷分散するロードバランサとして機能してもよい。
データアクセスゲートウェイ15は、ユーザシステム3の配置の際に動的に提供される必要があるため、実際には仮想的な機能として必要に応じて構成する方法が望ましい。また、データアクセスゲートウェイ15は、データセキュリティの観点から、あるユーザシステム3が他のユーザシステム3のデータにアクセス不可となるようにアクセス制限がかけられることが望ましい。なお、ユーザシステム3が用いるデータをアプリケーションサーバ14内に格納するなどして、データアクセスゲートウェイ15を有さない構成とすることも可能である。
フロントエンドVLANは、各アプリケーションサーバ14の相互通信(矢印(i)参照)および利用者からのアクセスのアプリケーションサーバ14への転送(矢印(iii)参照)のために使用される。このフロントエンドVLANは、配置先DCの対象ユーザシステム内のみで通信できるように構成されている。
バックエンドVLANは、各アプリケーションサーバ14からデータベースサーバ12やストレージサーバ13へのアクセス転送(矢印(ii)参照)のために使用される。このバックエンドVLANは、配置先DCの対象ユーザシステム内のみで通信できるように構成されている。
アプリケーションサーバ14は、ユーザシステム3を構成するサーバである。このアプリケーションサーバ14は、複数台のサーバで構成することが可能である。サービスフロントサーバは、ユーザシステム3が提供するサービスの利用者からのアクセスの窓口となるサーバである。サービスフロントサーバは、基本的には、各ユーザシステム3につき1台である。
つぎに、ユーザシステム3のDC配置方法について説明する。以下、ユーザシステム3を配置先のDC(1つのDC)に配置する手順を例示して説明する。なお、ユーザシステム3を2つ以上のDCに配置する場合も、それぞれのDCについて同様の手順をとることでユーザシステム3を配置することができる。
まず「各VLANの設定」を行う。具体的には、フロントエンドVLANとバックエンドVLANを設定する。各VLANのIDは、各DCのユーザシステム用VLAN IDリストの中から非使用のものを選定する。
つぎに「サービスゲートウェイの構成」を行う。ここでは、ユーザシステム個別のサービスゲートウェイ16を構成する。具体的には、サービスゲートウェイ16を共用のインターネット接続LANとフロントエンドVLANに接続する。そして、サービスゲートウェイ16のインターネット接続LANに接続するIFにサービス公開用IPアドレスを設定する。サービス公開用IPアドレスは、各DCのユーザシステム用IPアドレスリストの中から非使用のものを選定する。
続いて「データアクセスゲートウェイの構成」を行う。この場合、ユーザシステム個別のデータアクセスゲートウェイ15を構成する。そして、データアクセスゲートウェイ15を、共用のバックエンドVLANとデータ転送LANに接続する。
つぎに「アプリケーションサーバの構成」を行う。具体的には、ユーザシステム3に割当てられたリソース内で各アプリケーションサーバ14を、それぞれの割当リソース量を目安に起動イメージから仮想マシンとして起動する。ここで、各アプリケーションサーバ14の割当リソース量は、以下の式で表すことができる。
各アプリケーションサーバの割当リソース量
=ユーザシステムの割当リソース量×各アプリケーションサーバの割当リソース割合
その後、各アプリケーションサーバ14を、フロントエンドVLANとバックエンドVLANに接続する。各アプリケーションサーバ14のフロントエンドVLAN側のIFには、各アプリケーションサーバ14のIPアドレスを設定する。なお、仮想化サーバ技術においては、割当リソース量は目安であり、各アプリケーションサーバ14が動作中に、アプリケーションサーバ間でリソースを融通し合うことが可能である。また、ユーザシステム間でもリソースを融通し合うようにしてもよい。
最後に「DNSの設定」を行う。具体的には、サービス公開用ホスト名とサービス公開用IPアドレスのマッチング情報を、DNSに登録する。なお、2つのDCに配置する場合は、1つのサービス公開用ホスト名に2つのIPアドレスが登録され、DNSが利用者からのアクセスを負荷分散して誘導する。
このようにして、ユーザシステム3のDC配置が行われる。図21は、DC配置されたユーザシステム3の管理情報と値の一例を示す図であり、図22は、配置先のDCに応じて決定する設定項目と値の一例を示す図である。
このような本システム1によれば、配置先DCの選択の自由度が高いので、リソース利用効率が向上するように配置先DCを選択することができる。図23は、リソース利用効率が向上するような配置先DCの選択の説明図である。図23に示すように、本システム1では、例えば、時間帯によるリソース使用量のばらつきを抑えるように、配置先DCを選択することができる。また、リソースごとの使用量のばらつきを抑えるように、配置先DCを選択することができる。
また、本システム1によれば、バックアップリソースの共有が可能になる。従来、いつ発生するか分からない障害時に迅速にサービス復旧するためには、必要量のバックアップリソースが常時用意されている必要がある(障害発生後に準備開始では遅い)と考えられていた。したがって、2つの地域間での1対1のディザスタリカバリ対応を可能にするには、基本的に各ユーザシステム3に対してメインリソースと同量のバックアップリソースが必要であった。
それに対して、本システム1では、3つ以上の地域間で障害時のバックアップリソースを共有利用することができる。図24は、バックアップリソース共有の効果の説明図である。図24に示すように、3つ以上の地域間でのバックアップリソース共用によるディザスタリカバリでは、メインリソースに対するバックアップリソースの割合が減少し、設備コストを削減することができる。また、異なる地域で同時に障害が発生するケースへは非対応と仮定すると、同じメインリソース量でも、2地域構成よりも3地域構成のバックアップ共有利用の方がバックアップリソースを少なくすることができる。
さらに、本システム1によれば、ユーザシステム3をある程度自由な地域やデータセンター2に配置することができる。図25は、各地域のリソースのメイン用途とバックアップ用途の割り当ての例を示す図である。図25に示すように、仮に、ある地域をバックアップ用途限定してしまうと、利用者が何らかの理由(例えば、地理的に近い地域Aの方がその他の地域に配置するよりも、システムの応答速度が速いことが期待されるため、地域Aに配置したいなどの理由)で、その地域にシステムを配置したい場合に対応できない。本システム1では、そのようなユーザの要望にも柔軟に対応することができる。
以上、本発明の実施の形態を例示により説明したが、本発明の範囲はこれらに限定されるものではなく、請求項に記載された範囲内において目的に応じて変更・変形することが可能である。
以上のように、本発明にかかる管理装置は、地域に依存した災害等の障害発生時におけるユーザシステムに対するディザスタリカバリ機能を確実に提供できるという効果を有し、有用である。
1 本システム
2 データセンター
3 ユーザシステム
4 管理装置
5 記憶部
6 入力部
7 処理部
8 表示部
9 ゲートウェイサーバ
10 DNSサーバ
11 仮想化サーバ
12 データベースサーバ
13 ストレージサーバ
14 アプリケーションサーバ
15 データアクセスゲートウェイ
16 サービスゲートウェイ

Claims (25)

  1. 複数のデータセンターのうちの一つにユーザシステムを配置するための管理装置であって、
    各データセンターは、少なくとも一つの仮想化サーバを含み、
    前記仮想化サーバは、該仮想化サーバで動作する少なくとも一つの仮想マシンにより、配置されたユーザシステムを動作させることが可能なものであり、
    各データセンターが有すリソースは、ユーザシステムが平常時に使用するプライマリリソースとして割り当てられるという用途と、障害時のためのバックアップリソースとして確保されるという用途の、いずれに供することも可能なものであり、
    前記管理装置は、
    前記複数のデータセンターの各々の現在のリソース量に関する第1の情報を記憶する記憶手段と、
    ユーザシステムの配置要求として、該ユーザシステムが必要とするリソース量を示す第2の情報を入力する入力手段と、
    前記ユーザシステムを配置した平常時のデータセンターが属する地域で障害が発生したと仮定して、該障害の影響が及ばない地域に属するデータセンターに前記ユーザシステムを配置できるだけのリソース量を、バックアップリソースとして確保しておけるか否かを、前記第1の情報及び前記第2の情報に基づいて、判断する判断手段と、
    前記判断手段によるバックアップリソース確保可能の判断に応じて、前記ユーザシステムの平常時の配置先となるデータセンター及び該データセンターにおいて該ユーザシステムに割り当てられるべきプライマリリソース量を特定する情報を出力し、前記判断手段によるバックアップリソース確保不能の判断に応じて、前記ユーザシステムの配置要求を拒否する出力手段と
    を備えることを特徴とする管理装置。
  2. 前記判断手段は、前記第1の情報に基づき、前記複数のデータセンター全体においてプライマリリソースとしての使用を許可するリソース量であるトータルプライマリリソース容量を定め、前記第2の情報が示す前記ユーザシステムが必要とするリソース量が、前記トータルプライマリリソース容量の範囲内で割り当て可能であるか否かを判断する手段を含むことを特徴とする請求項1記載の管理装置。
  3. ある地域で障害が発生したと仮定して、該障害の影響が及ばない地域に属するデータセンターが有するリソースの容量を合計する処理を、複数の地域について行うことにより、複数の合計リソース容量を得、これら合計リソース容量のうち最も小さいものを、前記トータルプライマリリソース容量として定めることを特徴とする請求項2記載の管理装置。
  4. 前記判断手段は、前記第1の情報に基づき、前記ユーザシステムの平常時の配置先となるデータセンターにおいてプライマリリソースとしての使用を許可するリソース量である個別プライマリリソース容量を定め、前記第2の情報が示す前記ユーザシステムが必要とするリソース量が、前記個別プライマリリソース容量の範囲内で割り当て可能であるか否かを判断する手段を含むことを特徴とする請求項1〜3のいずれか1項記載の管理装置。
  5. 所定の基準により選択されたデータセンターを、前記ユーザシステムの平常時の配置先となるデータセンターの候補として、前記判断手段における判断を行うことを特徴とする請求項4記載の管理装置。
  6. 前記ユーザシステムを配置した平常時のデータセンターが属する地域で障害が発生した場合に前記ユーザシステムが配置される障害時のデータセンターを、前記障害の影響が及ばない地域に属するデータセンターの中から選定する選定手段をさらに備えることを特徴とする請求項1〜5のいずれか1項記載の管理装置。
  7. 所定の基準により選択されたデータセンターを、前記ユーザシステムの障害時の配置先となるデータセンターの候補として、前記選定手段における選定を行うことを特徴とする請求項6記載の管理装置。
  8. 前記選定手段は、前記第1の情報に基づき、前記ユーザシステムの障害時の配置先となるデータセンターにおいてバックアップリソースとして使用可能なリソース量である個別バックアップリソース容量を定め、前記第2の情報が示す前記ユーザシステムが必要とするリソース量が、前記個別バックアップリソース容量の範囲内で割り当て可能であるか否かを判断する手段を含むことを特徴とする請求項6又は7記載の管理装置。
  9. 前記判断手段による判断を行う際に、前記選定手段による選定を行い、
    前記出力手段は、前記ユーザシステムの平常時の配置先となるデータセンターを特定する情報の出力に加えて、前記ユーザシステムの障害時の配置先となるデータセンターを特定する情報の出力を行うものであり、前記選定手段において前記ユーザシステムの障害時の配置先となるデータセンターが選定できなかった場合には、前記ユーザシステムの配置要求を拒否するものであることを特徴とする請求項6〜8のいずれか1項記載の管理装置。
  10. 前記障害が発生した際に、前記選定手段により選定を行い、
    前記ユーザシステムの障害時の配置先となるデータセンター及び該データセンターにおいて該ユーザシステムに割り当てられるべきバックアップリソース量を特定する情報を出力する追加出力手段をさらに備えることを特徴とする請求項6〜8のいずれか1項記載の管理装置。
  11. 前記判断手段は、前記ユーザシステムの平常時の配置先となるデータセンターが有するリソースの容量までのリソース量が、プライマリリソースとしての使用が許可されているものとして、該データセンターにおいて前記ユーザシステムが必要とするリソース量が割り当て可能であるか否かを判断する手段を含み、
    前記選定手段は、前記ユーザシステムの障害時の配置先となるデータセンターが有するリソースの容量から、現在使用されているリソース量を除いた容量の範囲内で、該データセンターにおいて前記ユーザシステムが必要とするリソース量が割り当て可能であるか否かを判断する手段を含むことを特徴とする請求項6〜10のいずれか1項記載の管理装置。
  12. 前記ユーザシステムの平常時の配置先となるデータセンターを障害時の配置先とする他のユーザシステムが、該データセンターにおいて必要とするリソース量が、割り当て可能であるか否かを判断し、割り当て可能でない場合には、該他のユーザシステムの障害時の配置先となるデータセンターの選定をし直す再選定手段をさらに備えることを特徴とする請求項11記載の管理装置。
  13. 前記判断手段は、前記ユーザシステムの平常時の配置先となるデータセンターが有するリソースの容量から、該データセンターにおいてバックアップリソースとして予め確保されているバックアップリソース容量を除いた容量までのリソース量が、プライマリリソースとしての使用が許可されているものとして、該データセンターにおいて前記ユーザシステムが必要とするリソース量が割り当て可能であるか否かを判断する手段を含み、
    前記選定手段は、前記ユーザシステムの障害時の配置先となるデータセンターにおいてバックアップリソースとして予め確保されているバックアップリソース容量の範囲内で、該データセンターにおいて前記ユーザシステムが必要とするリソース量が割り当て可能であるか否かを判断する手段を含むことを特徴とする請求項6〜10のいずれか1項記載の管理装置。
  14. 前記複数のデータセンター全体においてバックアップリソースとして確保されるリソース量であるトータルバックアップリソース容量を、複数のデータセンターに割り振ることにより、各データセンターにおいてバックアップリソースとして予め確保される前記バックアップリソース容量が定められていることを特徴とする請求項13記載の管理装置。
  15. 前記ユーザシステムが平常時に配置されるデータセンターとして、二つ以上のデータセンターを選定し、前記ユーザシステムが必要とするリソース量を該二つ以上のデータセンターに割り振ることにより、プライマリリソース量の割り当てを可能とする分割手段をさらに備えることを特徴とする請求項1〜14のいずれか1項記載の管理装置。
  16. 前記ユーザシステムが障害時に配置されるデータセンターとして、二つ以上のデータセンターを選定し、前記ユーザシステムが必要とするリソース量を該二つ以上のデータセンターに割り振ることにより、前記障害が発生した際のバックアップリソース量の割り当てを可能とする分割手段をさらに備えることを特徴とする請求項1〜14のいずれか1項記載の管理装置。
  17. 前記第2の情報は、前記ユーザシステムが必要とするリソース量を二つ以上のデータセンターに割り振る場合に、各データセンターで最低限割り当てられるべき、最小分割リソース量を示す情報を含み、
    前記分割手段は、前記第2の情報を参照してリソース量の割り振りを行う手段を含むことを特徴とする請求項15又は16記載の管理装置。
  18. 前記出力手段は、前記ユーザシステムの平常時の配置先となるデータセンターを特定する情報の出力に加えて、前記ユーザシステムの障害時の配置先となるデータセンターを特定する情報の出力を行うものであり、
    前記分割手段において前記最小分割リソース量に従った割り振りができなかった場合には、他のユーザシステムの障害時の配置先となるデータセンターの選定をし直す再選定手段をさらに備えることを特徴とする請求項17記載の管理装置。
  19. 前記ユーザシステムが必要とするリソース量を二つ以上の障害時の配置先となるデータセンターに割り振る場合の最小分割リソース量の条件が、平常時の配置先となるデータセンターに割り振る場合の条件よりも、緩和して設定されていることを特徴とする請求項17記載の管理装置。
  20. 前記ユーザシステムは、少なくとも一つのアプリケーションサーバと、該アプリケーションサーバをネットワーク経由でクライアントからアクセス可能とするための手段とを含むものであり、
    前記アプリケーションサーバは、前記仮想マシンにより実現されるものであることを特徴とする請求項1〜19のいずれか1項記載の管理装置。
  21. 前記ネットワークにおける名前解決サーバに、前記ユーザシステムのサービス公開用の名前と、前記ユーザシステムが配置されたデータセンターを前記ネットワークにおいて特定可能なアドレスとの対応を、登録することにより、前記クライアントからのアクセスを可能とする手段をさらに備えることを特徴とする請求項20記載の管理装置。
  22. 一つの地域で発生した障害が一つ以上の異なる地域に属するデータセンターに影響を与える可能性がある場合の、障害発生地域とその影響が及ぶデータセンターとの関係を示す第3の情報を記憶する記憶手段をさらに備え、
    前記判断手段は、前記第3の情報を参照して判断を行う手段を含むことを特徴とする請求項1〜21のいずれか1項記載の管理装置。
  23. 前記複数のデータセンターは、あるグループで発生した障害が他のグループのデータセンターには影響を与えないように、地域毎にグループ分けされており、
    各グループ内のデータセンターが有するリソースの合計容量のうち最も大きいものを、前記複数のデータセンター全体が有するリソースの容量から減算した容量を、前記複数のデータセンター全体においてプライマリリソースとしての使用を許可するリソース量とすることを特徴とする請求項1〜21のいずれか1項記載の管理装置。
  24. 複数のデータセンターのうちの一つにユーザシステムを配置するための管理方法であって、
    各データセンターは、少なくとも一つの仮想化サーバを含み、
    前記仮想化サーバは、該仮想化サーバで動作する少なくとも一つの仮想マシンにより、配置されたユーザシステムを動作させることが可能なものであり、
    各データセンターが有すリソースは、ユーザシステムが平常時に使用するプライマリリソースとして割り当てられるという用途と、障害時のためのバックアップリソースとして確保されるという用途の、いずれに供することも可能なものであり、
    前記管理方法は、
    前記複数のデータセンターの各々の現在のリソース量に関する第1の情報を記憶し、
    ユーザシステムの配置要求として、該ユーザシステムが必要とするリソース量を示す第2の情報を入力し、
    前記ユーザシステムを配置した平常時のデータセンターが属する地域で障害が発生したと仮定して、該障害の影響が及ばない地域に属するデータセンターに前記ユーザシステムを配置できるだけのリソース量を、バックアップリソースとして確保しておけるか否かを、前記第1の情報及び前記第2の情報に基づいて、判断し、
    バックアップリソース確保可能の判断に応じて、前記ユーザシステムの平常時の配置先となるデータセンター及び該データセンターにおいて該ユーザシステムに割り当てられるべきプライマリリソース量を特定する情報を出力し、バックアップリソース確保不能の判断に応じて、前記ユーザシステムの配置要求を拒否する
    ことを特徴とする管理方法。
  25. コンピュータを、複数のデータセンターのうちの一つにユーザシステムを配置するための管理装置として動作させるための、管理プログラムであって、
    各データセンターは、少なくとも一つの仮想化サーバを含み、
    前記仮想化サーバは、該仮想化サーバで動作する少なくとも一つの仮想マシンにより、配置されたユーザシステムを動作させることが可能なものであり、
    各データセンターが有すリソースは、ユーザシステムが平常時に使用するプライマリリソースとして割り当てられるという用途と、障害時のためのバックアップリソースとして確保されるという用途の、いずれに供することも可能なものであり、
    前記管理装置は、
    前記複数のデータセンターの各々の現在のリソース量に関する第1の情報を記憶する記憶手段と、
    ユーザシステムの配置要求として、該ユーザシステムが必要とするリソース量を示す第2の情報を入力する入力手段と、
    前記ユーザシステムを配置した平常時のデータセンターが属する地域で障害が発生したと仮定して、該障害の影響が及ばない地域に属するデータセンターに前記ユーザシステムを配置できるだけのリソース量を、バックアップリソースとして確保しておけるか否かを、前記第1の情報及び前記第2の情報に基づいて、判断する判断手段と、
    前記判断手段によるバックアップリソース確保可能の判断に応じて、前記ユーザシステムの平常時の配置先となるデータセンター及び該データセンターにおいて該ユーザシステムに割り当てられるべきプライマリリソース量を特定する情報を出力し、前記判断手段によるバックアップリソース確保不能の判断に応じて、前記ユーザシステムの配置要求を拒否する出力手段と
    を備えるものであることを特徴とする管理プログラム。
JP2010165159A 2010-07-22 2010-07-22 ディザスタリカバリシステムのための管理装置、方法及びプログラム Active JP5512442B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010165159A JP5512442B2 (ja) 2010-07-22 2010-07-22 ディザスタリカバリシステムのための管理装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010165159A JP5512442B2 (ja) 2010-07-22 2010-07-22 ディザスタリカバリシステムのための管理装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2012027656A true JP2012027656A (ja) 2012-02-09
JP5512442B2 JP5512442B2 (ja) 2014-06-04

Family

ID=45780521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010165159A Active JP5512442B2 (ja) 2010-07-22 2010-07-22 ディザスタリカバリシステムのための管理装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5512442B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013129529A1 (ja) * 2012-02-28 2013-09-06 Keepdata株式会社 バックアップシステム
JP2014002440A (ja) * 2012-06-15 2014-01-09 Hitachi Systems Ltd ディザスタリカバリ管理システムおよびディザスタリカバリ管理方法
JP2014146212A (ja) * 2013-01-30 2014-08-14 Hitachi Systems Ltd Bcp実施支援システムおよびbcp実施支援プログラム
US9047247B2 (en) 2012-10-30 2015-06-02 Hitachi, Ltd. Storage system and data processing method
JP2015198401A (ja) * 2014-04-02 2015-11-09 日本電信電話株式会社 耐被災ネットワーク制御システム及び方法及び装置及びプログラム
JP2017199155A (ja) * 2016-04-26 2017-11-02 日本電信電話株式会社 コンピュートリソース管理システムおよびコンピュートリソース管理方法
CN113495798A (zh) * 2020-03-20 2021-10-12 深圳市理邦精密仪器股份有限公司 一种基于信息化终端的选定服务器方法与系统
JP7069427B1 (ja) * 2021-04-14 2022-05-17 三菱電機株式会社 監視制御システム、サーバ、バックアップ処理方法、およびバックアップ処理プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005250839A (ja) * 2004-03-04 2005-09-15 Nomura Research Institute Ltd 耐障害性システム
JP2006268093A (ja) * 2005-03-22 2006-10-05 Hitachi Ltd 記憶制御方法及びシステム
JP2009048607A (ja) * 2007-08-20 2009-03-05 Hitachi Ltd 視覚化および地理的分散データセンタ用記憶装置およびサーバプロビジョニング

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005250839A (ja) * 2004-03-04 2005-09-15 Nomura Research Institute Ltd 耐障害性システム
JP2006268093A (ja) * 2005-03-22 2006-10-05 Hitachi Ltd 記憶制御方法及びシステム
JP2009048607A (ja) * 2007-08-20 2009-03-05 Hitachi Ltd 視覚化および地理的分散データセンタ用記憶装置およびサーバプロビジョニング

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013129529A1 (ja) * 2012-02-28 2013-09-06 Keepdata株式会社 バックアップシステム
JP2014002440A (ja) * 2012-06-15 2014-01-09 Hitachi Systems Ltd ディザスタリカバリ管理システムおよびディザスタリカバリ管理方法
US9047247B2 (en) 2012-10-30 2015-06-02 Hitachi, Ltd. Storage system and data processing method
JP2014146212A (ja) * 2013-01-30 2014-08-14 Hitachi Systems Ltd Bcp実施支援システムおよびbcp実施支援プログラム
JP2015198401A (ja) * 2014-04-02 2015-11-09 日本電信電話株式会社 耐被災ネットワーク制御システム及び方法及び装置及びプログラム
JP2017199155A (ja) * 2016-04-26 2017-11-02 日本電信電話株式会社 コンピュートリソース管理システムおよびコンピュートリソース管理方法
CN113495798A (zh) * 2020-03-20 2021-10-12 深圳市理邦精密仪器股份有限公司 一种基于信息化终端的选定服务器方法与系统
JP7069427B1 (ja) * 2021-04-14 2022-05-17 三菱電機株式会社 監視制御システム、サーバ、バックアップ処理方法、およびバックアップ処理プログラム
WO2022219745A1 (ja) * 2021-04-14 2022-10-20 三菱電機株式会社 監視制御システム、サーバ、バックアップ処理方法、およびバックアップ処理プログラム

Also Published As

Publication number Publication date
JP5512442B2 (ja) 2014-06-04

Similar Documents

Publication Publication Date Title
JP5512442B2 (ja) ディザスタリカバリシステムのための管理装置、方法及びプログラム
EP3487149B1 (en) Data shard storage method, device and system
US10877859B2 (en) Protecting virtual machines against storage connectivity failures
US9846611B2 (en) Proactive resource reservation for protecting virtual machines
US7788233B1 (en) Data store replication for entity based partition
US8112659B2 (en) Reducing recovery time for business organizations in case of disasters
US9122530B2 (en) Management apparatus and management method
Yang et al. AutoReplica: automatic data replica manager in distributed caching and data processing systems
US20080307425A1 (en) Data Processing System and Method
EP3090341A1 (en) System and method for allocating resources and managing a cloud based computer system
US11614977B2 (en) Optimizing clustered applications in a clustered infrastructure
JP2016505965A (ja) 優先化バーチャル機械へ最適化されたサービス品質を提供することと、共有されたリソースの品質に基づくアプリケーション
EP3442201B1 (en) Cloud platform construction method and cloud platform
US10944815B2 (en) Service location management in computing systems
US10761869B2 (en) Cloud platform construction method and cloud platform storing image files in storage backend cluster according to image file type
US20130185531A1 (en) Method and apparatus to improve efficiency in the use of high performance storage resources in data center
CN110557413A (zh) 一种业务服务系统及提供业务服务的方法
CN105468296A (zh) 基于虚拟化平台的无共享存储管理方法
CN115080436B (zh) 测试指标确定方法、装置、电子设备及存储介质
US11153173B1 (en) Dynamically updating compute node location information in a distributed computing environment
JP2812045B2 (ja) 高信頼型分散処理システム
CN113312339B (zh) 一种数据迁移的方法及装置、计算机设备和存储介质
Gopisetty et al. Automated planners for storage provisioning and disaster recovery
CN111866210A (zh) 一种虚拟ip均衡分配方法、系统、终端及存储介质
CN111488248A (zh) 一种托管私有云系统的控制方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130717

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140326

R150 Certificate of patent or registration of utility model

Ref document number: 5512442

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250