JP5370624B2 - クラウドサービス復旧時間予測システム、方法およびプログラム - Google Patents

クラウドサービス復旧時間予測システム、方法およびプログラム Download PDF

Info

Publication number
JP5370624B2
JP5370624B2 JP2013529882A JP2013529882A JP5370624B2 JP 5370624 B2 JP5370624 B2 JP 5370624B2 JP 2013529882 A JP2013529882 A JP 2013529882A JP 2013529882 A JP2013529882 A JP 2013529882A JP 5370624 B2 JP5370624 B2 JP 5370624B2
Authority
JP
Japan
Prior art keywords
recovery
resource
schedule
service
recovery time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013529882A
Other languages
English (en)
Other versions
JPWO2013035243A1 (ja
Inventor
文雄 町田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013529882A priority Critical patent/JP5370624B2/ja
Application granted granted Critical
Publication of JP5370624B2 publication Critical patent/JP5370624B2/ja
Publication of JPWO2013035243A1 publication Critical patent/JPWO2013035243A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection

Description

本発明は、複数の計算機資源の故障を伴うシステム障害時に、サービス利用者ごとにサービス復旧時間を予測するクラウドサービス復旧時間予測システム、クラウドサービス復旧時間予測方法およびクラウドサービス復旧時間予測用プログラムに関する。
仮想マシンやストレージなどの計算機資源をネットワークを介して利用者に提供するクラウドサービスが近年広く利用されている。クラウドサービスの利用者は、計算機資源をサービス提供者から借りることにより、計算機資源の所有や管理のコストを抑えることができる。特許文献1には、このようなクラウドサービスの実施形態の一例が記載されている。
クラウドサービスの利用者増加に伴い、サービス障害により影響を受ける利用者の数も大きくなっている。大規模なクラウドサービスでは、一部のシステム障害によって数十万人の利用者に影響を与えることもある。しかし、利用者は、クラウドサービスの構成や管理方式、発生した障害の詳細は把握できないため、障害復旧の処理を直接制御することはできない。利用者は、クラウドサービスの提供者によって障害が取り除かれ、サービスが再び利用可能になるまで待機しなければならない。
障害復旧に関する詳細な状況を把握できないことは、利用者の不安を助長する要因となる。このため、利用者からの問い合わせや利用者による再試行などのアクセスが殺到する可能性がある。利用者からの急激なアクセス増加は、システムの性能低下や機能喪失など、新たなトラブルを招く。このようなサービス障害に伴う利用者のストレスを緩和するため、一部のクラウドサービスでは、ダッシュボードと呼ばれるWebサイトが設けられている。このWebサイトを介して、サービス復旧に向けた取り組みが利用者に公開される。
特許文献2には、利用者から受け付けた障害情報に基づいて、障害情報を公開するためのWebページを生成して公開する方法が記載されている。障害発生時にWebで素早く情報を公開することにより、障害によって影響を受ける利用者のストレスを軽減できる。
また、特許文献3には、ネットワークの障害情報をユーザへ通知する障害通知方法が記載されている。特許文献3に記載された障害通知方法は、テレビ会議アプリケーションなどの通信を伴うシステムの障害発生時に、ユーザのアプリケーション予約状況に基づいて利用者毎にメールなどを用いて障害情報を通知する。この方法では、利用者のアプリケーション予約期間と、障害発生から復旧までの期間の時間的な重なりに基づいて、利用者への影響を判断して障害情報を通知する。
また、特許文献4には、ネットワークサービスを利用できなくなった場合に必要な情報を利用者に通知する方法が記載されている。特許文献4に記載された方法では、サーバ機が、ネットワークサービスで提供される資源を利用しているクライアント機の識別情報、該当する資源を利用しているクライアント機で動作しているプログラムの種類、および、該当するクライアント機のプログラムの利用者の種類を管理している。そして、サーバ機の資源に所定の問題が発生したことによりネットワークサービスを提供できなくなった場合、ネットワークサービスで提供される資源に基づくネットワークサービスの情報をクライアント機に対して通知する。
なお、非特許文献1では、Google(登録商標)AppEngineで提供されるクラウドサービスの現在の状態が公開されている。また、非特許文献2では、Amazon(登録商標)EC2で提供されるクラウドサービスの現在の状態が公開されている。クラウドサービスに障害発生した時には、このWebサイトで障害発生箇所やサービス復旧予定時刻などが公開される。サービス復旧状況に合わせてこれらの情報が更新されるため、利用者は、このサイトを参照してサービス再開時にむけて備えることができる。
また、特許文献5には、複数のストレージ装置間で非同期リモートコピーを行うストレージシステムにおいて、データ復旧可能時刻を監視する方法が記載されている。特許文献5に記載された方法では、第1のストレージ装置のバッファに滞留している最新またはそれに準ずるデータを所定の時間間隔で時刻情報とともに蓄積しておく。そして、蓄積した情報と、所定時刻における、最古またはそれに準ずるデータと、滞留しているデータ数のうち少なくとも1つの情報とに基づき、所定時刻を基準にして、第2のストレージ装置に記憶されたデータを用いて復旧できる時刻を算出する。
特開2010−146198号公報 特開2002−108728号公報 特開2004−364154号公報 特開2007−41646号公報 特開2010−146198号公報
Google、"Google AppEngine"、[online]、[平成23年8月19日検索]、インターネット〈URL:http://code.google.com/status/appengine〉 Amazon、"amazon web service SERVICE HEALTH DASHBOARD"、[online]、[平成23年8月19日検索]、インターネット〈URL:http://status.aws.amazon.com/〉
一般に、利用者が必要とする計算機資源の種類や量は、利用者ごとに異なる。そのため、特許文献2に記載された方法を用いて公開される障害情報や、非特許文献1および非特許文献2で公開される情報は、必ずしも各利用者にとって適切な情報ではない。
例えば、非特許文献1および非特許文献2で公開される情報は、サービス全体の復旧時間に関する情報である。この場合、仮にサービスの一部が復旧し、一部のサービス利用者がサービスを利用可能な状況になったとしても、各サービス利用者は、その状況を把握できない。すなわち、サービス利用者は、クラウドサービスの障害時にサービス提供者から公開される復旧予測時間情報にしたがい、全てのサービスの復旧時まで待機しなければならない。
一方、一部の資源の復旧時間予測に基づいてサービス復旧時間が公開される場合、全ての利用者がその時点でサービスの利用を再開できるとは限らない。一般に各利用者が必要とする計算機資源の種類や量は異なるため、一部の資源が利用可能となっただけでは、利用を再開できない場合がある。すなわち、一部の資源の復旧時間予測が公開されても、各利用者は必要とする全ての資源が復旧するまでサービスの利用を再開できない。
このように、複数種類の計算機資源に障害が発生するクラウドサービスの障害に対し、特許文献2に記載された方法では、利用者ごとに異なる復旧時間(具体的には、サービスを利用再開できる時刻)を提示できない問題がある。
また、クラウドサービスで提供されるサービスが、必ずしも事前に予約を必要とするサービスとは限らない。そのため、利用者が予約をせずに利用するサービスで障害が発生した場合、特許文献3に記載された方法では対応できない。
また、特許文献4に記載された方法では、障害が発生した資源を利用しているクライアントに、ネットワークサービスが利用できないことを通知する。しかし、特許文献4には、サービスが復旧するまでの予想時間をどのように算出するか記載されておらず、その具体的な予測方法は不明である。
そこで、本発明は、複数種類の計算機資源を用いて提供されるクラウドサービスの障害によって利用者の要求するサービスが利用できなくなった場合に、クラウドサービスが復旧する時間を利用者ごとに予測できるクラウドサービス復旧時間予測システム、クラウドサービス復旧時間予測方法およびクラウドサービス復旧時間予測用プログラムを提供することを目的とする。
本発明によるクラウドサービス復旧時間予測システムは、クラウドサービスで提供される複数種類の計算機資源またはそのクラウドサービスで提供されるサービスである提供サービスで障害が発生した場合のその計算機資源またはその提供サービスを復旧させるスケジュールを規定した復旧スケジュールを、その計算機資源の種類または提供サービスごとに記憶する復旧スケジュール記憶手段と、各利用者がクラウドサービスを利用する際に使用する計算機資源を定めた資源利用プロフィールをその利用者ごとに記憶する資源利用プロフィール記憶手段と、利用者がクラウドサービスを利用する際に使用する計算機資源または提供サービスを資源利用プロフィールから特定し、復旧スケジュールに基づいて、特定された全ての計算機資源または提供サービスが復旧する時間を予測することにより、その利用者が利用するクラウドサービスの復旧時間を予測する復旧時間予測手段と、予測されたサービス復旧時間を利用者に提示する復旧時間提示手段とを備えたことを特徴とする。
本発明によるクラウドサービス復旧時間予測方法は、クラウドサービスで提供される複数種類の計算機資源またはそのクラウドサービスで提供されるサービスである提供サービスで障害が発生した場合の復旧時間を予測するクラウドサービス復旧時間予測方法であって、各利用者がクラウドサービスを利用する際に使用する計算機資源を定めた資源利用プロフィールをその利用者ごとに記憶する資源利用プロフィール記憶手段を参照し、その資源利用プロフィール記憶手段に記憶されたその資源利用プロフィールから、利用者がクラウドサービスを利用する際に使用する計算機資源または提供サービスを特定し、計算機資源または提供サービスで障害が発生した場合のその計算機資源またはその提供サービスを復旧させるスケジュールを規定した復旧スケジュールを、その計算機資源の種類または提供サービスごとに記憶する復旧スケジュール記憶手段から抽出し、抽出した復旧スケジュールに基づいて、特定された全ての計算機資源または提供サービスが復旧する時間を予測することにより、その利用者が利用するクラウドサービスの復旧時間を予測し、予測されたサービス復旧時間を利用者に提示することを特徴とする。
本発明によるクラウドサービス復旧時間予測用プログラムは、クラウドサービスで提供される複数種類の計算機資源またはそのクラウドサービスで提供されるサービスである提供サービスで障害が発生した場合の復旧時間を予測するコンピュータに適用されるクラウドサービス復旧時間予測用プログラムであって、コンピュータに、各利用者がクラウドサービスを利用する際に使用する計算機資源を定めた資源利用プロフィールをその利用者ごとに記憶する資源利用プロフィール記憶手段を参照し、その資源利用プロフィール記憶手段に記憶されたその資源利用プロフィールから、利用者がクラウドサービスを利用する際に使用する計算機資源または提供サービスを特定し、計算機資源または提供サービスで障害が発生した場合のその計算機資源またはその提供サービスを復旧させるスケジュールを規定した復旧スケジュールを、その計算機資源の種類または提供サービスごとに記憶する復旧スケジュール記憶手段から抽出し、抽出した復旧スケジュールに基づいて、特定された全ての計算機資源または提供サービスが復旧する時間を予測することにより、その利用者が利用するクラウドサービスの復旧時間を予測する復旧時間予測処理、および、予測されたサービス復旧時間を利用者に提示する復旧時間提示処理を実行させることを特徴とする。
本発明によれば、複数種類の計算機資源を用いて提供されるクラウドサービスの障害によって利用者の要求するサービスが利用できなくなった場合に、クラウドサービスが復旧する時間を利用者ごとに予測できる。
クラウドサービスの構成全体の例を示す説明図である。 復旧スケジュールを生成する処理の例を示すフローチャートである。 利用者ごとにサービス復旧時間を予測して提示する手順の例を示すフローチャートである。 本発明の第2の実施形態のクラウドサービス復旧時間予測システムの例を示す説明図である。 利用者ごとにサービス復旧時間を予測して提示する手順の他の例を示すフローチャートである。 本発明の第3の実施形態のクラウドサービス復旧時間予測システムの例を示す説明図である。 復旧スケジュールを生成する処理の例を示すフローチャートである。 逐次探索処理の例を示すフローチャートである。 第1の実施例のクラウドサービスが提供する計算機資源およびサービスの一例を示す説明図である。 クラウドサービス利用者の資源プロフィールの一部を示す説明図である。 障害状況データの一例を示す説明図である。 資源復旧スケジュールの例を示す説明図である。 利用者ごとにサービスの復旧予定時刻を求めた結果の例を示す説明図である。 仮想マシンの予約情報の一例を示す説明図である。 利用者ごとにサービスの復旧予定時刻を求めた結果の他の例を示す説明図である。 本発明によるクラウドサービス復旧時間予測システムの最小構成の例を示すブロック図である。
以下、本発明の実施形態を図面を参照して説明する。
実施形態1.
図1は、本発明の第1の実施形態のクラウドサービス復旧時間予測システムを含むクラウドサービスの構成全体の例を示す説明図である。図1に例示するクラウドサービスでは、クラウドサービス提供部1と、復旧時刻予測システム2と、クラウドサービスクライアント3とを備えている。図1に例示する復旧時刻予測システム2が、本発明の第1の実施形態のクラウドサービス復旧時間予測システムに対応する。クラウドサービス提供部1と、復旧時刻予測システム2と、クラウドサービスクライアント3とは、通信ネットワーク網(図示せず)を介して相互に接続される。
クラウドサービス提供部1は、仮想マシン101と、ストレージ102と、サービス提供部103とを備える。仮想マシン101、ストレージ102およびサービス提供部103を用いて利用者に各種サービスが提供される。以下の説明では、クラウドサービス提供部1が備える仮想マシン101およびストレージ102のことを、計算機資源と記すこともある。
なお、図1に示す例では、クラウドサービス提供部1が、仮想マシン101、ストレージ102およびサービス提供部103をそれぞれ6つ備えている場合を示す。ただし、仮想マシン101、ストレージ102およびサービス提供部103の個数は、6つに限定されない。仮想マシン101、ストレージ102およびサービス提供部103の個数は、それぞれ、1つずつであってもよく、2つ以上5つ以下であってもよく、7つ以上であってもよい。また、仮想マシン101、ストレージ102およびサービス提供部103の個数は、それぞれ同一でなくてもよい。また、クラウドサービス提供部1は、利用者に各種サービスを提供するために、その他同様の計算機資源を備えていてもよい。
また、クラウドサービス提供部1は、仮想マシン101、ストレージ102などの計算機資源を利用者に対して提供するための専用のインタフェース(図示せず)を備える。専用のインタフェースとして、例えば、仮想マシン101の生成や削除を行うためのインタフェースや、ストレージを追加するためのインタフェースなどが挙げられる。
クラウドサービスの利用者は、クラウドサービスクライアント3の機能を利用して専用インタフェースにアクセスし、クラウドサービス内の仮想マシン101やストレージ102を利用する。
サービス提供部103は、計算機資源の他に利用者が利用可能なサービスを提供する。サービス提供部103が提供するサービスとして、例えば、プライベートなネットワークアクセスを提供するVPN(Virtual Private Network )サービス、トラフィックの負荷分散を行う負荷分散サービス、クラウドサービス内の特定の仮想マシンの状態や性能を監視する監視サービス、トラフィックの増減に合わせて仮想マシンのインスタンス数を増減させるスケールアップサービス、資源へのアクセスを制限するための認証認可サービスなどが挙げられる。
クラウドサービスの利用者は、クラウドサービスクライアント3の機能を利用して、サービス提供部103が提供するサービスを利用し、クラウドサービス提供部1内にアプリケーションシステム(図示せず)を構築する。クラウドサービスの利用者は、利用する計算機資源の種類および量、利用するサービスをクラウドサービスに登録し、利用状況に応じて利用料をサービス提供者に支払う。クラウドサービス提供者は、各利用者が利用する計算機資源や利用するサービスの情報を、後述する資源利用プロフィール記憶部206に記憶する。
復旧時間予測システム2は、障害状況調査手段201と、障害状況記憶部202と、復旧スケジュール生成手段203と、資源復旧スケジュール記憶部204と、復旧時間予測手段205と、資源利用プロフィール記憶部206と、復旧時間提示手段207とを含む。
障害状況調査手段201は、クラウドサービス提供部1内の計算機資源やサービス提供部103の障害状況を調査する。具体的には、障害状況調査手段201は、複数種類の計算機資源損失を伴うクラウドサービスの障害時に、各計算機資源またはサービスの障害状況を調査する。そして、障害状況調査手段201は、調査結果を障害状況記憶部202に記憶する。
障害状況記憶部202は、クラウドサービス提供部1内の障害状況を記憶する。障害状況は、障害状況調査手段201により、障害状況記憶部202に随時記憶される。
復旧スケジュール生成手段203は、障害状況記憶部202に記憶された障害状況に応じて、各計算機資源および提供サービスに対する復旧スケジュールを生成する。そして、復旧スケジュール生成手段203は、生成した復旧スケジュールを資源復旧スケジュール記憶部204に記憶する。
ここで復旧スケジュールとは、クラウドサービス提供部1が提供する複数種類の計算機資源またはサービス提供部3が提供するサービス(以下、提供サービスと記すこともある。)で障害が発生した場合に、その計算機資源または提供サービスを復旧させるためのスケジュールである。
復旧スケジュールは、一般的に知られた方法を用いて作成される。例えば、計算機資源の障害ごとに復旧にかかる時間や、障害の組合せごとの復旧順序を予め設定しておいてもよい。この場合、復旧スケジュール生成手段203は、障害状況記憶部202に障害状況が登録されたタイミングで、その障害状況から計算機資源の障害を特定し、特定した計算機資源に基づいて、予め設定しておいた復旧にかかる時間および復旧順序から復旧スケジュールを生成してもよい。また、例えば、ストレージの復旧スケジュールを作成する場合、復旧スケジュール生成手段203は、特許文献5に記載された方法を用いて復旧スケジュールを生成してもよい。
ただし、復旧スケジュール生成手段203が復旧スケジュールを生成する方法は、上記方法に限定されない。例えば、入力手段(図示せず)を介して管理者等が障害状況に応じて作成した各計算機資源および提供サービスの復旧手順が入力された場合、復旧スケジュール生成手段203は、入力された復旧手順を、復旧スケジュールとして利用してもよい。
資源復旧スケジュール記憶部204は、計算機資源の種類および提供サービスごとに復旧スケジュールを記憶する。
資源利用プロフィール記憶部206は、各利用者がクラウドサービスを利用する際に使用する計算機資源(具体的には、計算機資源の種類および量)を定めた資源利用プロフィールを記憶する。資源利用プロフィールは、管理者等により、予め資源利用プロフィール記憶部206に記憶される。ここで、計算機資源の量には、仮想マシン101の数や、ストレージ102で割り当てられる容量などが含まれる。
復旧時間予測手段205は、計算機資源または提供サービスごとの復旧スケジュール、および、資源利用プロフィール記憶部206に格納された資源利用プロフィールに基づき、利用者ごとのサービス復旧時間を予測する。具体的には、復旧時間予測手段205は、利用者がクラウドサービスを利用する際に使用する計算機資源または提供サービスを、資源利用プロフィールから特定する。そして、復旧時間予測手段205は、復旧スケジュールに基づいて、特定された全ての計算機資源または提供サービスが復旧する時間を予測する。
復旧時間予測手段205は、予測した各計算機資源および各提供サービスが復旧する時間のうち、最も遅い時間を利用者が利用するクラウドサービスの復旧時間と予測してもよい。
復旧時間提示手段207は、予測されたサービス復旧時間を利用者に提示する。提示する方法として、例えば、Webを使ったアナウンスや、メールやインスタントメッセージ等を使ったユーザへの通知などが挙げられる。なお、復旧時間の提示には、間接的に他の装置に復旧時間を送信することも含まれる。
障害状況調査手段201と、復旧スケジュール生成手段203と、復旧時間予測手段205と、復旧時間提示手段207とは、プログラム(クラウドサービス復旧時間予測用プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、復旧時間予測システム内の記憶部(図示せず)に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、障害状況調査手段201、復旧スケジュール生成手段203、復旧時間予測手段205および復旧時間提示手段207として動作してもよい。また、障害状況調査手段201と、復旧スケジュール生成手段203と、復旧時間予測手段205と、復旧時間提示手段207とは、それぞれが専用のハードウェアで実現されていてもよい。
また、障害状況記憶部202と、資源復旧スケジュール記憶部204と、資源利用プロフィール記憶部206とは、例えば、磁気ディスク等により実現される。
次に、本実施形態の復旧時間予測システム2の動作を説明する。クラウドサービスを稼働させているデータセンタに災害や停電等が発生すると、災害の程度に応じて複数の計算機資源および提供サービスに障害が発生する。例えば、データセンタの一区画で電源が失われた場合、その区画内で稼働しているサーバ、およびサーバ内で稼働していた仮想マシンが停止する。さらに、この場合、区画内にあるストレージ装置、および各種提供サービスも停止する。この障害により、仮想マシンやストレージ装置、提供サービスを利用していた利用者は、クラウドサービスを利用できない状態になる。クラウドサービス提供者は、障害の発生を検知すると、クラウドサービスの復旧処理を開始する。復旧時間予測システム2は、クラウドサービス復旧処理の過程で、障害の影響を受けた利用者ごとに復旧時間の予測を行う。
図2は、各計算機資源および提供サービスの障害状況を調査して復旧スケジュールを生成する処理の例を示すフローチャートである。復旧時間予測システム2では、はじめに、障害状況調査手段201が、クラウドサービス提供部1内で障害によって停止した物理サーバや仮想サーバ、ストレージ装置、各種サービスを特定し、被害状況を調査する(ステップS1000)。各計算機資源の被害状況の例として、物理的な損傷により交換が必要な状態、物理的な損傷はないが論理的な不整合を生じている可能性がある状態、一部のデータを損失している可能性がある状態、サービスとして一部の機能を提供できない状態、などが挙げられる。
障害状況調査手段201は、調査結果を障害状況記憶部202に記憶する(ステップS1001)。障害状況調査手段201は、例えば、障害によって発生するアラートメッセージを集約して自動的に調査結果をまとめても良い。また、クラウドサービスの管理者が、現場の被害状況やログデータなどを確認することによって障害状況の調査を行ってもよい。また、障害状況調査手段201は、定期的に計算機資源や提供サービスの状況を監視し、異常を検知した時点で障害が発生したと判断してもよい。障害状況記憶部202には、復旧処理中、継続的に参照処理や更新処理が繰り返し行われ、各時点での最新の障害状況が格納されるものとする。
次に、復旧スケジュール生成手段203は、障害状況を参照して、各計算機資源および提供サービスの復旧スケジュールを生成する(ステップS1002)。そして、復旧スケジュール生成手段203は、資源復旧スケジュール記憶部204の復旧スケジュールを更新する(ステップS1003)。
復旧手順(復旧スケジュール)は、資源の種類や被害の状況、および復旧に必要な人員や資源の備蓄状況などによって異なる。想定されるこれらの障害内容に対する復旧時間や手順を予め設定しておき、復旧スケジュール生成手段203が、これらの情報に基づいて復旧スケジュールを作成してもよい。
また、計算機資源を管理する管理者によって作成された資源の種類や提供サービスごとの復旧スケジュールが入力される場合、復旧スケジュール生成手段203は、入力された復旧スケジュールを資源復旧スケジュール記憶部204に記憶してもよい。例えば、仮想マシン資源の復旧スケジュールは、仮想マシンを提供するサーバクラスタを管理する専門の管理者グループによって作成される。同様に、ストレージの復旧スケジュールは、ストレージ管理専門の管理者グループによって生成される。復旧スケジュール生成手段203は、生成した復旧スケジュールを、これらの管理者によって作成された復旧スケジュールに置き換えてもよい。
図3は、復旧スケジュールおよび資源利用プロフィールに基づいて、利用者ごとにサービス復旧時間を予測して提示する手順の例を示すフローチャートである。復旧時間予測手段205は、まずクラウドサービスの全利用者のリストを資源利用プロフィール記憶部206から取得する(ステップS2000)。なお、復旧時間予測手段205は、障害によって影響を受けたユーザに限定して利用者のリストを取得してもよい。復旧時間予測手段205は、取得した利用者のリストから利用者を一人ずつ選択し(ステップS2001)、復旧予測時刻を調べる。具体的には、復旧時間予測手段205は、資源利用プロフィール記憶部206を参照して、選択した利用者Uiの資源利用プロフィールを取得する(ステップS2002)。
この資源利用プロフィールには、利用者が要求する計算機資源のリストが含まれており、この資源のリストから、資源の種類(以下、資源タイプRjと記す。)が特定される。そこで、復旧時間予測手段205は、資源利用プロフィールから資源タイプRjを選択する(ステップS2003)。資源タイプRjは、例えば、仮想マシンやストレージ、各種提供サービスを示す。また、資源タイプRjは、上記内容に加え、ある計算機資源が共有資源か否かを示す情報を示していてもよい。
次に、復旧時間予測手段205は、資源復旧スケジュール記憶部204を参照し、選択した資源タイプRjの資源復旧スケジュールを参照する(ステップS2004)。この資源復旧スケジュールには、各時点で復旧する資源や、資源の量、資源内の部分を示す情報などが記載される。そこで、復旧時間予測手段205は、資源利用プロフィールに記載された利用者の要求する資源が復旧して利用可能になる復旧予定時刻Tjを予測する(ステップS2005)。なお、復旧時間予測手段205は、予測結果をメモリ(図示せず)等に記録してもよい。
復旧時間予測手段205は、資源利用プロフィールに記載された全ての資源タイプRjに対して復旧予定時刻Tjを予測したか否かを判断する(ステップS2006)。全ての資源タイプRjの復旧予定時刻Tjを予測していない場合(ステップS2006におけるNO)、復旧時間予測手段205は、ステップS2003からステップS2006の処理を繰り返す。
一方、全ての資源タイプRjの復旧予定時刻Tjを予測した場合(ステップS2006におけるYES)、復旧時間予測手段205は、復旧予定時刻Tjの最大値を求める。復旧時間予測手段205は、この復旧予定時刻Tjの最大値を利用者Uiの復旧予定時刻とする(ステップS2007)。なお、復旧時間予測手段205は、復旧予定時刻をメモリ(図示せず)等に記録してもよい。
復旧時間予測手段205は、利用者リストに含まれる全ての利用者について復旧予定時刻を予測したか否か判断する(ステップS2008)。全ての利用者について復旧予定時刻を予測していない場合(ステップS2008におけるNO)、復旧時間予測手段205は、ステップS2001からステップS2008までの処理を繰り返す。一方、全ての利用者について復旧予定時刻を予測した場合(ステップS2008におけるYES)、復旧時間提示手段207は、予測した復旧予定時刻を利用者に提示する(ステップS2009)。
以上のように、本実施形態によれば、復旧時間予測手段205が、利用者がクラウドサービスを利用する際に使用する計算機資源または提供サービスを資源利用プロフィールから特定する。さらに、復旧時間予測手段205は、復旧スケジュールに基づいて、特定された全ての計算機資源または提供サービスが復旧する時間を予測する。これにより、復旧時間予測手段205は、その利用者が利用するクラウドサービスの復旧時間を予測する。そして、復旧時間提示手段207が、予測されたサービス復旧時間を利用者に提示する。そのため、複数種類の計算機資源を用いて提供されるクラウドサービスの障害によって利用者の要求するサービスが利用できなくなった場合に、クラウドサービスが復旧する時間を利用者ごとに予測できる。
すなわち、本実施形態では、復旧時間予測手段205が、利用者の資源利用プロフィールと各計算機資源または提供サービスの復旧スケジュールを参照して、利用者ごとにサービス復旧時間を予測する。よって、クラウドサービスの障害時に、利用者ごとに異なるサービス復旧時間を提示することができる。
また、障害状況調査手段201が、各計算機資源または提供サービスの障害状況を調査して、障害状況記憶部202に記憶させてもよい。そして、復旧スケジュール生成手段203が、障害状況記憶部202に記憶された障害状況に基づいて復旧スケジュールを生成し、その復旧スケジュールを資源復旧スケジュール記憶部204に記憶させてもよい。このように、障害が発生したタイミングで自動的に復旧スケジュールを作成することで、より迅速に障害対応することが可能になる。
実施形態2.
次に、本発明の第2の実施形態のクラウドサービス復旧時間予測システムを説明する。なお、本実施形態におけるクラウドサービス復旧時間予測システムも、図1に例示するクラウドサービスと同様の構成に含まれるものとする。図4は、本発明の第2の実施形態のクラウドサービス復旧時間予測システムの例を示す説明図である。なお、第1の実施形態と同様の構成については、図1と同一の符号を付し、説明を省略する。本実施形態における復旧時間予測システム2は、第1の実施形態の復旧時間予測システム2の構成に加え、資源予約情報記憶部208を含む。
クラウドサービス提供部1の計算機資源の中には、複数の利用者で共有されているが、利用者間で排他的に利用される種類の資源もある。このような種類の資源として、例えば、どの利用者も使うことのできる共有された仮想マシンなどが挙げられる。排他的に共有される計算機資源は、全ての利用者が同時に利用できるわけではない。そのため、特定の利用者のみに利用を許可する予約機能が必要になる。本実施形態の復旧時間予測システム2は、この予約機能を実現するために用いられる予約情報を参照して復旧時間の予測を行う。
資源予約情報記憶部208は、各計算機資源の利用に関する予約情報を記憶する。予約情報は、複数の利用者で共有され、利用者間で排他的に利用される計算機資源の予約開始時間を、その計算機資源の利用者と対応づけた情報である。資源予約情報記憶部208は、例えば、磁気ディスク等により実現される。すなわち、予約情報には、利用者が計算機資源の予約を開始する時刻(予約開始時刻)を示す情報が含まれる。
復旧時間予測手段205は、利用者の資源利用プロフィールから、その利用者が利用する計算機資源または提供サービスを特定する。復旧時間予測手段205は、予約情報に基づいて、複数の利用者で排他的に利用される計算機資源が予約可能か否か判断する。復旧時間予測手段205は、復旧スケジュールに基づいて、予約可能な計算機資源の復旧時刻を予約開始時刻とする予約情報を資源予約情報記憶部208に記憶する。そして、復旧時間予測手段205は、復旧スケジュールおよび予約情報から、利用者が計算機資源を予約可能な時間を特定する。
具体的には、復旧時間予測手段205は、利用者が利用する計算機資源または提供サービスのうち、最も早く復旧すると想定されるものおよびその復旧時刻を復旧スケジュールから特定する。さらに、復旧時間予測手段205は、特定した時刻に対応する計算機資源または提供サービスの予約情報を参照する。その計算機資源または提供サービスが予約可能な場合、復旧時間予測手段205は、復旧時刻を予約開始時間とする予約情報を資源予約情報記憶部208に登録する。一方、復旧する計算機資源または提供サービスが予約できない場合、復旧時間予測手段205は、復旧する時刻が次に早い計算機資源または提供サービスに対して、上記処理を繰り返す。復旧時間予測手段205は、計算機資源または提供サービスが予約可能か否かを、対象とする計算機資源に対する予約情報が登録されているか否かに基づいて判断してもよい。
復旧時間予測手段205は、復旧スケジュールおよび予約情報に基づいて、利用者が利用するクラウドサービスの復旧時間を予測する。具体的には、復旧時間予測手段205は、予測した各計算機資源および各提供サービスの復旧時間と、利用者が利用する各計算機資源および各提供サービスの予約時間のうち、最も遅い時間を利用者が利用するクラウドサービスの復旧時間と予測してもよい。言い換えると、復旧時間予測手段205は、予約情報が登録された計算機資源または提供サービスについては、その予約情報に含まれる予約開始時刻に復旧するものと判断して、サービス復旧時間を予測する。
次に、本実施形態の復旧時間予測システム2の動作を説明する。図5は、利用者ごとにサービス復旧時間を予測して提示する手順の他の例を示すフローチャートである。
復旧時間予測手段205は、まず、クラウドサービスの全利用者のリストを資源利用プロフィール記憶部206から取得する(ステップS3000)。そして、復旧時間予測手段205は、優先度の高い利用者から順番に資源の予約と復旧時間の予測を行うため、利用者のリストを優先度に基づいてソートする(ステップS3001)。利用者の優先度は、利用者のサービス契約形態や利用頻度、期間などに応じて決定されるものとする。復旧時間予測手段205は、ソートした利用者のリストから最も優先度の高い利用者Uiを選び(ステップS3002)、その利用者の資源利用プロフィールを取得する(ステップS3003)。
次に、復旧時間予測手段205は、資源利用プロフィールから資源タイプRjを選択する(ステップS3004)。そして、復旧時間予測手段205は、資源復旧スケジュール記憶部204を参照し、選択した資源タイプRjの資源復旧スケジュールを参照する(ステップS3005)。そして、復旧時間予測手段205は、資源タイプRjが共有資源か否かを判断する(ステップS3006)。
資源タイプRjが共有資源を示さない場合(ステップS3006におけるNO)、復旧時間予測手段205は、資源タイプRjに対応する資源復旧スケジュールを参照し、利用者の要求する資源が復旧して利用可能になる復旧予定時刻Tjを予測する。なお、復旧時間予測手段205は、予測結果をメモリ(図示せず)等に記録してもよい(ステップS3007)。
資源タイプRjが共有資源を示さない場合とは、例えば、資源タイプRjが利用者Ui専用の資源を示す場合や、排他制御の必要がない共有資源を示す場合などである。具体的には、利用者のデータを記録したストレージボリュームがこの資源タイプRjに該当する。また、複数の利用者で共有して利用される監視機能や、負荷分散機能などのサービスなども、この資源タイプRjに該当する。
一方、資源タイプRjが共有資源を示す場合(ステップS3006におけるYES)、復旧時間予測手段205は、まず、資源予約情報記憶部208を参照し、その資源タイプRjの予約情報を取得する(ステップS3008)。資源タイプRjが共有資源を示す場合とは、複数の利用者で共有され、排他的に利用されるタイプの資源を示す場合などである。
次に、復旧時間予測手段205は、資源タイプRjの資源復旧スケジュールを参照し、資源の復旧後、利用者が要求する資源の予約ができる最短の時刻を復旧予定時刻Tjと予測する。これは、利用者が要求する資源の予約ができる時点で、復旧した資源を利用できるようになることが予測されるためである。このとき、復旧時間予測手段205は、別の利用者によって利用することが予約されている資源は予約できないと判断する。なお、復旧時間予測手段205は、予測結果をメモリ(図示せず)等に記録してもよい(ステップS3009)。
復旧時間予測手段205は、利用者Uiが要求する資源のタイプと量に応じて予約情報を作成し、資源予約情報記憶部208に予約情報を記憶する(ステップS3010)。復旧時間予測手段205は、例えば、要求する計算機資源に利用者Uiを対応づけて記憶することで、その利用者Uiが対応する計算機資源を予約したものとしてもよい。
復旧時間予測手段205は、資源利用プロフィールに記載された全ての資源タイプRjに対して復旧予定時刻Tjを予測したか否かを判断する(ステップS3011)。全ての資源タイプRjの復旧予定時刻Tjを予測していない場合(ステップS3011におけるNO)、復旧時間予測手段205は、ステップS3004からステップS3011の処理を繰り返す。
一方、全ての資源タイプRjの復旧予定時刻Tjを予測した場合(ステップS3011におけるYES)、復旧時間予測手段205は、復旧予定時刻Tjの最大値を求める。復旧時間予測手段205は、この復旧予定時刻Tjの最大値を利用者Uiの復旧予定時刻とする(ステップS3012)。なお、復旧時間予測手段205は、復旧予定時刻をメモリ(図示せず)等に記録してもよい。
復旧時間予測手段205は、利用者リストに含まれる全ての利用者について復旧予定時刻を予測したか否か判断する(ステップS3013)。全ての利用者について復旧予定時刻を予測していない場合(ステップS3013におけるNO)、復旧時間予測手段205は、ステップS3002からステップS3013までの処理を繰り返す。
一方、全ての利用者について復旧予定時刻を予測した場合(ステップS3013におけるYES)、復旧時間提示手段207は、予測した復旧予定時刻を利用者に提示する(ステップS2009)。すなわち、復旧時間予測手段205がソートした利用者リストに基づいて順番に利用者の利用する計算機資源の復旧時間を予測し、全ての利用者について復旧時間の予測を終えたら、復旧時間提示手段207が予測結果を利用者ごとに提示する。
以上のように、本実施形態によれば、復旧時間予測手段205が、資源予約情報記憶部208に予約情報を記憶する。具体的には、復旧時間予測手段205は、資源予約情報記憶部208に記憶されている予約情報に基づいて、各利用者が利用する計算機資源が予約可能か否か判断する。また、復旧時間予測手段205は、復旧スケジュールに基づいて、予約可能な計算機資源の復旧時刻を予約開始時刻とする予約情報を資源予約情報記憶部208に記憶する。そして、復旧時間予測手段205は、復旧スケジュールおよび予約情報に基づいて、利用者が利用するクラウドサービスの復旧時間を予測する。
すなわち、本実施形態では、復旧時間予測手段205が、複数の利用者で共有され、排他的に利用される計算機資源について、資源予約情報記憶部208に復旧する資源の予約情報を記録する。そのため、各利用者の要求する資源の種類と量が確実に利用可能となる時刻をサービス復旧時刻として予測し、その予測結果を利用者に提示できる。
具体的には、本実施形態では、復旧時間予測手段205が、別の利用者によって予約された計算機資源は復旧していても利用できないことを考慮して復旧予定時刻の予測を行う。そのため、復旧予定時刻後に他の利用者が先に利用してしまったために、利用者がサービスの利用を再開できなくなるという問題を回避できる。
実施形態3.
次に、本発明の第3の実施形態のクラウドサービス復旧時間予測システムを説明する。なお、本実施形態におけるクラウドサービス復旧時間予測システムも、図1に例示するクラウドサービスと同様の構成に含まれるものとする。図6は、本発明の第3の実施形態のクラウドサービス復旧時間予測システムの例を示す説明図である。なお、第1の実施形態と同様の構成については、図1と同一の符号を付し、説明を省略する。本実施形態における復旧時間予測システム2は、第1の実施形態の復旧時間予測システム2の構成に加え、復旧スケジュール最適化手段209と、復旧スケジュール制約情報記憶部210とを含む。
復旧スケジュール制約情報記憶部210は、資源復旧スケジュールに対する要求や制約情報を記憶する。具体的には、復旧スケジュール制約情報記憶部210は、計算機資源間の依存関係または利用者による資源復旧要求に基づく資源復旧スケジュールの制約条件を規定した復旧スケジュール制約情報を記憶する。復旧スケジュール制約情報の例として、各利用者の復旧時間のデッドラインや優先度などが挙げられる。復旧スケジュール制約情報は、管理者等により、予め復旧スケジュール制約情報記憶部210に記憶される。
復旧スケジュール最適化手段209は、復旧スケジュール制約情報に基づいて、各計算機資源またはサービスの復旧スケジュールを最適化する復旧スケジュールを生成する。復旧スケジュール最適化手段209は、資源復旧スケジュールの生成に際し、復旧スケジュール制約情報と共に、資源利用プロフィール記憶部206および資源復旧スケジュール記憶部204に記憶された情報を参照する。
具体的には、復旧スケジュール最適化手段209は、復旧スケジュール制約情報が示す制約のもとで、目的とする指標(以下、目的指標と記すこともある。)を最大化または最小化する復旧スケジュールの候補(組み合わせ)を探索する。
目的指標を最大化するか最小化するかは、目的指標の性質によって異なる。例えば、目的指標が「所定の期間内におけるサービス復旧利用者数」であれば、その値を最大化させることが最適化することであるといえる。また、例えば、目的指標が「復旧時間」であれば、その値を最小化させることが最適化することであるといえる。
そして、復旧スケジュール最適化手段209は、探索した復旧スケジュールで資源復旧スケジュール記憶部204に記憶された対応する復旧スケジュールを更新する。すると、復旧時間予測手段205は、更新された復旧スケジュールに基づいて、利用者が利用するサービスの復旧時間を予測する。
目的とする指標の例として、全利用者の平均復旧時間、特定の利用者グループの復旧時間の最悪値、復旧にかかるサービス提供者のコストなどが挙げられる。この指標は、サービス提供者からの入力や、事前に設定された情報に基づいて、管理者等により予め決定される。
復旧スケジュール最適化手段209が復旧スケジュールを最適化する処理の一例を示す。まず、復旧スケジュール最適化手段209は、資源利用プロフィールをもとに、利用者が利用する計算機資源を特定する。そして、復旧スケジュール最適化手段209は、復旧スケジュールをもとに、特定した計算機資源を復旧させるスケジュール(復旧させる順序)を特定する。復旧スケジュール最適化手段209は、例えば、復旧スケジュール内で計算機資源を復旧させる順序を入れ替えた組み合わせを、復旧スケジュールの候補とする。復旧スケジュール最適化手段209は、復旧スケジュールの候補が復旧スケジュール制約情報の示す制約を満たしているか否か判断する。復旧スケジュールの候補が複数存在する場合、復旧スケジュール最適化手段209は、その候補の中から最適な候補を選択し、選択した候補で復旧スケジュールを更新する。
復旧スケジュール最適化手段209は、障害状況が調査された後や、各資源復旧スケジュールが生成された後、または、障害復旧処理の途中で、サービス提供者の必要に応じて、復旧スケジュールの最適化処理を実行する。
障害状況調査手段201と、復旧スケジュール生成手段203と、復旧時間予測手段205と、復旧時間提示手段207と、復旧スケジュール最適化手段209とは、プログラム(クラウドサービス復旧時間予測用プログラム)に従って動作するコンピュータのCPUによって実現される。また、障害状況調査手段201と、復旧スケジュール生成手段203と、復旧時間予測手段205と、復旧時間提示手段207と、復旧スケジュール最適化手段209とは、それぞれが専用のハードウェアで実現されていてもよい。
次に、本実施形態における復旧スケジュール最適化手段209が復旧スケジュールを生成する動作を説明する。図7は、復旧スケジュールを作成する処理の例を示すフローチャートである。
復旧スケジュール最適化手段209は、サービス提供者からの入力、または、事前に設定された情報に基づいて最適化の目的指標を決定する(ステップS4000)。ここでは、全サービス利用者の平均復旧時間を目的指標とする。そして、最適化の方法として、この平均復旧時間を最小化する復旧スケジュールを決定する方法を例に説明する。
復旧スケジュール生成手段203は、障害状況を参照して、各計算機資源および提供サービスの復旧スケジュールを生成する(ステップS4001)。なお、この復旧スケジュールは、管理者等によって作成されたものであってもよい。その後、復旧スケジュール生成手段203は、生成した復旧スケジュールを資源復旧スケジュール記憶部204に記憶する。
次に、復旧スケジュール最適化手段209は、資源利用プロフィール記憶部206および復旧スケジュール制約情報記憶部210から復旧スケジュールの生成に必要な情報を取得する。具体的には、復旧スケジュール最適化手段209は、資源利用プロフィール記憶部206から資源利用プロフィールを取得し(ステップS4002)、復旧スケジュール制約情報記憶部210から復旧スケジュール制約情報を取得する(ステップS4003)。
復旧スケジュール最適化手段209は、与えられた復旧スケジュール制約情報の範囲で実現可能な復旧スケジュールを探索し、目的指標を最適化する復旧スケジュールの組み合わせを探索する(ステップS4004)。復旧スケジュール最適化手段209は、最適化問題の解法として一般的に利用される方法を用いて復旧スケジュールの組み合わせを探索する。ここでは、最も単純な探索方法の例として、逐次探索を用いる場合を例に説明する。
図8は、逐次探索処理の例を示すフローチャートである。計算機資源の復旧スケジュールは一通りとは限られない。計算機資源を復旧する順番を入れ替えた組み合わせなど、様々な復旧スケジュールが考えられる。そこで、復旧スケジュール最適化手段209は、初めに、障害状況に基づいて実現可能な復旧スケジュールの組み合わせ候補を列挙する(図8におけるステップS5000)。ここで列挙した復旧スケジュールの組み合わせ候補が、最適化を行う際の探索の範囲(探索空間)になる。
復旧スケジュール最適化手段209は、復旧スケジュールの候補Sjを選択する(ステップS5001)。そして、復旧時間予測手段205が全利用者のサービス復旧時間を予測する(ステップS5002)。なお、サービス復旧時間を予測する方法は、第1の実施形態で説明した方法と同様である。
復旧スケジュール最適化手段209は、予測結果に基づいて、目的指標の値Viを計算する(ステップS5003)。ここでは、平均復旧時間を目的指標としている。そこで、復旧スケジュール最適化手段209は、利用者ごとに予測された復旧時間の平均値を算出して、目的指標の値Viを計算する。
次に、復旧スケジュール最適化手段209は、候補Sjが復旧スケジュール制約情報記憶部210に記憶された全ての復旧スケジュール制約情報を満たすか否かを判断する(ステップS5004)。
例えば、「優先度の高いユーザ集団の復旧時間がT以内(例えば、Vi≦T)」という制約の場合、復旧スケジュール最適化手段209は、予測された復旧時間がこの制約を満たすか否かを判断する。
候補Sjが復旧スケジュール制約情報記憶部210に記憶された全ての復旧スケジュール制約情報を満たす場合、復旧スケジュール最適化手段209は、候補Sjを復旧スケジュールの候補(以下、最適復旧スケジュール候補と記載することもある。)とする。なお、復旧スケジュール最適化手段209は、最適復旧スケジュール候補をメモリ(図示せず)等に記録してもよい(ステップS5005)。
復旧スケジュール最適化手段209は、復旧スケジュールの候補の探索を終了するか否かを判断する(ステップS5006)。復旧スケジュール最適化手段209は、例えば、探索終了条件を満たしているか否かを判断して、復旧スケジュールの候補の探索を終了するか否かを判断してもよい。復旧スケジュールの候補の探索を終了しないと判断した場合(ステップS5006におけるNO)、ステップS5001からステップS5006までの処理が繰り返される。一方、復旧スケジュールの候補の探索を終了すると判断した場合(ステップS5006におけるYES)、最適化処理が終了する。
すなわち、ステップS5001からステップS5005までの処理が、異なるSjに対して繰り返し行われる。そして、探索終了条件に達した時点で、復旧スケジュールの候補の探索が終了する。探索終了の条件として、例えば、全ての候補を探索する場合や、一定数の探索を終了した段階で打ち切りとする場合などが挙げられる。
復旧スケジュール最適化手段209は、探索の結果得られた復旧スケジュールの候補の中から、最良の復旧スケジュールを決定し、資源復旧スケジュール記憶部204に記憶された復旧スケジュールを更新する(図7におけるステップS4005)。ここでは、平均復旧時間を最適化の目的指標としている。そこで、復旧スケジュール最適化手段209は、探索の結果、候補として挙げられた復旧スケジュールの中から、平均復旧時間が最小になる復旧スケジュールを最良の復旧スケジュールとして決定する。
以上のように、本実施形態では、復旧スケジュール最適化手段209が、復旧スケジュール制約情報が示す制約のもとで、目的とする指標を最大化または最小化する復旧スケジュールの候補を探索する。また、復旧スケジュール最適化手段209は、その復旧スケジュールで資源復旧スケジュール記憶部204に記憶された対応する復旧スケジュールを更新する。そして、復旧時間予測手段205は、更新された復旧スケジュールに基づいて、利用者が利用するクラウドサービスの復旧時間を予測する。
すなわち、本実施形態では、復旧スケジュール制約情報記憶部210に記憶された復旧スケジュール制約情報に基づき、復旧スケジュール最適化手段209が、必要に応じて最良の資源復旧スケジュールを更新する。そのため、サービス復旧に対する利用者の要求や制約を満たす復旧時間を予測できる。
以下、具体的な実施例により本発明を説明するが、本発明の範囲は以下に説明する内容に限定されない。
図9は、本実施例のクラウドサービス提供部1が提供する計算機資源およびサービスの一例を示す説明図である。本実施例のクラウドサービス提供部1は、n台の仮想マシン(仮想マシン1〜仮想マシンn)、2*m個のストレージボリューム(ボリューム11〜ボリューム2m)、および監視サービス、VPNサービス、負荷分散サービスを利用者に提供している。ただしnとmは、正数とする。また、クラウドサービス提供部1が提供するサービスのことを付加サービスと記すこともある。
このクラウドサービス提供部1でサイト規模の障害が発生し、複数の計算機資源で障害が発生した状況を考える。サイト障害により、k台の仮想マシン(仮想マシン1〜仮想マシンk)、m個のストレージボリューム(ボリューム21〜ボリューム2m)、および、全ての付加サービスが停止したと仮定する。
図10は、クラウドサービス利用者の資源プロフィールの一部を示す説明図である。障害発生時点で、図10に例示するクラウドサービス利用者の資源プロフィールが資源利用プロフィール記憶部206に記憶されているものとする。資源プロフィールには、各利用者が必要とする仮想マシンのタイプと数、ストレージ領域、および付加サービスが含まれている。図10に示す例では、利用者Aは、標準タイプの仮想マシン1台と、ストレージボリュームのボリューム11を利用し、さらに、監視サービスを利用している。
クラウドサービスによってはスペックや機能が異なる仮想マシンを用意していることもある。そのため、必要とする仮想マシンのタイプが資源利用プロフィールに含まれていてもよい。ただし、第1の実施例では、説明を単純にするため、全ての仮想マシンが標準タイプの仮想マシンであることを前提とする。また、障害によって利用者A〜利用者Fの利用していた仮想マシンが影響を受けたことを前提とする。
はじめに、障害状況調査手段201が、障害による計算機資源の損害状況を調査し、調査した障害状況を、障害状況記憶部202に記録する。図11は、障害状況データの一例を示す説明図である。障害状況データには、クラウドサービス提供部1で利用される計算機資源の故障個所を示す情報が含まれる。また、障害状況データは、必要に応じて、故障原因や復旧手順に関する情報を含む。これらの障害状況データは、資源復旧スケジュールの作成に利用される。
図12は、資源復旧スケジュールの例を示す説明図である。ここで、資源復旧スケジュールは、復旧作業を計画する担当者によって、計算機資源の損害状況や復旧作業にかかる工数等を考慮して設計されたものとする。復旧スケジュール生成手段203は、作成された資源復旧スケジュールを資源復旧スケジュール記憶部204に記憶する。ここでは、個々の計算機資源および付加サービスが復旧する予定の時刻が資源復旧スケジュール記憶部204に記憶される。
例えば、図12に例示する仮想マシンの復旧スケジュールには、12:00に復旧作業が開始され、12:30には標準タイプの仮想マシンが4台利用可能になり、13:00にはさらに追加で4台の仮想マシンが利用可能になる予定が示されている。
全ての計算機資源および付加サービスの資源復旧スケジュールが決定されると、復旧時間予測手段205は、復旧スケジュールおよび資源利用プロフィールを参照して、利用者ごとにサービス復旧時間を予測する。ここでは、図3に例示するフローチャートの手順に従って、サービス復旧時間が予測されるとする。
はじめに、復旧時間予測手段205は、利用者Aを選択し、利用者Aの資源利用プロフィールを参照する。図10に例示する資源利用プロフィールから、利用者Aが仮想マシン、ストレージおよび監視サービスを利用していることが判別できる。
復旧時間予測手段205は、まず、仮想マシンの復旧スケジュールを参照する。図12に例示する復旧スケジュールでは、標準タイプの仮想マシンは、12:30の時点で4台利用可能になることが示されている。そのため、復旧時間予測手段205は、利用者Aの利用する仮想マシンの復旧予定時刻を12:30と予測する。
復旧時間予測手段205は、次に、ストレージの復旧スケジュールを参照する。図12に例示する復旧スケジュールから、利用者Aの利用するボリューム21は、12:20に復旧予定であることがわかる。そのため、復旧時間予測手段205は、利用者Aの利用するストレージの復旧予定時刻を12:20と予測する。
同様に、復旧時間予測手段205は、監視サービスの復旧スケジュールを参照する。図12に例示する復旧スケジュールから、監視サービスは、12:30に復旧予定であることがわかる。そのため、復旧時間予測手段205は、利用者Aの利用する監視サービスの復旧予定時刻を12:30と予測する。
復旧時間予測手段205は、以上の結果から、各計算機資源またはサービスの復旧時間の中から最大値を求める。ここでは、復旧時間予測手段205は、利用者Aについて、サービス復旧予定時刻が12:30であると判定できる。
復旧時間予測手段205は、他の利用者についても同様に、各利用者の資源利用プロフィールに基づいて、サービスの復旧予定時刻を求める。図13は、利用者ごとにサービスの復旧予定時刻を求めた結果の例を示す説明図である。
最後に、復旧時間提示手段207は、予測されたサービス復旧時間を利用者に提示する。このような処理を行うことで、本発明の目的を達成できる。
第1の実施例では、利用者A〜Fが標準タイプの仮想マシンを利用することを前提としていた。第2の実施例では、この標準タイプの仮想マシンが複数の利用者で共有され、排他的に利用されるタイプの資源であるものとする。すなわち、第2の実施例では、より正確な復旧時間の予測を行うため、仮想マシンの予約を考慮した復旧時間の予測を行う。仮想マシンの予約を考慮することで、より正確な復旧時間の予測が可能になる。なお、第2の実施例は、第2の実施形態に対応する。
図14は、仮想マシンの予約情報の一例を示す説明図である。ここでは、図5に例示するフローチャートの手順に従い、サービス復旧時間が予測されるとする。また、本実施例では、利用者Aから利用者Fへの順番で計算機資源を利用する予約が行われるとする。
図12に例示する復旧スケジュールによれば、12:30の時点で4台の仮想マシンが復旧する。この仮想マシンは、利用者A、利用者Bおよび利用者Cのみ利用可能である。また、図12に例示する復旧スケジュールによれば、13:00の時点でさらに4台の仮想マシンが復旧する。この仮想マシンは、利用者C、利用者Dおよび利用者Eによって予約される。
予約情報に基づいて復旧時間を予測すると、仮想マシンの復旧予測時間が変化する。そのため、本実施例における方法で予測したサービス復旧時間と、第1の実施例における方法で予測したサービス復旧時間とは異なる。図15は、利用者ごとにサービスの復旧予定時刻を求めた結果の他の例を示す説明図である。
図15に例示するサービス復旧予定時刻と図13に例示するサービス復旧予定時刻とを比較すると、利用者Eと利用者Fのサービス復旧予定時刻が変化していることが分かる。このように、予約情報も参照して復旧時間の予測を行うことにより、より詳細で確実な復旧時間を各利用者に提示できる。
次に、本発明の最小構成例を説明する。図16は、本発明によるクラウドサービス復旧時間予測システムの最小構成の例を示すブロック図である。本発明によるクラウドサービス復旧時間予測システムは、クラウドサービス(例えば、クラウドサービス提供部1)で提供される複数種類の計算機資源(例えば、仮想マシン101、ストレージ102)またはそのクラウドサービスで提供されるサービスである提供サービス(例えば、サービス提供部103)で障害が発生した場合のその計算機資源または提供サービスを復旧させるスケジュールを規定した復旧スケジュールを、その計算機資源の種類または提供サービスごとに記憶する復旧スケジュール記憶手段81(例えば、資源復旧スケジュール記憶部204)と、各利用者がクラウドサービスを利用する際に使用する計算機資源を定めた資源利用プロフィールをその利用者ごとに記憶する資源利用プロフィール記憶手段82(例えば、資源利用プロフィール記憶部206)と、利用者がクラウドサービスを利用する際に使用する計算機資源または提供サービスを資源利用プロフィールから特定し、復旧スケジュールに基づいて、特定された全ての計算機資源または提供サービスが復旧する時間を予測することにより、その利用者が利用するクラウドサービスの復旧時間を予測する復旧時間予測手段83(例えば、復旧時間予測手段205)と、予測されたサービス復旧時間を利用者に提示する復旧時間提示手段84(例えば、復旧時間提示手段207)とを備えている。
そのような構成により、複数種類の計算機資源を用いて提供されるクラウドサービスの障害によって利用者の要求するサービスが利用できなくなった場合に、クラウドサービスが復旧する時間を利用者ごとに予測できる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)クラウドサービスで提供される複数種類の計算機資源または当該クラウドサービスで提供されるサービスである提供サービスで障害が発生した場合の当該計算機資源または当該提供サービスを復旧させるスケジュールを規定した復旧スケジュールを、当該計算機資源の種類または提供サービスごとに記憶する復旧スケジュール記憶手段と、各利用者が前記クラウドサービスを利用する際に使用する計算機資源を定めた資源利用プロフィールを当該利用者ごとに記憶する資源利用プロフィール記憶手段と、利用者が前記クラウドサービスを利用する際に使用する計算機資源または提供サービスを前記資源利用プロフィールから特定し、前記復旧スケジュールに基づいて、特定された全ての計算機資源または提供サービスが復旧する時間を予測することにより、当該利用者が利用するクラウドサービスの復旧時間を予測する復旧時間予測手段と、予測されたサービス復旧時間を前記利用者に提示する復旧時間提示手段とを備えたことを特徴とするクラウドサービス復旧時間予測システム。
(付記2)各計算機資源または提供サービスの障害状況を記憶する障害状況記憶手段と、前記障害状況を調査して前記障害状況記憶手段に記憶させる障害状況調査手段と、前記障害状況記憶手段に記憶された障害状況に基づいて復旧スケジュールを生成し、当該復旧スケジュールを復旧スケジュール記憶手段に記憶させる復旧スケジュール生成手段とを備えた付記1記載のクラウドサービス復旧時間予測システム。
(付記3)複数の利用者で共有され当該利用者間で排他的に利用される計算機資源の予約開始時間を、当該計算機資源の利用者と対応づけた情報である予約情報を資源予約情報記憶手段に記憶する資源予約情報登録手段を備え、前記資源予約情報登録手段は、前記資源予約情報記憶手段に記憶されている予約情報に基づいて、各利用者が利用する前記計算機資源が予約可能か否か判断し、前記復旧スケジュールに基づいて、予約可能な前記計算機資源の復旧時刻を予約開始時刻とする前記予約情報を資源予約情報記憶手段に記憶し、復旧時間予測手段は、復旧スケジュールおよび前記予約情報に基づいて、利用者が利用するクラウドサービスの復旧時間を予測する付記1または付記2記載のクラウドサービス復旧時間予測システム。
(付記4)計算機資源間の依存関係または利用者による資源復旧要求に基づく復旧スケジュールの制約条件を規定した復旧スケジュール制約情報を記憶する復旧スケジュール制約情報記憶手段と、前記復旧スケジュール制約情報が示す制約のもとで、目的とする指標を最大化または最小化する復旧スケジュールの候補を探索し、当該復旧スケジュールで資源復旧スケジュール記憶手段に記憶された対応する復旧スケジュールを更新する復旧スケジュール最適化手段を備え、復旧時間予測手段は、更新された復旧スケジュールに基づいて、利用者が利用するクラウドサービスの復旧時間を予測する付記1から付記3のうちのいずれか1つに記載のクラウドサービス復旧時間予測システム。
(付記5)クラウドサービスで提供される複数種類の計算機資源または当該クラウドサービスで提供されるサービスである提供サービスで障害が発生した場合の復旧時間を予測するクラウドサービス復旧時間予測方法であって、各利用者が前記クラウドサービスを利用する際に使用する計算機資源を定めた資源利用プロフィールを当該利用者ごとに記憶する資源利用プロフィール記憶手段を参照し、当該資源利用プロフィール記憶手段に記憶された当該資源利用プロフィールから、利用者が前記クラウドサービスを利用する際に使用する計算機資源または提供サービスを特定し、前記計算機資源または前記提供サービスで障害が発生した場合の当該計算機資源または当該提供サービスを復旧させるスケジュールを規定した復旧スケジュールを、当該計算機資源の種類または提供サービスごとに記憶する復旧スケジュール記憶手段から抽出し、抽出した前記復旧スケジュールに基づいて、特定された全ての計算機資源または提供サービスが復旧する時間を予測することにより、当該利用者が利用するクラウドサービスの復旧時間を予測し、予測されたサービス復旧時間を前記利用者に提示することを特徴とするクラウドサービス復旧時間予測方法。
(付記6)各計算機資源または提供サービスの障害状況を調査して障害状況記憶手段に記憶させ、前記障害状況記憶手段に記憶された障害状況に基づいて復旧スケジュールを生成し、前記復旧スケジュールを復旧スケジュール記憶手段に記憶させる付記5記載のクラウドサービス復旧時間予測方法。
(付記7)複数の利用者で共有され当該利用者間で排他的に利用される計算機資源の予約開始時間を、当該計算機資源の利用者と対応づけた情報である予約情報を資源予約情報記憶手段に記憶する際、当該資源予約情報記憶手段に記憶されている前記予約情報に基づいて、各利用者が利用する前記計算機資源が予約可能か否か判断し、復旧スケジュールに基づいて、予約可能な前記計算機資源の復旧時刻を予約開始時刻とする予約情報を前記資源予約情報記憶手段に記憶し、復旧スケジュールおよび前記資源予約情報記憶手段に記憶された予約情報に基づいて、利用者が利用するクラウドサービスの復旧時間を予測する付記5または付記6記載のクラウドサービス復旧時間予測方法。
(付記8)計算機資源間の依存関係または利用者による資源復旧要求に基づく復旧スケジュールの制約条件を規定した復旧スケジュール制約情報が示す制約のもとで、目的とする指標を最大化または最小化する復旧スケジュールの候補を探索し、前記復旧スケジュールで資源復旧スケジュール記憶手段に記憶された対応する復旧スケジュールを更新し、更新された復旧スケジュールに基づいて、利用者が利用するクラウドサービスの復旧時間を予測する付記5から付記7のうちのいずれか1つに記載のクラウドサービス復旧時間予測方法。
(付記9)クラウドサービスで提供される複数種類の計算機資源または当該クラウドサービスで提供されるサービスである提供サービスで障害が発生した場合の復旧時間を予測するコンピュータに適用されるクラウドサービス復旧時間予測用プログラムであって、前記コンピュータに、各利用者が前記クラウドサービスを利用する際に使用する計算機資源を定めた資源利用プロフィールを当該利用者ごとに記憶する資源利用プロフィール記憶手段を参照し、当該資源利用プロフィール記憶手段に記憶された当該資源利用プロフィールから、利用者が前記クラウドサービスを利用する際に使用する計算機資源または提供サービスを特定し、前記計算機資源または前記提供サービスで障害が発生した場合の当該計算機資源または当該提供サービスを復旧させるスケジュールを規定した復旧スケジュールを、当該計算機資源の種類または提供サービスごとに記憶する復旧スケジュール記憶手段から抽出し、抽出した前記復旧スケジュールに基づいて、特定された全ての計算機資源または提供サービスが復旧する時間を予測することにより、当該利用者が利用するクラウドサービスの復旧時間を予測する復旧時間予測処理、および、予測されたサービス復旧時間を前記利用者に提示する復旧時間提示処理を実行させるためのクラウドサービス復旧時間予測用プログラム。
(付記10)コンピュータに、各計算機資源または提供サービスの障害状況を調査して障害状況記憶手段に記憶させる障害状況調査処理、および、前記障害状況記憶手段に記憶された障害状況に基づいて復旧スケジュールを生成し、当該復旧スケジュールを復旧スケジュール記憶手段に記憶させる復旧スケジュール生成処理を実行させる付記10記載のクラウドサービス復旧時間予測用プログラム。
(付記11)コンピュータに、複数の利用者で共有され当該利用者間で排他的に利用される計算機資源の予約開始時間を、当該計算機資源の利用者と対応づけた情報である予約情報を資源予約情報記憶手段に記憶する際、当該資源予約情報記憶手段に記憶されている前記予約情報に基づいて、各利用者が利用する前記計算機資源が予約可能か否か判断し、復旧スケジュールに基づいて、予約可能な前記計算機資源の復旧時刻を予約開始時刻とする予約情報を前記資源予約情報記憶手段に記憶する資源予約情報登録処理を実行させ、復旧時間予測処理で、復旧スケジュールおよび前記資源予約情報記憶手段に記憶された予約情報に基づいて、利用者が利用するクラウドサービスの復旧時間を予測させる付記9または付記10記載のクラウドサービス復旧時間予測用プログラム。
(付記12)コンピュータに、計算機資源間の依存関係または利用者による資源復旧要求に基づく復旧スケジュールの制約条件を規定した復旧スケジュール制約情報が示す制約のもとで、目的とする指標を最大化または最小化する復旧スケジュールの候補を探索し、当該復旧スケジュールで資源復旧スケジュール記憶手段に記憶された対応する復旧スケジュールを更新する復旧スケジュール最適化処理を実行させ、復旧時間予測処理で、更新された復旧スケジュールに基づいて、利用者が利用するクラウドサービスの復旧時間を予測させる付記9から付記11のうちのいずれか1つに記載のクラウドサービス復旧時間予測用プログラム。
以上、実施形態及び実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2011年9月8日に出願された日本特許出願2011−196064を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明は、複数の計算機資源の故障を伴うシステム障害時に、サービス利用者ごとにサービス復旧時間を予測するクラウドサービス復旧時間予測システムに好適に適用される。
1 クラウドサービス提供部
101 仮想マシン
102 ストレージ
103 サービス提供部
2 復旧時間予測システム
201 障害状況調査手段
202 障害状況記憶部
203 復旧スケジュール生成手段
204 資源復旧スケジュール記憶部
205 復旧時間予測手段
206 資源利用プロフィール記憶部
207 復旧時間提示手段
208 資源予約情報記憶部
209 復旧スケジュール最適化手段
210 復旧スケジュール制約情報記憶部
3 クラウドサービスクライアント

Claims (10)

  1. クラウドサービスで提供される複数種類の計算機資源または当該クラウドサービスで提供されるサービスである提供サービスで障害が発生した場合の当該計算機資源または当該提供サービスを復旧させるスケジュールを規定した復旧スケジュールを、当該計算機資源の種類または提供サービスごとに記憶する復旧スケジュール記憶手段と、
    各利用者が前記クラウドサービスを利用する際に使用する計算機資源を定めた資源利用プロフィールを当該利用者ごとに記憶する資源利用プロフィール記憶手段と、
    利用者が前記クラウドサービスを利用する際に使用する計算機資源または提供サービスを前記資源利用プロフィールから特定し、前記復旧スケジュールに基づいて、特定された全ての計算機資源または提供サービスが復旧する時間を予測することにより、当該利用者が利用するクラウドサービスの復旧時間を予測する復旧時間予測手段と、
    予測されたサービス復旧時間を前記利用者に提示する復旧時間提示手段とを備えた
    ことを特徴とするクラウドサービス復旧時間予測システム。
  2. 各計算機資源または提供サービスの障害状況を記憶する障害状況記憶手段と、
    前記障害状況を調査して前記障害状況記憶手段に記憶させる障害状況調査手段と、
    前記障害状況記憶手段に記憶された障害状況に基づいて復旧スケジュールを生成し、当該復旧スケジュールを復旧スケジュール記憶手段に記憶させる復旧スケジュール生成手段とを備えた
    請求項1記載のクラウドサービス復旧時間予測システム。
  3. 複数の利用者で共有され当該利用者間で排他的に利用される計算機資源の予約開始時間を、当該計算機資源の利用者と対応づけた情報である予約情報を資源予約情報記憶手段に記憶する資源予約情報登録手段を備え、
    前記資源予約情報登録手段は、前記資源予約情報記憶手段に記憶されている予約情報に基づいて、各利用者が利用する前記計算機資源が予約可能か否か判断し、前記復旧スケジュールに基づいて、予約可能な前記計算機資源の復旧時刻を予約開始時刻とする前記予約情報を資源予約情報記憶手段に記憶し、
    復旧時間予測手段は、復旧スケジュールおよび前記予約情報に基づいて、利用者が利用するクラウドサービスの復旧時間を予測する
    請求項1または請求項2記載のクラウドサービス復旧時間予測システム。
  4. 計算機資源間の依存関係または利用者による資源復旧要求に基づく復旧スケジュールの制約条件を規定した復旧スケジュール制約情報を記憶する復旧スケジュール制約情報記憶手段と、
    前記復旧スケジュール制約情報が示す制約のもとで、目的とする指標を最大化または最小化する復旧スケジュールの候補を探索し、当該復旧スケジュールで資源復旧スケジュール記憶手段に記憶された対応する復旧スケジュールを更新する復旧スケジュール最適化手段を備え、
    復旧時間予測手段は、更新された復旧スケジュールに基づいて、利用者が利用するクラウドサービスの復旧時間を予測する
    請求項1から請求項3のうちのいずれか1項に記載のクラウドサービス復旧時間予測システム。
  5. クラウドサービスで提供される複数種類の計算機資源または当該クラウドサービスで提供されるサービスである提供サービスで障害が発生した場合の復旧時間を予測するクラウドサービス復旧時間予測方法であって、
    各利用者が前記クラウドサービスを利用する際に使用する計算機資源を定めた資源利用プロフィールを当該利用者ごとに記憶する資源利用プロフィール記憶手段を参照し、当該資源利用プロフィール記憶手段に記憶された当該資源利用プロフィールから、利用者が前記クラウドサービスを利用する際に使用する計算機資源または提供サービスを特定し、
    前記計算機資源または前記提供サービスで障害が発生した場合の当該計算機資源または当該提供サービスを復旧させるスケジュールを規定した復旧スケジュールを、当該計算機資源の種類または提供サービスごとに記憶する復旧スケジュール記憶手段から抽出し、
    抽出した前記復旧スケジュールに基づいて、特定された全ての計算機資源または提供サービスが復旧する時間を予測することにより、当該利用者が利用するクラウドサービスの復旧時間を予測し、
    予測されたサービス復旧時間を前記利用者に提示する
    ことを特徴とするクラウドサービス復旧時間予測方法。
  6. 各計算機資源または提供サービスの障害状況を調査して障害状況記憶手段に記憶させ、
    前記障害状況記憶手段に記憶された障害状況に基づいて復旧スケジュールを生成し、
    前記復旧スケジュールを復旧スケジュール記憶手段に記憶させる
    請求項5記載のクラウドサービス復旧時間予測方法。
  7. 複数の利用者で共有され当該利用者間で排他的に利用される計算機資源の予約開始時間を、当該計算機資源の利用者と対応づけた情報である予約情報を資源予約情報記憶手段に記憶する際、当該資源予約情報記憶手段に記憶されている前記予約情報に基づいて、各利用者が利用する前記計算機資源が予約可能か否か判断し、復旧スケジュールに基づいて、予約可能な前記計算機資源の復旧時刻を予約開始時刻とする予約情報を前記資源予約情報記憶手段に記憶し、
    復旧スケジュールおよび前記資源予約情報記憶手段に記憶された予約情報に基づいて、利用者が利用するクラウドサービスの復旧時間を予測する
    請求項5または請求項6記載のクラウドサービス復旧時間予測方法。
  8. 計算機資源間の依存関係または利用者による資源復旧要求に基づく復旧スケジュールの制約条件を規定した復旧スケジュール制約情報が示す制約のもとで、目的とする指標を最大化または最小化する復旧スケジュールの候補を探索し、
    前記復旧スケジュールで資源復旧スケジュール記憶手段に記憶された対応する復旧スケジュールを更新し、
    更新された復旧スケジュールに基づいて、利用者が利用するクラウドサービスの復旧時間を予測する
    請求項5から請求項7のうちのいずれか1項に記載のクラウドサービス復旧時間予測方法。
  9. クラウドサービスで提供される複数種類の計算機資源または当該クラウドサービスで提供されるサービスである提供サービスで障害が発生した場合の復旧時間を予測するコンピュータに適用されるクラウドサービス復旧時間予測用プログラムであって、
    前記コンピュータに、
    各利用者が前記クラウドサービスを利用する際に使用する計算機資源を定めた資源利用プロフィールを当該利用者ごとに記憶する資源利用プロフィール記憶手段を参照し、当該資源利用プロフィール記憶手段に記憶された当該資源利用プロフィールから、利用者が前記クラウドサービスを利用する際に使用する計算機資源または提供サービスを特定し、前記計算機資源または前記提供サービスで障害が発生した場合の当該計算機資源または当該提供サービスを復旧させるスケジュールを規定した復旧スケジュールを、当該計算機資源の種類または提供サービスごとに記憶する復旧スケジュール記憶手段から抽出し、抽出した前記復旧スケジュールに基づいて、特定された全ての計算機資源または提供サービスが復旧する時間を予測することにより、当該利用者が利用するクラウドサービスの復旧時間を予測する復旧時間予測処理、および、
    予測されたサービス復旧時間を前記利用者に提示する復旧時間提示処理
    を実行させるためのクラウドサービス復旧時間予測用プログラム。
  10. コンピュータに、
    各計算機資源または提供サービスの障害状況を調査して障害状況記憶手段に記憶させる障害状況調査処理、および、
    前記障害状況記憶手段に記憶された障害状況に基づいて復旧スケジュールを生成し、当該復旧スケジュールを復旧スケジュール記憶手段に記憶させる復旧スケジュール生成処理を実行させる
    請求項9記載のクラウドサービス復旧時間予測用プログラム。
JP2013529882A 2011-09-08 2012-08-02 クラウドサービス復旧時間予測システム、方法およびプログラム Active JP5370624B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013529882A JP5370624B2 (ja) 2011-09-08 2012-08-02 クラウドサービス復旧時間予測システム、方法およびプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2011196064 2011-09-08
JP2011196064 2011-09-08
PCT/JP2012/004906 WO2013035243A1 (ja) 2011-09-08 2012-08-02 クラウドサービス復旧時間予測システム、方法およびプログラム
JP2013529882A JP5370624B2 (ja) 2011-09-08 2012-08-02 クラウドサービス復旧時間予測システム、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP5370624B2 true JP5370624B2 (ja) 2013-12-18
JPWO2013035243A1 JPWO2013035243A1 (ja) 2015-03-23

Family

ID=47831721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013529882A Active JP5370624B2 (ja) 2011-09-08 2012-08-02 クラウドサービス復旧時間予測システム、方法およびプログラム

Country Status (3)

Country Link
US (1) US8904242B2 (ja)
JP (1) JP5370624B2 (ja)
WO (1) WO2013035243A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016104025A1 (ja) * 2014-12-25 2016-06-30 クラリオン株式会社 障害情報提供サーバ、障害情報提供方法

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8028090B2 (en) 2008-11-17 2011-09-27 Amazon Technologies, Inc. Request routing utilizing client location information
US7991910B2 (en) 2008-11-17 2011-08-02 Amazon Technologies, Inc. Updating routing information based on client location
US7962597B2 (en) 2008-03-31 2011-06-14 Amazon Technologies, Inc. Request routing based on class
US8606996B2 (en) 2008-03-31 2013-12-10 Amazon Technologies, Inc. Cache optimization
US8321568B2 (en) 2008-03-31 2012-11-27 Amazon Technologies, Inc. Content management
US7970820B1 (en) 2008-03-31 2011-06-28 Amazon Technologies, Inc. Locality based content distribution
US8447831B1 (en) 2008-03-31 2013-05-21 Amazon Technologies, Inc. Incentive driven content delivery
US9407681B1 (en) 2010-09-28 2016-08-02 Amazon Technologies, Inc. Latency measurement in resource requests
US8782236B1 (en) 2009-06-16 2014-07-15 Amazon Technologies, Inc. Managing resources using resource expiration data
US8397073B1 (en) 2009-09-04 2013-03-12 Amazon Technologies, Inc. Managing secure content in a content delivery network
US9495338B1 (en) 2010-01-28 2016-11-15 Amazon Technologies, Inc. Content distribution network
US8468247B1 (en) 2010-09-28 2013-06-18 Amazon Technologies, Inc. Point of presence management in request routing
US9712484B1 (en) 2010-09-28 2017-07-18 Amazon Technologies, Inc. Managing request routing information utilizing client identifiers
US10958501B1 (en) 2010-09-28 2021-03-23 Amazon Technologies, Inc. Request routing information based on client IP groupings
US9003035B1 (en) 2010-09-28 2015-04-07 Amazon Technologies, Inc. Point of presence management in request routing
US8452874B2 (en) 2010-11-22 2013-05-28 Amazon Technologies, Inc. Request routing processing
US10467042B1 (en) 2011-04-27 2019-11-05 Amazon Technologies, Inc. Optimized deployment based upon customer locality
US10623408B1 (en) 2012-04-02 2020-04-14 Amazon Technologies, Inc. Context sensitive object management
US9154551B1 (en) 2012-06-11 2015-10-06 Amazon Technologies, Inc. Processing DNS queries to identify pre-processing information
US9323577B2 (en) * 2012-09-20 2016-04-26 Amazon Technologies, Inc. Automated profiling of resource usage
US10205698B1 (en) 2012-12-19 2019-02-12 Amazon Technologies, Inc. Source-dependent address resolution
US9251115B2 (en) 2013-03-07 2016-02-02 Citrix Systems, Inc. Dynamic configuration in cloud computing environments
US9183034B2 (en) * 2013-05-16 2015-11-10 Vmware, Inc. Managing availability of virtual machines in cloud computing services
US9223672B1 (en) * 2013-09-24 2015-12-29 Intuit Inc. Method and system for providing error repair status data to an application user
WO2015181937A1 (ja) * 2014-05-30 2015-12-03 株式会社日立製作所 仮想サーバのバックアップスケジュール作成方法
JP6265835B2 (ja) * 2014-06-03 2018-01-24 Pfuテクニカルコミュニケーションズ株式会社 情報処理装置、診断順序決定方法及び制御プログラム
JP6369235B2 (ja) * 2014-09-02 2018-08-08 富士通株式会社 ストレージ制御装置およびストレージ制御プログラム
JP2016057795A (ja) * 2014-09-09 2016-04-21 富士通株式会社 ストレージ制御装置,ストレージシステム及びストレージ制御プログラム
US10009248B2 (en) * 2014-12-12 2018-06-26 International Business Machines Corporation System with on-demand state for applications
US10097448B1 (en) 2014-12-18 2018-10-09 Amazon Technologies, Inc. Routing mode and point-of-presence selection service
US10225326B1 (en) 2015-03-23 2019-03-05 Amazon Technologies, Inc. Point of presence based data uploading
US9832141B1 (en) 2015-05-13 2017-11-28 Amazon Technologies, Inc. Routing based request correlation
JP6482984B2 (ja) * 2015-08-24 2019-03-13 株式会社日立製作所 クラウド管理方法及びクラウド管理システム
US10270878B1 (en) 2015-11-10 2019-04-23 Amazon Technologies, Inc. Routing for origin-facing points of presence
US10075551B1 (en) 2016-06-06 2018-09-11 Amazon Technologies, Inc. Request management for hierarchical cache
US10110694B1 (en) 2016-06-29 2018-10-23 Amazon Technologies, Inc. Adaptive transfer rate for retrieving content from a server
US10061652B2 (en) * 2016-07-26 2018-08-28 Microsoft Technology Licensing, Llc Fault recovery management in a cloud computing environment
US10505961B2 (en) 2016-10-05 2019-12-10 Amazon Technologies, Inc. Digitally signed network address
US10831549B1 (en) 2016-12-27 2020-11-10 Amazon Technologies, Inc. Multi-region request-driven code execution system
US10938884B1 (en) 2017-01-30 2021-03-02 Amazon Technologies, Inc. Origin server cloaking using virtual private cloud network environments
US10379898B2 (en) 2017-03-24 2019-08-13 International Business Machines Corporation Virtual machine consolidation
US11075987B1 (en) 2017-06-12 2021-07-27 Amazon Technologies, Inc. Load estimating content delivery network
US10447648B2 (en) 2017-06-19 2019-10-15 Amazon Technologies, Inc. Assignment of a POP to a DNS resolver based on volume of communications over a link between client devices and the POP
US10409664B2 (en) 2017-07-27 2019-09-10 International Business Machines Corporation Optimized incident management using hierarchical clusters of metrics
US10742593B1 (en) 2017-09-25 2020-08-11 Amazon Technologies, Inc. Hybrid content request routing system
US10558533B2 (en) * 2017-12-07 2020-02-11 Red Hat, Inc. Reducing service disruptions in a micro-service environment
US10592578B1 (en) 2018-03-07 2020-03-17 Amazon Technologies, Inc. Predictive content push-enabled content delivery network
US10931674B2 (en) * 2018-04-30 2021-02-23 Paypal, Inc. Detecting whether to implement one or more security measures on a shared resource
US10909003B2 (en) * 2018-08-30 2021-02-02 Sap Se Decommissioning disaster recovery for a cloud based application
US20200151010A1 (en) * 2018-11-10 2020-05-14 Nutanix, Inc. Scheduling of fixed number of non-sharable resources
US10862852B1 (en) 2018-11-16 2020-12-08 Amazon Technologies, Inc. Resolution of domain name requests in heterogeneous network environments
US11025747B1 (en) 2018-12-12 2021-06-01 Amazon Technologies, Inc. Content request pattern-based routing system
CN112887355B (zh) 2019-11-29 2022-09-27 北京百度网讯科技有限公司 异常服务器的业务处理方法及装置
US11797570B2 (en) * 2021-03-19 2023-10-24 International Business Machines Corporation Asynchronous persistency of replicated data changes in a database accelerator
US11500733B2 (en) 2021-03-19 2022-11-15 International Business Machines Corporation Volatile database caching in a database accelerator
WO2023198276A1 (en) * 2022-04-12 2023-10-19 Telefonaktiebolaget Lm Ericsson (Publ) Handling failure of an application instance
US20230325280A1 (en) * 2022-04-12 2023-10-12 Citrix Systems, Inc. System and method to predict session failure in virtual applications and desktops deployment

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002108728A (ja) * 2000-10-02 2002-04-12 Ntt Docomo Inc 障害情報の掲載方法およびプロバイダ設備
JP2003179614A (ja) * 2002-07-29 2003-06-27 Matsushita Electric Ind Co Ltd 通信制御装置及び通信制御方法
JP2004364154A (ja) * 2003-06-06 2004-12-24 Nippon Telegr & Teleph Corp <Ntt> 障害通知方式及び障害通知方法
JP2006313399A (ja) * 2005-05-06 2006-11-16 Fujitsu Ltd 保守業務支援プログラム
JP2007041646A (ja) * 2005-07-29 2007-02-15 Fujitsu Ltd クライアント−サーバ型システム、並びに、その管理方法および管理プログラム
JP2009211618A (ja) * 2008-03-06 2009-09-17 Nec Corp 障害自動復旧装置
JP2010146198A (ja) * 2008-12-17 2010-07-01 Hitachi Ltd ストレージシステム、データ復旧可能時刻の推定値の算出方法、および、管理計算機

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2409297A (en) * 2003-12-16 2005-06-22 Ibm Method of assessing the impact of the failure of a component on the temporal activity of the services supported by the component
US7962797B2 (en) * 2009-03-20 2011-06-14 Microsoft Corporation Automated health model generation and refinement
US8887006B2 (en) * 2011-04-04 2014-11-11 Microsoft Corporation Proactive failure handling in database services
US9152487B2 (en) * 2011-09-30 2015-10-06 Microsoft Technology Licensing, Llc Service outage details in an error message

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002108728A (ja) * 2000-10-02 2002-04-12 Ntt Docomo Inc 障害情報の掲載方法およびプロバイダ設備
JP2003179614A (ja) * 2002-07-29 2003-06-27 Matsushita Electric Ind Co Ltd 通信制御装置及び通信制御方法
JP2004364154A (ja) * 2003-06-06 2004-12-24 Nippon Telegr & Teleph Corp <Ntt> 障害通知方式及び障害通知方法
JP2006313399A (ja) * 2005-05-06 2006-11-16 Fujitsu Ltd 保守業務支援プログラム
JP2007041646A (ja) * 2005-07-29 2007-02-15 Fujitsu Ltd クライアント−サーバ型システム、並びに、その管理方法および管理プログラム
JP2009211618A (ja) * 2008-03-06 2009-09-17 Nec Corp 障害自動復旧装置
JP2010146198A (ja) * 2008-12-17 2010-07-01 Hitachi Ltd ストレージシステム、データ復旧可能時刻の推定値の算出方法、および、管理計算機

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016104025A1 (ja) * 2014-12-25 2016-06-30 クラリオン株式会社 障害情報提供サーバ、障害情報提供方法
JP2016122337A (ja) * 2014-12-25 2016-07-07 クラリオン株式会社 障害情報提供サーバ、障害情報提供方法
US10437695B2 (en) 2014-12-25 2019-10-08 Clarion Co., Ltd. Fault information providing server and fault information providing method for users of in-vehicle terminals

Also Published As

Publication number Publication date
US20130305083A1 (en) 2013-11-14
WO2013035243A1 (ja) 2013-03-14
US8904242B2 (en) 2014-12-02
JPWO2013035243A1 (ja) 2015-03-23

Similar Documents

Publication Publication Date Title
JP5370624B2 (ja) クラウドサービス復旧時間予測システム、方法およびプログラム
US9135076B2 (en) Automated capacity aware provisioning
US8966030B1 (en) Use of temporarily available computing nodes for dynamic scaling of a cluster
US8260840B1 (en) Dynamic scaling of a cluster of computing nodes used for distributed execution of a program
US9965262B2 (en) Application bundle pulling
US10389850B2 (en) Managing redundancy among application bundles
US10530660B2 (en) Application bundle preloading
US10152516B2 (en) Managing staleness latency among application bundles
US9317395B2 (en) Usage reporting from a cloud-hosted, distributed system
US9692654B2 (en) Systems and methods for correlating derived metrics for system activity
US8924336B2 (en) Feature and deployment recommendation systems and methods for content management systems to provide recommendations for enhanced feature usage based on usage patterns
US10389794B2 (en) Managing redundancy among application bundles
JPWO2011155621A1 (ja) 障害検出装置、障害検出方法およびプログラム記録媒体
US10169166B2 (en) Real-time fault-tolerant architecture for large-scale event processing
CN102799485A (zh) 历史数据的迁移方法及装置
CN104216763A (zh) 用于解决在受管基础架构中发生的事件的方法和系统
JP3693184B2 (ja) コンピュータネットワーク管理システム
CN111262720A (zh) 设备管理服务器及方法、和计算机可读存储介质
Xia et al. A Markov decision process approach for optimal data backup scheduling
Abderrahim et al. The three-dimensional model for dependability integration in cloud computing
Birje et al. Cloud monitoring system: a review
JP6502783B2 (ja) 一括管理システム、一括管理方法およびプログラム
Sangrasi et al. Aggregating node level risk assessment in grids using an R-out-of-N model
JP2018190205A (ja) 事業者間一括サービス管理装置および事業者間一括サービス管理方法
US20230214681A1 (en) Model Decisions Based On Speculative Execution

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130902

R150 Certificate of patent or registration of utility model

Ref document number: 5370624

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150