JP2015176168A - 管理サーバおよび障害復旧方法、並びにコンピュータ・プログラム - Google Patents

管理サーバおよび障害復旧方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP2015176168A
JP2015176168A JP2014049581A JP2014049581A JP2015176168A JP 2015176168 A JP2015176168 A JP 2015176168A JP 2014049581 A JP2014049581 A JP 2014049581A JP 2014049581 A JP2014049581 A JP 2014049581A JP 2015176168 A JP2015176168 A JP 2015176168A
Authority
JP
Japan
Prior art keywords
virtual machine
failure
host
machines
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014049581A
Other languages
English (en)
Other versions
JP6269199B2 (ja
Inventor
暁 高垣
Akira Takagaki
暁 高垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014049581A priority Critical patent/JP6269199B2/ja
Publication of JP2015176168A publication Critical patent/JP2015176168A/ja
Application granted granted Critical
Publication of JP6269199B2 publication Critical patent/JP6269199B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】 障害発生前の仮想マシンの利用状況に応じて、重要度の高い仮想マシンを優先的に復旧する管理サーバ等を提供する。【解決手段】 管理サーバ100は、仮想マシンが動作しているときの状態を表す情報を取得する状態取得部101と、状態取得部101により取得された情報を記憶する記憶部102と、仮想マシンが動作する複数のホストマシンにおいて障害が発生しているか否かを監視し、障害を検出した場合に、その検出した障害を通知する監視部103と、監視部103によるホストマシンにおける障害検出の通知に応じて、当該ホストマシンにおいて動作していた仮想マシンについて、記憶部102に記憶された情報を基に、復旧が必要とされる優先度を求め、その優先度が高い順番に仮想マシンを、障害が発生したホストマシンとは他のホストマシンにおいて起動する復旧部104とを備える。【選択図】 図1

Description

本発明は、複数のホストマシンで仮想マシンが動作するシステムに関する。
複数のホストマシンがあり、その各々のホストマシンにおいて、仮想マシンが動作する環境がある。そのような環境において、ホストマシンに障害が発生した場合、そのホストマシンにおいて動作していた仮想マシンを他のホストマシンにおいて起動することにより復旧する方式が実現されている。このとき、重要度の高い仮想マシンを優先的に復旧することが望ましく、そのための手段として、システム管理者が予め全ての仮想マシンの重要度や優先度を設定しておく方法が一般的である。
しかしながら、この方法は、仮想マシンの重要度や優先度が固定されたままであり、変更されないことを前提としている。そのため、障害発生時には使用されていなかった仮想マシンが先に復旧され、使用中であった仮想マシンの復旧が遅れてしまう可能性がある。
また、障害が発生したホストマシン以外のホストマシンにおいて、復旧対象の仮想マシンを全て起動するために必要なリソースが確保されていない場合がある。そのような場合に、実際には使用されていなかった仮想マシンは復旧されるが、使用中であった仮想マシンは復旧されない状況に陥る可能性がある。
ここで、本願出願に先だって存在する関連技術としては、例えば以下の特許文献がある。
特許文献1は、物理ホストマシンのメンテナンス時や障害時にリソースプール総量を減らさずに運用を継続することができる仮想化システムを開示している。
特許文献2は、高信頼化のための待機系サーバの台数を少なくすると共に、待機系サーバで動作するソフトウェアのライセンスを削減することができる障害回復方法を開示している。
特開2013−210745号公報 特開2010−211819号公報
しかしながら、特許文献1及び2に提案されている技術において、障害発生前の仮想マシンの利用状況に応じた復旧処理を行うことについて考慮していない。
そこで、本発明は、障害発生前の仮想マシンの利用状況に応じて、重要度の高い仮想マシンを優先的に復旧する管理サーバ等の提供を主たる目的とする。
上記の目的を達成すべく、本発明に係る管理サーバは、以下の構成を備えることを特徴とする。
即ち、本発明に係る管理サーバは、
仮想マシンが動作しているときの状態を表す情報を取得する状態取得手段と、
前記状態取得手段により取得された前記情報を記憶する記憶手段と、
前記仮想マシンが動作する複数のホストマシンにおいて障害が発生しているか否かを監視し、障害を検出した場合に、その検出した障害を通知する監視手段と、
前記監視手段による前記ホストマシンにおける障害検出の通知に応じて、当該ホストマシンにおいて動作していた前記仮想マシンについて、前記記憶手段に記憶された情報を基に、復旧が必要とされる優先度を求め、その優先度が高い順番に前記仮想マシンを、障害が発生したホストマシンとは他のホストマシンにおいて起動する復旧手段と
を備える
ことを特徴とする。
同目的を達成する本発明に係る障害復旧方法は、
情報処理装置によって、
仮想マシンが動作しているときの状態を表す情報を取得して記憶し、
前記仮想マシンが動作する複数のホストマシンにおいて障害が発生しているか否かを監視し、
障害を検出した場合に、当該ホストマシンにおいて動作していた前記仮想マシンについて、記憶しておいた前記情報を基に、復旧が必要とされる優先度を求め、その優先度が高い順番に前記仮想マシンを、障害が発生したホストマシンとは他のホストマシンにおいて起動する
ことを特徴とする。
更に、同目的は、上記構成を有する管理サーバを、コンピュータによって実現するコンピュータ・プログラム、及びそのコンピュータ・プログラムが格納されている、コンピュータ読み取り可能な記憶媒体によっても達成される。
上記の本発明によれば、障害発生前の仮想マシンの利用状況に応じて、重要度の高い仮想マシンを優先的に復旧することができるという効果がある。
本発明の第1の実施形態に係る管理サーバの構成を示すブロック図である。 本発明の第1の実施形態に係る仮想化システムの構成を示すブロック図である。 本発明の第2の実施形態に係る管理サーバの構成を示すブロック図である。 本発明の第2の実施形態に係るユーザ情報記憶部を説明する図である。 本発明の第2の実施形態に係る依存関係記憶部を説明する図である。 本発明の第2の実施形態に係るセッション状態記憶部を説明する図である。 本発明の第2の実施形態に係る通信状態記憶部を説明する図である。 本発明の第2の実施形態に係る仮想マシン復旧部における優先度を求める処理を示すフローチャートである。
次に、本発明を実施する形態について図面を参照して詳細に説明する。
<第1の実施形態>
図1は、本発明の第1の実施形態に係る管理サーバの構成を示すブロック図である。
図2は、本発明の第1の実施形態に係る仮想化システムの構成を示すブロック図である。
図2に示すように、本実施形態に係る管理サーバ100は、ホストマシン210、220と、仮想マシン310、320、330とに、管理ネットワーク510により、通信可能に接続されている。
仮想マシン310は、ホストマシン210において動作している。また、仮想マシン320と仮想マシン330とは、ホストマシン220において動作している。
仮想マシン310、320、330は、端末410、420、430と、運用ネットワーク610により、通信可能に接続されている。ユーザは、端末410、420、430を用いて、仮想マシン310、320、330を操作する。
図1に示すように、本実施形態に係る管理サーバ100は、状態取得部101と、記憶部102と、監視部103と、復旧部104とを備える。
状態取得部101は、仮想マシン(310、320、330)が動作時の状態情報を取得する。
記憶部102は、状態取得部101により取得された情報を記憶する。
監視部103は、仮想マシン(310、320、330)が動作する複数のホストマシン(210、220)において障害が発生していないかを監視し、障害を検出した場合、復旧部104に通知を行う。
監視部103より障害発生の通知を受けて、復旧部104は、障害を検出したホストマシン(210、220)において動作していた仮想マシンについて、記憶部102に記憶された情報を基に、復旧を必要とする優先度を求める。そして、復旧部104は、求めた優先度が高い順番に仮想マシンを、障害を検出したホストマシンとは他のホストマシンにおいて起動することにより復旧する。
以上、説明したように、第1の実施形態には、障害発生前の仮想マシンの利用状況に応じて、重要度の高い仮想マシンを優先的に復旧することができるという効果がある。
その理由は、本実施形態に係る管理サーバ100は、仮想マシン(310、320、330)が動作時の情報を記憶しておく。そして、ホストマシン(210、220)における障害発生時には、記憶しておいた情報を参照して優先度を求め、その優先度を基に、優先度が高い仮想システムから順に復旧するからである。
なお、上述した実施形態において、図1に示した管理サーバ100の機能は、その機能を実現可能なコンピュータ・プログラムを、ハードウェア資源であるコンピュータ(情報処理装置)が有するCPU(Central Processing Unit)において、実行することによっても達成可能である。このことは、後述する第2の実施形態において図3に示す管理サーバ800についても同様である。
<第2の実施形態>
次に上述した第1の実施形態に係る管理サーバ100を基本とする第2の実施形態について説明する。図3は、本発明の第2の実施形態に係る管理サーバの構成を示すブロック図である。
本実施形態に係る管理サーバ800は、管理用ユーザインタフェース部810と、ユーザ情報記憶部820と、依存関係記憶部830と、セッション状態取得部840と、セッション状態記憶部850と、通信状態取得部860と、通信状態記憶部870と、ホストマシン障害検出部880と、仮想マシン復旧部890とを備える。
管理用ユーザインタフェース部810は、システム管理者が管理作業を行うためのユーザインタフェースである。管理用ユーザインタフェース部810は、仮想マシン(310、320、330)を使用するユーザを表す情報を、ユーザ情報記憶部820に記録する。また、管理用ユーザインタフェース部810は、仮想マシン(310、320、330)間の依存関係を表す情報を、依存関係記憶部830に記録する。
セッション状態取得部840は、仮想マシン(310、320、330)にログインしているユーザと、そのセッションの状態とをあらかじめ定めた一定時間ごとに取得する。そして、セッション状態取得部840は、取得した内容を、セッション状態記憶部850に記録する。
通信状態取得部860は、仮想マシン(310、320、330)が送信元および送信先である通信パケットを監視する。その監視において、通信状態取得部860は、例えば監視対象としてあらかじめ定めたサービスに対する仮想マシン間の通信状態を表す情報を取得する。そして、通信状態取得部860は、取得した情報を、通信状態記憶部870に記録する。
ホストマシン障害検出部880は、ホストマシン(210、220)に障害が発生していないかを監視する。ホストマシン(210、220)の障害を検出した場合、ホストマシン障害検出部880は、そのホストマシン(210、220)で動作していた仮想マシン(310、320、330)を復旧するため、障害を検出したことを仮想マシン復旧部890に通知する。
仮想マシン復旧部890は、障害検出の通知を受けて、ユーザ情報記憶部820と、依存関係記憶部830と、セッション状態記憶部850と、通信状態記憶部870とから取得した情報により、障害が検出されたホストマシン(210、220)において動作していた仮想マシン(310、320、330)の優先度を求める。そして、仮想マシン復旧部890は、求めた優先度が高い仮想マシン(310、320、330)から順番に、その仮想マシン(310、320、330)が動作していたホストマシン(210、220)とは他のホストマシン(210、220)において起動するように、ハイパーバイザー(図示せず)に指示する。ハイパーバイザーは、仮想化を実現するための製品であり、例えばVMware(登録商標)などがある。これにより、障害が検出されたホストマシン(210、220)で動作していた仮想マシン(310、320、330)は、他のホストマシン(210、220)で起動され、復旧される。
次に、本実施形態の処理の流れについて説明する。
システム管理者は、管理サーバ800の管理用ユーザインタフェース部810を利用して、仮想マシン(310、320、330)を使用するユーザについて、ユーザID(すなわち、ユーザを一意に識別可能な識別子)と重要度とを登録する。それらのユーザに関する情報は、ユーザ情報記憶部820に記録される。
図4は、本発明の第2の実施形態に係るユーザ情報記憶部を説明する図である。ユーザ情報記憶部820は、ユーザID821と、重要度822とを含む。すなわち、ユーザID821と、重要度822とは、ユーザ情報記憶部820において、図4に概念的に示すテーブルの如く関連付けされていることとする。
ユーザID821は、仮想マシンを使用するユーザを一意に識別可能なIDである。
重要度822は、例えば仮想マシンにおいて行う作業にユーザごとに重要度の違いがある場合に、重要度を示す値が設定される。
また、システム管理者は、ある仮想マシン(310、320、330)が他の仮想マシン(310、320、330)に依存することが明らかである場合に、管理用ユーザインタフェース部810を利用して、それらの依存関係を表す情報を登録する。その依存関係を表す情報は、依存関係記憶部830に記録される。依存関係とは、依存先の仮想マシン(310、320、330)は、依存元の仮想マシン(310、320、330)が正常に動作するために必須であることとする。
図5は、本発明の第2の実施形態に係る依存関係記憶部を説明する図である。依存関係記憶部830は、依存元仮想マシンID831と、依存先仮想マシンID832とを含む。すなわち、依存元仮想マシンID831と、依存先仮想マシンID832とは、依存関係記憶部830において、図5に概念的に示すテーブルの如く関連付けされていることとする。
依存元仮想マシンID831は、依存関係がある仮想マシン(310、320、330)において、依存元である仮想マシン(310、320、330)を一意に識別可能なIDである。
依存先仮想マシンID832は、依存関係がある仮想マシン(310、320、330)において、依存先である仮想マシン(310、320、330)を一意に識別可能なIDである。
セッション状態取得部840は、起動状態にある仮想マシン(310、320、330)においてログイン中であるユーザについて、ユーザIDとそのセッションの状態を表す情報を取得する。セッション状態取得部840は、取得した情報をセッション状態記憶部850に記録する。
図6は、本発明の第2の実施形態に係るセッション状態記憶部を説明する図である。セッション状態記憶部850は、仮想マシンID851と、ユーザID852と、セッションID853と、状態854と、アイドル時間855と、ログイン時刻856とを含む。すなわち、仮想マシンID851と、ユーザID852と、セッションID853と、状態854と、アイドル時間855と、ログイン時刻856とは、セッション状態記憶部850において、図6に概念的に示すテーブルの如く関連付けされていることとする。
仮想マシンID851は、仮想マシン(310、320、330)を一意に識別可能なIDである。
ユーザID852は、仮想マシン(310、320、330)を使用するユーザを一意に識別可能なIDである。
セッションID853は、ユーザごとにセッションを一意に識別可能なIDである。
状態854は、セッションが接続しているか、あるいは、切断しているかを表す。
アイドル時間855は、そのセッションにおいて最後にデータをやりとりしてからの経過時間を表す。
ログイン時刻856は、ユーザが仮想マシン(310、320、330)にログインした時刻を表す。
セッション状態取得部840は、セッション状態を記録する際に、まず、セッション状態記憶部850にすでに記録されているデータを削除する。それから、セッション状態取得部840は、取得した情報をセッション状態記憶部850に記憶する。これらの処理を例えばあらかじめ定めた一定時間ごとに実行する。これにより、セッション状態取得部840は、セッション状態記憶部850に、最新のセッション状態のみを記憶することができる。
通信状態取得部860は、ネットワークを流れる通信パケットを監視する。そして、通信状態取得部860は、それらの通信パケットについて、送信元または送信先が仮想マシン(310、320、330)であり、かつ、あらかじめ定めた監視対象のサービスに関わるかを調べる。それらの条件を満たす通信パケットを検出した場合、通信状態取得部860は、その通信パケットを表す情報を、通信状態記憶部870に記憶する。
図7は、本発明の第2の実施形態に係る通信状態記憶部を説明する図である。通信状態記憶部870は、送信元仮想マシンID871と、送信先仮想マシンID872と、サービスID873と、通信時刻874とを含む。すなわち、送信元仮想マシンID871と、送信先仮想マシンID872と、サービスID873と、通信時刻874とは、通信状態記憶部870において、図7に概念的に示すテーブルの如く関連付けされていることとする。
送信元仮想マシンID871は、送信元である仮想マシンを表すIDである。
送信先仮想マシンID872は、送信先である仮想マシンを表すIDである。
サービスID873は、サービスを一意に識別可能なIDである。
通信時刻874は、例えば、その通信パケットを検出した時刻である。
通信状態記憶部870に記憶する際に、通信状態取得部860は、送信元仮想マシンID871と、送信先仮想マシンID872と、サービスID873との3つの項目が、これから記憶しようとしている情報と同一の情報が通信状態記憶部870にすでに記憶されているか検索する。すでに該当する情報が存在する場合、通信状態取得部860は、当該情報に対応する通信時刻874を更新する。通信状態記憶部870に存在しない場合には、通信状態取得部860は、通信状態記憶部870の新たなエントリに検出した通信パケットを表す情報を記憶する。
通信状態記憶部870に記憶したデータは、例えば、通信時刻があらかじめ定めた一定期間更新されていないデータを定期的に削除する。これにより、通信状態記憶部870に記憶されたデータは、直近の通信実績のみになる。通信状態を監視する対象とするサービスは、運用するシステムの特性に合わせてシステム管理者があらかじめ定義するものとする。
ホストマシン障害検出部880は、ホストマシン(210、220)に障害が発生していないか監視を行う。ホストマシン障害検出部880は、障害が発生したことを、例えば、ホストマシン(210、220)に対して定期的に接続の確認を実施することによって検出してもよいし、ハイパーバイザーが提供する障害イベント通知により検出してもよい。ホストマシン(210、220)の障害を検出した場合、ホストマシン障害検出部880は、仮想マシン復旧部890に障害を検出したことを通知する。
仮想マシン復旧部890は、ホストマシン障害検出部880から障害通知を受け、障害が発生したホストマシン(210、220)で動作していた仮想マシン(310、320、330)の復旧処理を行う。仮想マシン復旧部890は、復旧処理にあたり、仮想マシン間の通信状態および依存関係ならびに復旧対象の仮想マシン(310、320、330)を使用していたユーザのセッション状態により優先度を求める。
ここで、優先度を求める方法について、図8を参照して説明する。図8は、本発明の第2の実施形態に係る仮想マシン復旧部における優先度を求める処理を示すフローチャートである。優先度を決定する要素として、セッション状態によるスコア(以下、スコア1と称する)および通信状態によるスコア(以下、スコア2と称する)を求める。
まず、スコア1を求める。
仮想マシン再配置部890は、ユーザ情報記憶部820とセッション状態記憶部850を参照する。そして、仮想マシン再配置部890は、復旧対象の仮想マシンを使用していたユーザのセッション状態と重要度を取得する(ステップS101およびS102)。
取得した内容を基に、仮想マシン再配置部890は、接続状態でアイドル時間が「0」のセッション(すなわち、使用中の状態にあったセッション)が存在する仮想マシン(310、320、330)が大きな値となるように、スコア1を求める(ステップS103)。セッションの状態に大きな違いが見られない場合には、仮想マシン再配置部890は、ログインしているユーザの重要度が高い仮想マシン(310、320、330)が大きな値となるように、スコア1を求める。
次に、スコア2を求める。
仮想マシン再配置部890は、通信状態記憶部870を参照し、復旧対象の仮想マシン(310、320、330)を送信先とする通信実績を取得する(ステップS104)。そして、より多くの通信実績を持つ(より多くの仮想マシンによって使用されていた)仮想マシン(310、320、330)が大きな値となるように、スコア2を求める(ステップS106)。このとき、仮想マシン再配置部890は、送信元の仮想マシン(310、320、330)に対して上述のスコア1を求めて、その値に応じてスコア2に重み付けをしてもよい(ステップS105)。それにより、仮想マシン再配置部890は、重要度の高いセッションを持つ仮想マシンによって使用されていた仮想マシンを優先するように調整することができる。
最後に、仮想マシン再配置部890は、依存関係記憶部830を参照し、依存元と依存先がいずれも復旧対象の仮想マシンである(ステップS107で「Yes」)場合に、依存元仮想マシンのスコア(スコア1およびスコア2)を依存先仮想マシンのスコア(スコア1およびスコア2)にそれぞれ加算する(ステップS108)。これは、依存先の仮想マシンは、依存元の仮想マシンが正常に動作するために必須であるという前提があるためである。
このようにして、仮想マシン再配置部890は、復旧対象であるすべての仮想マシンに対して、スコア(スコア1およびスコア2)を求める。そして、仮想マシン再配置部890は、求めた結果を比較して、仮想マシンごとの優先度を決定する(ステップS109)。仮想マシン再配置部890は、優先度が大きい仮想マシン(310、320、330)から復旧処理の実行を行う。スコアを比較する際に、仮想マシン再配置部890は、スコア1をスコア2よりも重視してもよい。そうすれば、仮想マシン再配置部890は、ユーザが直接使用していた仮想マシンを優先的に復旧することが可能になる。
ここまで、優先度を決定する方法の一例を説明したが、優先度を決定する方法は、これに限定しない。優先度の決定は、システムの特性等に応じて、任意の方法で行えばよい。
また、優先度を求めるために用いる情報は、本実施形態で使用した情報に限らず、システムの稼働中に採取可能な他の情報を用いてもよい。例えば、仮想マシンが提供するサービスの種類に応じて重要度を設定し、前述の実施例と組み合わせることにより復旧の優先度を決定してもよい。
以上、説明したように、第2の実施形態には、障害発生前の仮想マシンの利用状況に応じて、重要度の高い仮想マシンを優先的に復旧することができるという効果がある。
その理由は、本実施形態に係る管理サーバ800は、仮想マシン(310、320、330)が動作時の情報を記憶しておく。そして、ホストマシン(210、220)における障害発生時には、記憶しておいた情報を参照して優先度を求め、その優先度を基に、優先度が高い仮想システムから順に復旧処理を行うからである。
これにより、仮想マシンの重要度や優先度を事前に設定することなく、利用状況に応じた復旧処理を行うことができる。そのため、各々の仮想マシンでどのような処理が実行されるかをシステム管理者が事前に把握することが困難な場合において、特に効果的である。
100 管理サーバ
101 状態取得部
102 記憶部
103 監視部
104 復旧部
210 ホストマシン
220 ホストマシン
310 仮想マシン
320 仮想マシン
330 仮想マシン
410 端末
420 端末
430 端末
510 管理ネットワーク
610 運用ネットワーク
800 管理サーバ
810 管理用ユーザインタフェース部
820 ユーザ情報記憶部
821 ユーザID
822 重要度
830 依存関係記憶部
831 依存元仮想マシンID
832 依存先仮想マシンID
840 セッション状態取得部
850 セッション状態記憶部
851 仮想マシンID
852 ユーザID
853 セッションID
854 状態
855 アイドル時間
856 ログイン時刻
860 通信状態取得部
870 通信状態記憶部
871 送信元仮想マシンID
872 送信先仮想マシンID
873 サービスID
874 通信時刻
880 ホストマシン障害検出部
890 仮想マシン復旧部

Claims (7)

  1. 仮想マシンが動作しているときの状態を表す情報を取得する状態取得手段と、
    前記状態取得手段により取得された前記情報を記憶する記憶手段と、
    前記仮想マシンが動作する複数のホストマシンにおいて障害が発生しているか否かを監視し、障害を検出した場合に、その検出した障害を通知する監視手段と、
    前記監視手段による前記ホストマシンにおける障害検出の通知に応じて、当該ホストマシンにおいて動作していた前記仮想マシンについて、前記記憶手段に記憶された情報を基に、復旧が必要とされる優先度を求め、その優先度が高い順番に前記仮想マシンを、障害が発生したホストマシンとは他のホストマシンにおいて起動する復旧手段と
    を備える
    ことを特徴とする管理サーバ。
  2. 前記状態取得手段は、
    前記仮想マシンを使用しているユーザのセッションの状態を取得し、前記記録手段に記憶する
    ことを特徴とする請求項1記載の管理サーバ。
  3. 前記状態取得手段は、
    前記仮想マシンを送信元または送信先とする通信パケットに関する情報を取得し、前記記録手段に記憶する
    ことを特徴とする請求項1または2記載の管理サーバ。
  4. 前記記録手段は、
    前記仮想マシンを使用するユーザの重要度を記録する
    ことを特徴とする請求項1乃至3の何れかに記載の管理サーバ。
  5. 前記記録手段は、
    前記仮想マシン間の依存関係を記録する
    ことを特徴とする請求項1乃至4の何れかに記載の管理サーバ。
  6. 情報処理装置によって、
    仮想マシンが動作しているときの状態を表す情報を取得して記憶し、
    前記仮想マシンが動作する複数のホストマシンにおいて障害が発生しているか否かを監視し、
    障害を検出した場合に、当該ホストマシンにおいて動作していた前記仮想マシンについて、記憶しておいた前記情報を基に、復旧が必要とされる優先度を求め、その優先度が高い順番に前記仮想マシンを、障害が発生したホストマシンとは他のホストマシンにおいて起動する
    ことを特徴とする障害復旧方法。
  7. 仮想マシンが動作しているときの状態を表す情報を取得する状態取得機能と、
    取得された前記情報を記憶する記憶機能と、
    前記仮想マシンが動作する複数のホストマシンにおいて障害が発生しているか否かを監視し、障害を検出した場合に、その検出した障害を通知する監視機能と、
    前記ホストマシンにおける障害検出の通知に応じて、当該ホストマシンにおいて動作していた前記仮想マシンについて、前記記憶機能に記憶された情報を基に、復旧が必要とされる優先度を求め、その優先度が高い順番に前記仮想マシンを、障害が発生したホストマシンとは他のホストマシンにおいて起動する復旧機能とを、
    コンピュータに実現させる
    ことを特徴とするコンピュータ・プログラム。
JP2014049581A 2014-03-13 2014-03-13 管理サーバおよび障害復旧方法、並びにコンピュータ・プログラム Active JP6269199B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014049581A JP6269199B2 (ja) 2014-03-13 2014-03-13 管理サーバおよび障害復旧方法、並びにコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014049581A JP6269199B2 (ja) 2014-03-13 2014-03-13 管理サーバおよび障害復旧方法、並びにコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2015176168A true JP2015176168A (ja) 2015-10-05
JP6269199B2 JP6269199B2 (ja) 2018-01-31

Family

ID=54255367

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014049581A Active JP6269199B2 (ja) 2014-03-13 2014-03-13 管理サーバおよび障害復旧方法、並びにコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP6269199B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019053453A (ja) * 2017-09-14 2019-04-04 日本電気株式会社 情報処理装置、情報処理方法、及びプログラム
CN110083584A (zh) * 2019-05-07 2019-08-02 深信服科技股份有限公司 文件重建方法、装置、设备及计算机可读存储介质
WO2022181020A1 (ja) * 2021-02-26 2022-09-01 パナソニックIpマネジメント株式会社 情報処理装置および情報処理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06161975A (ja) * 1992-11-17 1994-06-10 Hitachi Ltd 計算機システム
JP2001268161A (ja) * 2000-03-16 2001-09-28 Fujitsu Ltd 伝送装置
JP2004295462A (ja) * 2003-03-27 2004-10-21 Hitachi Ltd リカバリ処理方法及びその実施システム並びにその処理プログラム
JP2006302081A (ja) * 2005-04-22 2006-11-02 Ntt Data Corp サービス再開装置およびサービス再開プログラム
JP2011128967A (ja) * 2009-12-18 2011-06-30 Hitachi Ltd 仮想計算機の移動方法、仮想計算機システム及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06161975A (ja) * 1992-11-17 1994-06-10 Hitachi Ltd 計算機システム
JP2001268161A (ja) * 2000-03-16 2001-09-28 Fujitsu Ltd 伝送装置
JP2004295462A (ja) * 2003-03-27 2004-10-21 Hitachi Ltd リカバリ処理方法及びその実施システム並びにその処理プログラム
JP2006302081A (ja) * 2005-04-22 2006-11-02 Ntt Data Corp サービス再開装置およびサービス再開プログラム
JP2011128967A (ja) * 2009-12-18 2011-06-30 Hitachi Ltd 仮想計算機の移動方法、仮想計算機システム及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019053453A (ja) * 2017-09-14 2019-04-04 日本電気株式会社 情報処理装置、情報処理方法、及びプログラム
CN110083584A (zh) * 2019-05-07 2019-08-02 深信服科技股份有限公司 文件重建方法、装置、设备及计算机可读存储介质
WO2022181020A1 (ja) * 2021-02-26 2022-09-01 パナソニックIpマネジメント株式会社 情報処理装置および情報処理方法

Also Published As

Publication number Publication date
JP6269199B2 (ja) 2018-01-31

Similar Documents

Publication Publication Date Title
US10073729B2 (en) Fault management method, entity, and system
US9483368B2 (en) Method, apparatus, and system for handling virtual machine internal fault
TWI603266B (zh) 虛擬機器之資源調整方法及系統
JP5851503B2 (ja) 高可用性仮想機械環境におけるアプリケーションの高可用性の提供
EP3142011B9 (en) Anomaly recovery method for virtual machine in distributed environment
US10462027B2 (en) Cloud network stability
CN110830283B (zh) 故障检测方法、装置、设备和系统
JP5982015B2 (ja) コンピュータ・ネットワーク用のトランザクション実行監視方法及びシステム並びにコンピュータ記憶媒体
US8880936B2 (en) Method for switching application server, management computer, and storage medium storing program
CN107508694B (zh) 一种集群内的节点管理方法及节点设备
CN107729185B (zh) 一种故障处理方法及装置
CN109921942B (zh) 云平台切换控制方法、装置、系统及电子设备
JP5588295B2 (ja) 情報処理装置、および障害復旧方法
JP6269199B2 (ja) 管理サーバおよび障害復旧方法、並びにコンピュータ・プログラム
CN111526038B (zh) 业务请求分发方法、装置、计算机设备及可读存储介质
US20180113745A1 (en) Non-transitory computer-readable medium, system, and information processing method
JP6421516B2 (ja) サーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法
CN113965576A (zh) 基于容器的大数据采集方法、装置、存储介质和设备
JP5304689B2 (ja) 影響サービスを特定する監視システムおよびその方法
JP5483784B1 (ja) 制御装置、計算資源管理方法及び計算資源管理プログラム
CN111309515A (zh) 一种容灾控制方法、装置及系统
JP6984119B2 (ja) 監視装置、監視プログラム、及び監視方法
WO2014040470A1 (zh) 告警消息的处理方法及装置
JP2011028490A (ja) システム監視装置、システム監視方法、及びプログラム
JP6572722B2 (ja) 事象発生通知プログラム、事象発生通知方法、及び、事象発生通知装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171218

R150 Certificate of patent or registration of utility model

Ref document number: 6269199

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150