JP2014041506A - 計算機とその障害処理方法およびプログラム - Google Patents

計算機とその障害処理方法およびプログラム Download PDF

Info

Publication number
JP2014041506A
JP2014041506A JP2012183788A JP2012183788A JP2014041506A JP 2014041506 A JP2014041506 A JP 2014041506A JP 2012183788 A JP2012183788 A JP 2012183788A JP 2012183788 A JP2012183788 A JP 2012183788A JP 2014041506 A JP2014041506 A JP 2014041506A
Authority
JP
Japan
Prior art keywords
failure
fault
virtual machine
machine
real machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012183788A
Other languages
English (en)
Other versions
JP5806987B2 (ja
Inventor
Jun Hamanaka
純 濱中
Koji Amano
光司 天野
Takahiro Ohira
崇博 大平
Go Takebayashi
剛 武林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2012183788A priority Critical patent/JP5806987B2/ja
Publication of JP2014041506A publication Critical patent/JP2014041506A/ja
Application granted granted Critical
Publication of JP5806987B2 publication Critical patent/JP5806987B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】実マシンの障害を仮想マシンに適切に通知する技術を提供する。
【解決手段】実マシン上に仮想マシンが構築される計算機であって、前記実マシン上で発生する障害を検知する実マシン異常検知手段と、前記実マシン異常検知手段で検知された前記障害の障害種別を、仮想マシンで処理するように抽象化された障害種別に変換する抽象化変換手段と、前記実マシン異常検知手段で検知された前記障害の障害発生部位を、仮想マシンにおける障害発生部位に変換する障害部位識別手段と、前記障害部位識別手段による変換で得られた前記障害発生部位に関連する仮想マシンに、前記抽象化変換手段による変換で得られた前記抽象化された障害種別の障害通知を送る障害通知手段と、を有している。
【選択図】図1

Description

本発明は仮想化環境の計算機を管理する技術に関する。
従来の計算機システムは物理的な計算機(実マシン)を物理的なネットワーク(実ネットワーク)で接続することにより構築されていた。例えば、実マシンによってそれぞれ構成されたクライアントとサーバは実ネットワーク上で通信経路を確立し、相互に通信を行っていた。この種のシステムでは、実マシンを多重化することにより、システムの信頼性を向上する手法が採られていた(特許文献1参照)。
それに対し、近年では、実マシン上に仮想的な計算機(仮想マシン)を構築し、仮想マシン上でアプリケーションを実行するための仮想化環境制御技術が登場している。また、1つの実マシンに複数の仮想マシンを構築することも可能となっている。
更には、複数の仮想マシンに実マシンの環境を分配する技術、仮想マシンに提供する実マシン環境を仮想的に構築する技術、仮想的なデバイスをメモリ上に構築し、仮想マシンが実マシンによる処理を介さずにデバイスと通信を行う技術が提案されている(特許文献2参照)。また、実マシン上に仮想マシンを構築したシステムにおいて通信の多重化によってシステムの信頼性を向上する技術が提案されている(特許文献3参照)。
また、仮想環境制御機能を実装した実マシン間で仮想マシンのデータを転送し、元々実装されていた実マシンとは異なる実マシン上で仮想マシンを稼動することも可能となっている。このように仮想マシンのポータビリティが向上したことや、仮想マシンを実装する際の実マシンのアーキテクチャへの依存度が下がったことにより、仮想マシン上に構築された既存の業務アプリケーションのプログラムやサービスロジックを、実マシンを置き換えても継続使用して延命させることが期待されるようになっている。
特開2004−295738号公報 米国特許出願公開第2011/0246989A1号明細書 特開2008−278478号公報
実マシンが変わると、システム監視アプリケーションにおいて検知すべき障害項目も追加されたり変更されたりする。しかしながら現状では、仮想マシン上で実行されているアプリケーションであっても、実マシン上で稼働することを前提として設計されたものや、仮想マシンと実マシンの違いを意識しないで設計されたものが多く、環境の変更に柔軟に対応することができない。
新しく追加された障害項目には障害発生部位や障害識別子としてこれまで無かったものが使われる場合があり、その場合、仮想マシンは、想定していない障害発生部位あるいは障害識別子を通知する障害情報を実マシンから受信することになる。そうなると、仮想マシンは、通知された障害に対して適切な処理を実行することはできない。例えば、実マシンからの障害通知を仮想マシンが廃棄することが考えられ、その場合、仮想マシン上で動作しているシステム監視アプリケーションは障害が発生したことを知ることができない。
本発明の目的は、実マシンの障害を仮想マシンに適切に通知する技術を提供することである。
本発明の一態様による計算機は、実マシン上に仮想マシンが構築される計算機であって、前記実マシン上で発生する障害を検知する実マシン異常検知手段と、前記実マシン異常検知手段で検知された前記障害の障害種別を、仮想マシンで処理するように抽象化された障害種別に変換する抽象化変換手段と、前記実マシン異常検知手段で検知された前記障害の障害発生部位を、仮想マシンにおける障害発生部位に変換する障害部位識別手段と、前記障害部位識別手段による変換で得られた前記障害発生部位に関連する仮想マシンに、前記抽象化変換手段による変換で得られた前記抽象化された障害種別の障害通知を送る障害通知手段と、を有している。
本発明によれば、実マシンの障害を仮想マシンに適切に通知することができる。
本実施形態による計算機の概略ブロック図である。 本実施例による仮想化サーバーシステムのブロック図である。 抽象化情報テーブル301を示す図である。 抽象化変換部211が実施する処理フローの一例を示すフローチャートである。 システム構成情報テーブル302を示す図である。 障害部位識別部212が実施する処理フローの例を示すフローチャートである。 実マシン仮想マシン間障害通知部204Aが実施する処理フローの一例を示すフローチャートである。
本発明の実施形態および実施例の説明においては、同一の構造あるいは機能を有する部分に同一の符号を付している。同一の符号を付した部分は原則として同一の動作を行うので重複する説明は省略している。
本発明の実施形態について図面を参照して説明する。
図1は、本実施形態による計算機の概略ブロック図である。図1を参照すると、計算機を構成する実マシン100には2つの仮想マシン202A、202Bが構築されている。各仮想マシン202A、202Bはそれぞれ障害通知部204A、204Bを有している。
実マシン100は、抽象化変換部211、障害部位識別部212、および異常検知部240を有している。
ここでは一例として、仮想マシン202A、202B、障害通知部204A、204B、抽象化変換部211、障害部位識別部212、異常検知部240は全て実マシン100のメモリ上に構築されるものである。
また、ここでは仮想マシン202A、202Bが2つである場合を例示しているが、1つであっても良く、あるいは3つ以上であっても良い。
また、ここでは仮想マシン202A、202Bがそれぞれ障害通知部204A、204Bを内部に有する例を示しているが、本発明がこれに限定されることは無い。他の例として、障害通知部204A、204Bは仮想マシン202A、202Bとは別個のに存在しても良い。
また、ここでは実マシン100が単独で存在する例が示されているが、実際には通信ネットワークを経由して他の計算機やデバイスに接続されているのが一般的である。すなわち、実マシン100は単独で存在しても良く、複数が互いに通信ネットワークで接続されていても良い。
異常検知部240は、実マシン100上で発生する障害を検知する。実マシン100で発生する障害には、実マシン100の構成に依存して様々な障害種別のものがある。例えばディスクの故障や通信カードの故障などがある。異常検知部240で検知された実マシンの障害の障害種別は障害種別判断部221によって判別される。
抽象化変換部211は、異常検知部240で検知された障害の障害種別を、仮想マシンで処理するように抽象化された障害種別に変換する。例えば、仮想マシンで処理できる障害種別として、実マシンに依存して事後的に追加される障害種別を当てはめることができるような汎用的な障害種別を予め定めておく。そして、抽象化変換部211は、実際に用いられている実マシン100で発生した障害を、予め定められた障害種別に当てはめていく。
障害部位識別部212は、異常検知部240で検知された障害の障害発生部位を、仮想マシンにおける障害発生部位に変換する。異常検知部240で検知される実マシン100の構成に依存する障害は、その発生部位によって影響が及ぶ仮想マシンが異なることがある。例えば、ある部位の障害は仮想マシン202Aには影響するが、仮想マシン202Bには影響しないということがある。障害部位識別部201が障害発生部位を変換するとき、障害を通知すべき仮想マシンも明らかになる。
障害通知部204A、204Bは、障害部位識別部201による変換で得られた障害発生部位に関連する仮想マシンに、抽象化変換部211による変換で得られた抽象化された障害種別の障害通知を送る。
本実施形態によれば、実マシン100の障害を仮想マシンで処理できるように抽象化し、実マシン100の障害発生部位に対応する仮想マシン202A、202Bの障害発生部位に関連する仮想マシン202A、202Bに通知するので、実マシン100の障害を仮想マシン202A、202Bに適切に通知することができる。
概要を上述した本実施形態の計算機は様々な構成例により好適化しうる。
本実施形態の計算機は、実マシン100における障害種別と、抽象化された障害種別との対応関係を示す抽象化情報を例えばテーブル形式で記憶する抽象化情報記憶部(不図示)を更に有していても良い。その場合、抽象化変換部211は、異常検知部240で検知された障害の障害種別を、抽象化情報のテーブルを参照することにより、抽象化された障害種別に変換すればよい。これによれば、予め設定された抽象化情報に基づいて障害種別の抽象化を行うので、抽象化の処理を容易に実行することができる。
また、本実施形態の計算機は、実マシン100における障害発生部位と仮想マシン202A、202Bにおける障害発生部位との対応関係を示すシステム構成情報を例えばテーブル形式で記憶するシステム構成情報記憶部(不図示)を更に有していても良い。その場合、障害部位識別部212は、異常検知部240で検知された実マシンの障害の障害発生部位を、システム構成情報のテーブルを参照することにより、仮想マシン202A、202Bにおける障害発生部位に変換すればよい。これによれば、予め設定されたシステム構成情報に基づいて障害発生箇所の変換を行うので、変換の処理を容易に実行することができる。
また、本実施形態の仮想マシン202A、202Bは、実マシン100の障害を処理する実マシン障害情報処理部(不図示)と、仮想マシン202A、202Bの障害を処理する仮想マシン障害情報処理部(不図示)とを別個に有することにしても良い。そして、障害通知部204A、204Bは、障害部位識別部212で障害発生部位が変換された障害通知と、障害発生部位が変換されなかった障害通知とを区別できるように、仮想マシン202A、202Bに通知するとよい。更に、記仮想マシン障害情報処理部は、仮想マシンで発生した障害に対する処理を実行し、実マシン障害情報処理部は、障害通知部204A、204Bから通知された障害通知のうち少なくとも障害部位識別部212で障害発生部位が変換された障害通知に対する処理を実行するとよい。これによれば、実マシン障害情報処理と仮想マシン障害情報処理をそれぞれに担う処理部を別個に設け、それぞれの処理部が、実マシンで発生し、仮想マシンの障害に変換された障害と、仮想マシン自身で発生した障害とを分担して効率良く処理することができる。なお、その場合に、実マシン障害情報処理部は、障害通知部204A、204Bから通知された障害通知のうち、障害部位識別部212で障害発生部位が変換されていない障害通知に対する処理をも実行することにしても良い。
以下、本実施形態をより具体化した実施例について説明する。
図2は、本実施例による仮想化サーバーシステムのブロック図である。
仮想化サーバーシステム600は実マシン100を備え、LAN400、500により他のシステムと連結している。
実マシン100は物理的な計算機でありその上で仮想マシンを稼動させることが可能である。実マシン100として様々な構成のものが採用され得るが、ここではその一例を示す。実マシン100は、プロセッサ250と、メモリ200と、通信インタフェース261A、261Bと、ディスクインタフェース260とを有している。これらの装置は通信路262で互いに接続されている。ここでは通信路262は具体例としてバスであるとする。
更に実マシン100は外部に記憶媒体300を有しており、その記憶媒体300の内部に抽象化情報テーブル301とシステム構成情報テーブル302の初期値が記憶されている。
実マシン100のメモリ200には、実マシン用オペレーティングシステム230がある。ただし、本発明がそれに限定されることは無く、オペレーティングシステムが無い場合もあり得る。
また、メモリ200には、仮想サーバを稼動させるために必要な機能を実現する仮想環境制御部220があり、その仮想環境制御部220の内部には、障害種別判断部221および仮想NIC(Network Interface Card)222A、222B、222C、222Dがある。また、メモリ200には障害部位対応部210があり、その障害部位対応部210の内部に抽象化変換部211と障害部位識別部212がある。
実マシン100と仮想マシン202A、202Bとで情報を共有することが可能な仮想マシン・実マシン共有用メモリ区画207があり、その仮想マシン・実マシン共有用メモリ区画207には抽象化情報テーブル208およびシステム情報テーブル209がある。そして、実マシン100および仮想マシン202A、202Bが抽象化情報テーブル208およびシステム情報テーブル209にアクセスするために、仮想マシン・実マシン共有用情報インタフェース206がある。実マシン100および仮想マシン202A、202Bは、この仮想マシン・実マシン共有用情報インタフェース206を介して、抽象化情報テーブル208およびシステム情報テーブル209を参照したり、更新したりする.
仮想マシン用論理区画201Aには仮想マシン202Aがあり、仮想マシン202Aは、実マシン障害情報処理部203A、仮想マシン障害情報処理部203A’、実マシン仮想マシン間障害通知部204A、仮想マシン用オペレーティングシステム205A、および仮想デバイスドライバ206Aを有する。
仮想マシン用論理区画201Bは仮想マシン用論理区画201Aと同じ構造であるため、ここではその説明を省略する。
一例として、上述した各処理部の機能はプロセッサ250がそれぞれのソフトウェアプログラムを実行することにより実現することができる。しかしながら、本発明がこれに限定されることは無い。他の例として、実マシン用オペレーティングシステム230、仮想環境制御部220、障害種別判断部221、仮想NIC222A、222B、222C、222D、抽象化変換部211、障害部位識別部212、障害部位対応部210、仮想マシン・実マシン共有用情報インタフェース206、実マシン障害情報処理部203A、仮想マシン障害情報処理部203A’、実マシン仮想マシン間障害通知部204A、仮想マシン用オペレーティングシステム205A、仮想デバイスドライバ206Aなどの一部あるいは全部を集積回路化するなどしてハードウェアで実現することも可能である。
以下では説明を簡単にするために、プロセッサ250がソフトウェアプログラムを実行することにより実現される各処理部を動作主体として説明する。
実マシン100が備えるディスクインタフェース260、通信インタフェース261A、261Bについての異常は異常検知部240が検知する。異常検知部240で検知された異常の種別は障害種別判断部221によって判別される。異常検知部240は異常を検知すると、異常の種別を表すユニークな識別子(ID)と障害発生部位とを示す情報を含む障害通知を出力するものとする。
この種の計算機では、警報や障害が発生したとき、警報や障害のログデータを収集したり、正常に処理が行なえなくなる可能性があるために稼働系と待機系の切り替えを行ったり、シャットダウンによる停止処理を実施したり等、警報や障害に応じた処理を実行するための処理プログラムが組み込まれることがある。また、この種のシステムでは障害に応じた処理を即座に実行できるようにするために、障害を検出する装置(不図示)、検出された障害を通知する装置(不図示)、障害が通知されたことをトリガとして障害に応じた処理を実施する装置(不図示)が備えられている。
仮想化環境において実マシンまたは仮想マシンで障害が検知されてから仮想マシンに障害が通知されるまでの動作について説明する。
図3は、抽象化情報テーブル301を示す図である。図3には抽象化情報テーブル301の構成例が記載されている。図3を参照すると、抽象化情報テーブル301には、メッセージ種別301Bと、抽象化メッセージ種別301Cとが対応付けられている。例えば、異常を検知した異常検知部240が出力するメッセージ種別のerrno001と、抽象化メッセージ種別のerrno100とが対応している。この抽象化メッセージ種別errno100は、実マシン100の異常を抽象化して仮想マシン202A、202Bに通知するために予め準備されたメッセージ種別である。ここでは、抽象化メッセージ種別が一種類だけの場合が例示されているが、本発明がそれに限定されることは無い。例えば、重度障害、軽度障害、警報というように、複数レベルの抽象化メッセージ種別を準備しておき、異常検知部240が出力するメッセージの各メッセージ種別に対応づけることにしても良い。あるいは、ディスク障害、通信カード障害、というように複数種類の抽象化メッセージ種別を準備しておいても良い。また、複数種類のそれぞれについて複数レベルの抽象化メッセージ種別を準備しておいても良い。
この記憶媒体300の抽象化情報テーブル301は初期値であり、実マシン100の仮想マシン・実マシン共有用メモリ区画207に抽象化情報テーブル208として格納され、使用される。
図4は、抽象化変換部211が実施する処理フローの一例を示すフローチャートである。異常検知部240が実マシンの異常を検知し、障害通知のメッセージを出力したとする。その障害通知のメッセージにはメッセージ種別と障害箇所とが含まれている。
抽象化変換部211は、異常検知部240から出力された実マシンの障害通知のメッセージからメッセージ種別を切り出し(ステップS801)、抽象化情報テーブル208を参照し(ステップS802)、そのメッセージ種別に対応する抽象化メッセージ種別が存在するか否か判断する(ステップS803)。
その実マシンのメッセージのメッセージ種別に対応するメッセージ種別が存在していれば、抽象化変換部211は、そのメッセージのメッセージ種別を抽象化メッセージ種別に書き換え、障害部位識別部212へ渡す(ステップS804)。
一方、その実マシンのメッセージのメッセージ種別に対応するメッセージ種別が存在しなければ、抽象化変換部211は、メッセージ種別の書き換えを行わずに、メッセージを障害部位識別部212へ渡す(ステップS805)。
図5は、システム構成情報テーブル302を示す図である。図5にはシステム構成情報テーブル302の構成例が記載されている。図5を参照すると、システム構成情報テーブル302には、仮想マシン名称302Aと、仮想マシンの構成部位302Bと、その仮想マシンの構成部位302Bに対応する実マシン100の構成部位302Cとが対応付けて記録されている。実マシンの当該構成部位に障害が発生すると、仮想マシンの当該構成部位に影響が及ぶという関係を示している。図5の例では、仮想マシン302A 1の構成部位302B eth2と、実マシンの構成部位302C eth1とが対応している。
この記憶媒体300のシステム構成情報テーブル302は初期値であり、実マシン100におけるメモリ200の仮想マシン・実マシン共有用メモリ区画207にシステム構成情報テーブル209として格納され、使用される。
ここでは、仮想マシン202Aに仮想NIC 222A、222Bが用いられ、仮想NIC 222Aが実マシン100の通信インタフェース261Aに対応づけられ、仮想NIC 222Bが実マシン100の通信インタフェース261Bに対応付けられている。また、仮想マシン202Bに仮想NIC 222C、222Dが用いられ、仮想NIC 222Cが実マシン100の通信インタフェース261Aに対応づけられ、仮想NIC 222Dが実マシン100の通信インタフェース261Bに対応付けられている。通信インタフェース261Aに異常が発生した場合、システム構成情報テーブル302からは、その実マシンの障害の影響が及ぶ対象として、仮想マシン202Aおよび仮想NIC 222Aに相当する仮想マシンの障害部位と、仮想マシン202Bおよび仮想NIC 222Cに相当する仮想マシンの障害部位とが抽出されることになる。
図6は、障害部位識別部212が実施する処理フローの例を示すフローチャートである。障害部位識別部212は、抽象化変換部211から障害通知のメッセージを受信すると(ステップS701)、受信したメッセージを解析して実マシンの障害部位の情報を切り出し(ステップS702)、システム情報テーブル209を参照し(ステップS703)、その実マシンの障害部位が仮想マシンの構成部位に対応付けられているか否か判定する(ステップS704)。
実マシンの障害部位が仮想マシンの構成部位に対応付けられていれば、障害部位識別部212は、受信したメッセージの障害部位を仮想マシンの構成部位に書き換える(ステップS705)。更に、障害部位識別部212はシステム構成情報テーブル209を参照し、その障害部位に対応する仮想マシン名称を取得し、取得された仮想マシン名称の仮想マシンに、通信インタフェース261Aまたは通信インタフェース261Bを介して障害通知を送信する(ステップS707)。このとき、障害部位識別部212は、対応づけを行なって障害部位を変換したことを示す情報を付加して障害通知を送信する。
一方、実マシンの障害部位が仮想マシンの部位に対応づけられていなければ、障害部位識別部212は、障害部位の情報の書き換え行わない(ステップS706)。そして、障害部位識別部212は、システム構成情報テーブル209を参照し、全ての仮想マシン名称を取得し、通信インタフェース261Aまたは通信インタフェース261Bより全ての仮想マシンに障害通知を送信する(ステップS708)。このとき、障害部位識別部212は、対応づけを行なったことを示す情報を付加せずに障害通知を送信する。
図7は、実マシン仮想マシン間障害通知部204Aが実施する処理フローの一例を示すフローチャートである。
実マシン仮想マシン間障害通知部204Aは、実マシン100から障害通知のメッセージを受信すると(ステップS901)、その障害通知のメッセージがステップS707またはステップS708により付加された情報より実マシンの障害部位が仮想マシンの構成部位に対応づけて変換されたものであるか否か判断する(ステップS902)。
実マシンの障害部位が仮想マシンの構成部位に対応づけされていれば、実マシン仮想マシン間障害通知部204Aは、その障害通知の情報を仮想マシン障害情報処理部203A’へ通知する(ステップS903)。
一方、実マシンの障害部位が仮想マシンの構成部位に対応付けされていなければ、実マシン仮想マシン間障害通知部204Aは、その障害通知の情報を実マシン障害情報処理部203Aへ通知する(ステップS904)。
なお、実マシンの障害を記録する実マシン障害記憶領域と、仮想マシンの障害を記録する仮想マシン障害記憶領域とを設けておくことにしても良い。実マシンの障害部位が仮想マシンの構成部位に対応づけされていた障害通知は、仮想マシン障害記憶領域に記録し、実マシンの障害部位が仮想マシンの構成部位に対応づけられていなかった障害通知は、実マシン障害記憶領域に記録すればよい。そして、実マシン障害情報処理部203Aは実マシン障害記憶領域から障害の情報を読み出して処理し、仮想マシン障害情報処理部203A’は仮想マシン障害記憶領域から障害の情報を読み出して処理すればよい。仮想マシン障害記憶領域から読み出される障害の種別に対して、どのような処理を行うかは予め定められている。
例えば、メッセージ種別と障害が起こった仮想マシンの構成部位との組み合わせに対して、実行すべき処理を予め定めておけばよい。
抽象化されたメッセージ種別が一種類の場合、そのメッセージ種別の障害が発生したときに障害箇所に対応する処理を予め定めておけばよい。また、重度障害、軽度障害、警報というように抽象化されたメッセージ種別が複数うの場合、各メッセージ種別と障害箇所とから定まる処理を予め定めておけばよい。例えば、重度の障害が特定の仮想NICに起こった場合、ログデータを取得し、稼働系と待機系の切り替えを実施するというように定めておけばよい。
これにより、実マシン障害情報処理部203Aと仮想マシン障害情報処理部203A’とが容易に作業を分担し、所望の処理を実行することが可能となる。
また、本実施例では、異常検知部240から出力されたメッセージを抽象化してから仮想マシン202A、202Bに送り、仮想マシン202A、202Bが抽象化されたメッセージ種別に基づいて実行すべき処理を決定する例を示したが、本発明がこれに限定されることは無い。他の例として、仮想マシン202A、202Bは抽象化されていないメッセージ種別のメッセージを受信し、抽象化し、抽象化されたメッセージ種別に基づいて実行する処理を決定することにしてもよい。その場合、図2における、抽象化変換部211に相当する処理部を仮想マシン202A、202Bの内部に配置するとよい。
以上、本実施例によれば、実マシン100で発生した障害を通知するメッセージを、抽象化変換部211が抽象化された障害通知のメッセージに変換し、障害部位識別部212が、障害部位を仮想マシンの部位に変換できるものは変換し、実マシン仮想マシン間障害通知部204Aが、仮想マシンの障害に対する処理を実施する仮想マシン障害情報処理部203A’と、実マシンの障害に対する処理を実施する実マシン障害情報処理部203Aとに振り分けて通知することができる。
上述した本発明の実施形態および実施例は、本発明の説明のための例示であり、本発明の範囲をそれらの実施形態や実施例のみに限定する趣旨ではない。当業者は、本発明の要旨を逸脱することなしに、他の様々な態様で本発明を実施することができる。
100…実マシン、200…メモリ、201…障害部位識別部、201A,201B…仮想マシン用論理区画、202A,202B…仮想マシン、203A,203B…仮想マシン障害情報処理部、203A’,203B’…実マシン障害情報処理部、204A,204B…実マシン仮想マシン間障害通知部、205A,205B…仮想マシン用オペレーティングシステム、206…仮想マシン・実マシン共有用情報インターフェース、206A,206B…仮想デバイスドライバ、207…仮想マシン・実マシン共有用メモリ区画、208…抽象化情報テーブル、209…システム構成情報テーブル,210…障害部位対応部、211…抽象化変換部、212…障害部位識別部、220…仮想環境制御部、221…障害種別判断部、222A〜D…仮想NIC、230…実マシン用オペレーティングシステム、240…異常検知部、250…プロセッサ、260…ディスクインタフェース、261A,261B…通信インタフェース、262…通信路、300…記憶媒体、301…抽象化情報テーブル、301B…メッセージ種別、301C…抽象化メッセージ種別、302…システム構成情報テーブル、302A…仮想マシン名称、302B…構成部位、302C…構成部位、400,500…LAN、600…仮想化サーバーシステム

Claims (6)

  1. 実マシン上に仮想マシンが構築される計算機であって、
    前記実マシン上で発生する障害を検知する実マシン異常検知手段と、
    前記実マシン異常検知手段で検知された前記障害の障害種別を、仮想マシンで処理するように抽象化された障害種別に変換する抽象化変換手段と、
    前記実マシン異常検知手段で検知された前記障害の障害発生部位を、仮想マシンにおける障害発生部位に変換する障害部位識別手段と、
    前記障害部位識別手段による変換で得られた前記障害発生部位に関連する仮想マシンに、前記抽象化変換手段による変換で得られた前記抽象化された障害種別の障害通知を送る障害通知手段と、
    を有する計算機。
  2. 前記計算機が、前記実マシンにおける障害種別と、前記抽象化された障害種別との対応関係を示す抽象化情報を記憶する抽象化情報記憶手段を更に有し、
    前記抽象化変換手段は、前記実マシン異常検知手段で検知された前記障害の障害種別を、前記抽象化情報を参照することにより、抽象化された障害種別に変換する、
    請求項1に記載の計算機。
  3. 前記計算機が、前記実マシンにおける障害発生部位と前記仮想マシンにおける障害発生部位との対応関係を示すシステム構成情報を記憶するシステム構成情報記憶手段を更に有し、
    前記障害部位識別手段は、前記実マシン異常検知手段で検知された前記障害の障害発生部位を、前記システム構成情報を参照することにより、仮想マシンにおける障害発生部位に変換する、
    請求項1または2に記載の計算機。
  4. 前記仮想マシンは、実マシンの障害を処理する実マシン障害情報処理手段と、仮想マシンの障害を処理する仮想マシン障害情報処理手段とを別個に有し、
    前記障害通知手段は、前記障害部位識別手段で障害発生部位が変換された障害通知と、障害は障害発生部位が変換されなかった障害通知とを区別できるように、前記仮想マシンに通知し、
    前記仮想マシン障害情報処理手段は、前記仮想マシンで発生した障害に対する処理を実行し、
    前記実マシン障害情報処理手段は、前記障害通知手段から通知された障害通知のうち少なくとも前記障害部位識別手段で障害発生部位が変換された障害通知に対する処理を実行する、
    請求項1から3のいずれか一項に記載の計算機。
  5. 実マシン上に仮想マシンが構築される計算機における障害処理方法であって、
    実マシン異常検知手段が、前記実マシン上で発生する障害を検知するステップと、
    抽象化変換手段が、前記実マシン障害検出手段で検知された前記障害の障害種別を、仮想マシンで処理するように抽象化された障害種別に変換するステップと、
    障害部位識別手段が、前記実マシン障害検出手段で検知された前記障害の障害発生部位を、仮想マシンにおける障害発生部位に変換するステップと、
    障害通知手段が、前記障害部位識別手段による変換で得られた前記障害発生部位に関連する仮想マシンに、前記抽象化変換手段による変換で得られた前記抽象化された障害種別の障害通知を送るステップと
    を有する障害処理方法。
  6. 実マシン上に仮想マシンが構築される計算機が実行する障害処理プログラムであって、
    実マシン異常検知手段が、前記実マシン上で発生する障害を検知する手順と、
    抽象化変換手段が、前記実マシン障害検出手段で検知された前記障害の障害種別を、仮想マシンで処理するように抽象化された障害種別に変換する手順と、
    障害部位識別手段が、前記実マシン障害検出手段で検知された前記障害の障害発生部位を、仮想マシンにおける障害発生部位に変換する手順と、
    障害通知手段が、前記障害部位識別手段による変換で得られた前記障害発生部位に関連する仮想マシンに、前記抽象化変換手段による変換で得られた前記抽象化された障害種別の障害通知を送る手順と、
    を計算機に実行させるための障害処理プログラム。
JP2012183788A 2012-08-23 2012-08-23 計算機とその障害処理方法およびプログラム Active JP5806987B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012183788A JP5806987B2 (ja) 2012-08-23 2012-08-23 計算機とその障害処理方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012183788A JP5806987B2 (ja) 2012-08-23 2012-08-23 計算機とその障害処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2014041506A true JP2014041506A (ja) 2014-03-06
JP5806987B2 JP5806987B2 (ja) 2015-11-10

Family

ID=50393707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012183788A Active JP5806987B2 (ja) 2012-08-23 2012-08-23 計算機とその障害処理方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5806987B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115858222A (zh) * 2022-12-19 2023-03-28 安超云软件有限公司 一种虚拟机故障处理方法、系统及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000209201A (ja) * 1999-01-11 2000-07-28 Fujitsu Ltd ネットワ―ク管理方法及びネットワ―ク管理システム
WO2009110111A1 (ja) * 2008-03-04 2009-09-11 三菱電機株式会社 サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000209201A (ja) * 1999-01-11 2000-07-28 Fujitsu Ltd ネットワ―ク管理方法及びネットワ―ク管理システム
WO2009110111A1 (ja) * 2008-03-04 2009-09-11 三菱電機株式会社 サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115858222A (zh) * 2022-12-19 2023-03-28 安超云软件有限公司 一种虚拟机故障处理方法、系统及电子设备
CN115858222B (zh) * 2022-12-19 2024-01-02 安超云软件有限公司 一种虚拟机故障处理方法、系统及电子设备

Also Published As

Publication number Publication date
JP5806987B2 (ja) 2015-11-10

Similar Documents

Publication Publication Date Title
JP4882845B2 (ja) 仮想計算機システム
US10089028B2 (en) Remote secure drive discovery and access
JP2008299509A5 (ja)
JPWO2009110111A1 (ja) サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム
US20070165520A1 (en) Port trunking between switches
EP2740255A1 (en) Hardware failure mitigation
WO2013101082A1 (en) Reset of processing core in multi-core processing system
US10102088B2 (en) Cluster system, server device, cluster system management method, and computer-readable recording medium
JP5712714B2 (ja) クラスタシステム、仮想マシンサーバ、仮想マシンのフェイルオーバ方法、仮想マシンのフェイルオーバプログラム
JP5535471B2 (ja) マルチパーティション・コンピュータシステム、障害処理方法及びそのプログラム
JP5806987B2 (ja) 計算機とその障害処理方法およびプログラム
JP2014007609A (ja) 仮想化システム、通信装置及びネットワーク障害監視方法
JP2012038257A (ja) Os動作状態確認システム、確認対象装置、os動作状態確認装置、os動作状態確認方法およびプログラム
WO2017018435A1 (ja) リソース監視装置、仮想ネットワークファンクション管理システム、リソース監視方法及びプログラム
JP7107789B2 (ja) 情報処理システム、情報処理方法、及び、プログラム
JP6134720B2 (ja) 接続方法
US9996437B2 (en) Failover in a san environment
JP2009110218A (ja) 仮想化スイッチおよびそれを用いたコンピュータシステム
US10089200B2 (en) Computer apparatus and computer mechanism
JP6212131B2 (ja) 計算機、計算機制御方法、および計算機制御プログラム
JP2016206898A (ja) 情報処理装置および障害検知方法、並びにコンピュータ・プログラム
JP6944799B2 (ja) 情報処理装置
JP6760888B2 (ja) 冗長化システムおよびハードウェア障害検出方法
CN112637336B (zh) 一种虚拟机高可用实现方法、装置及存储介质
JP7311335B2 (ja) 分散型コンテナ監視システム及び分散型コンテナ監視方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140718

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150907

R150 Certificate of patent or registration of utility model

Ref document number: 5806987

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150