JP7405260B2

JP7405260B2 - サーバメンテナンス制御装置、システム、制御方法及びプログラム

Info

Publication number: JP7405260B2
Application number: JP2022534888A
Authority: JP
Inventors: 奨悟斎藤; 直樹高田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2020-07-10
Filing date: 2020-09-08
Publication date: 2023-12-26
Anticipated expiration: 2040-09-08
Also published as: WO2022009410A1; JPWO2022009438A1; WO2022009438A1; US20230289203A1

Description

本発明は、物理サーバをオンデマンドにユーザに割り当てて、この物理サーバ上の仮想マシンを利用させるシステムにおいて、物理サーバに接続されているデバイスの故障の検知と、このデバイスのメンテナンスに用いるサーバメンテナンス制御装置、サーバメンテナンスシステム、サーバメンテナンス制御方法、及び、プログラムに関する。

近年、仮想化基盤が普及している。仮想化基盤は、仮想化技術を用いて物理サーバやネットワークといった物理資源を抽象化・隠蔽し、複数のアプリケーションやサービスに対して共通基盤を提供するシステムである。仮想化基盤の物理サーバは、ユーザの要求に応じてオンデマンドでユーザに割り当てられる。また、仮想化基盤の物理サーバには、例えばＧＰＵ（graphics processing unit）やＦＰＧＡ（field programmable gate array）
、ＮＩＣ（network interface card）等の、複数の各種外部デバイス（以下、「デバイス」と称する）が接続されている。

各ユーザは、各物理サーバに対してリソースを要求し、物理サーバにデプロイされた仮想マシンを一時的に利用する。このとき、各仮想マシンは、任意の数のデバイスを利用する。各デバイスは、不定期にメンテナンスを行う必要がある。デバイスのメンテナンス中、仮想マシンはメンテナンス対象デバイスを利用できない。

従来、デバイスのメンテナンスでは、コントローラサーバにより以下のような処理が行われている（例えば、非特許文献１参照）。
（１）メンテナンス対象デバイスが接続された物理サーバ全体を警報監視の対象外に設定する。
（２）メンテナンス対象デバイスが接続された物理サーバを利用中のユーザのインスタンス（仮想マシン）を他のサーバに退避（移行）させる。

「open stack 運用ガイド第12章メンテナンス、故障およびデバッグ」、［online］、［令和２年６月１０日検索］、インターネット<URL:http://openstack-ja.github.io/openstack-manuals/openstack-ops/content/maintenance.html>

しかしながら、この従来技術では、メンテナンス対象デバイスを利用していないインスタンス（仮想マシン）まで退避（移行）させていた。そのため、メンテナンス対象デバイスを利用していないインスタンス（仮想マシン）が一時停止する等の影響を与えてしまっていた。

また、この従来技術では、物理サーバ全体を警報監視の対象外としているため、メンテナンス対象デバイスを利用していないインスタンス（仮想マシン）の警報も抑止されてしまっていた。更に、デバイス故障時には、このデバイスをメンテナンスしなければならないが、このときに正しい手順でメンテナンスしないと、メンテナンス対象デバイスを利用していないインスタンス（仮想マシン）が停止したり、デバイスのメンテナンスに伴う警報が発生していた。

本発明は、前記した問題点を解決するためになされたものであり、メンテナンス対象デバイスが接続された物理サーバ上でこのデバイスを利用しない仮想マシンの他の物理サーバへの退避処理を抑止するとともに、デバイスのメンテナンスに伴う警報の発出を抑止するサーバメンテナンス制御装置、サーバメンテナンスシステム、サーバメンテナンス制御方法、及び、プログラムを提供することを主な課題とする。更に、デバイス故障検知をトリガとしてデバイスのメンテナンスを行うことを課題とする。

前記した課題を解決するため、本発明に係るサーバメンテナンス制御装置は、ユーザが管理する仮想マシンに対して、サーバに接続されたデバイスを割り当てる割当部と、前記仮想マシンとそれが利用するデバイスとの対応を記録する利用状況管理部と、メンテナンス時に各前記デバイスに発生しうる警報種別を記録する警報関係管理部と、メンテナンス要求を受け付けると、メンテナンス時に前記デバイスに発生しうる警報の発出の抑止指示と前記仮想マシンのうちメンテナンスにより影響を受ける影響仮想マシンの他のサーバへの退避指示との順序を決定するメンテナンス制御部と、前記警報関係管理部に記録された前記警報種別に基づいて前記メンテナンス時にデバイスに発生しうる警報の発出の抑止を前記サーバに指示する警報除外設定部と、前記利用状況管理部に記録された前記仮想マシンとそれが利用するデバイスとの対応に基づいて前記影響仮想マシンを特定して前記サーバから前記他のサーバに退避させる影響ユーザ特定退避部と、を有することを特徴とする。

本発明によれば、メンテナンス対象デバイスが接続された物理サーバ上で、このデバイスを利用しない仮想マシンの他の物理サーバへの退避処理を抑止するとともに、デバイスのメンテナンスに伴う警報の発出を抑止することができる。更に、デバイス故障検知をトリガとしてデバイスのメンテナンスを行うことができる。

第１の実施形態に係るコントローラサーバ（サーバメンテナンス制御装置）を含むサーバシステムの全体構成と動作の説明図（１）である。第１の実施形態に係るコントローラサーバ（サーバメンテナンス制御装置）を含むサーバシステムの全体構成と動作の説明図（２）である。第１の実施形態に係るコントローラサーバ（サーバメンテナンス制御装置）を含むサーバシステムの全体構成と動作の説明図（３）である。コントローラサーバの構成ブロック図である。利用状況データベースの説明図である。警報関係データベースの説明図である。コントローラサーバの全体の動作を表すフローチャートである。警報関係記録時のコントローラサーバの動作を表すフローチャートである。メンテナンス準備時のコントローラサーバの動作を表すフローチャートである。第２の実施形態に係るコントローラサーバ（サーバメンテナンス制御装置）を含むサーバシステムの全体構成と動作の説明図である。コントローラサーバの構成ブロック図である。警報監視システムの構成ブロック図である。デバイス故障データベースの説明図である。利用状況データベースへの登録処理のフローチャートである。警報関係データベースへの登録処理のフローチャートである。デバイスの故障検知処理と仮想マシンの退避処理のフローチャートである。デバイスの故障検知処理と仮想マシンの退避処理のフローチャートである。

以下、図面を参照して、本発明の実施の形態（以下、「本実施形態」と称する）について詳細に説明する。なお、各図は、本発明を十分に理解できる程度に、概略的に示しているに過ぎない。よって、本発明は、図示例のみに限定されるものではない。また、各図において、共通する構成要素や同様な構成要素については、同一の符号を付し、それらの重複する説明を省略する。

《第１の実施形態》
＜サーバシステムの全体構成と動作＞
以下、図１Ａ乃至図１Ｃを参照して、第１の実施形態に係るコントローラサーバ１０を含むサーバシステム１００（サーバメンテナンスシステム）の全体構成と動作について説明する。図１Ａ乃至図１Ｃは、それぞれ、第１の実施形態に係るコントローラサーバ１０（サーバメンテナンス制御装置）を含むサーバシステム１００の全体構成と動作の説明図である。

図１Ａ乃至図１Ｃに示すように、サーバシステム１００は、コントローラサーバ１０と、複数の物理サーバと、メンテナンス指示装置９１と、警報監視システム９２と、を備えている。第１の実施形態では、サーバシステム１００が第１サーバ２０ａと第２サーバ２０ｂの２つの物理サーバを備えている場合を想定して説明する。ただし、物理サーバの数は３つ以上であってもよい。

コントローラサーバ１０は、物理サーバのメンテナンス処理を制御するサーバメンテナンス制御装置として機能するコンピュータである。
各物理サーバ（第１の実施形態では、第１サーバ２０ａと第２サーバ２０ｂ）は、ユーザに仮想化環境を提供するコンピュータである。
メンテナンス指示装置９１は、各物理サーバに接続された外部デバイスのメンテナンス時に、メンテナンス要求Ｒｑ（図１Ｂ参照）をコントローラサーバ１０に送信する端末装置である。
警報監視システム９２は、各物理サーバから発出される警報を監視して管理者等に通知するシステムである。

各物理サーバには、それぞれ、各種の複数の外部デバイスが電気的に接続されている。複数の外部デバイスは、例えばＧＰＵ（graphics processing unit）やＦＰＧＡ（field programmable gate array）、ＮＩＣ（network interface card）等である。以下、これ
らの外部デバイスを単に「デバイス」と称する。

例えば、図１Ａに示す例では、第１サーバ２０ａには、第１デバイス３１ａと第２デバイス３２ａと第３デバイス３３ａとが接続されている。同様に、第２サーバ２０ｂには、第１デバイス３１ｂと第２デバイス３２ｂと第３デバイス３３ｂとが接続されている。第１サーバ２０ａに接続されたデバイスと第２サーバ２０ｂに接続されたデバイスとは、同種のものになっている。つまり、第１サーバ２０ａの第１デバイス３１ａと第２サーバ２０ｂの第１デバイス３１ｂは、同種のものになっている。また、第１サーバ２０ａの第２デバイス３２ａと第２サーバ２０ｂの第２デバイス３２ｂは、同種のものになっている。また、第１サーバ２０ａの第３デバイス３３ａと第２サーバ２０ｂの第３デバイス３３ｂは、同種のものになっている。なお、第１サーバ２０ａと第２サーバ２０ｂは、３つ以上のデバイスを接続することもできる。

なお、ＧＰＵやＦＰＧＡ等のデバイスは、ＣＰＵ（central processing unit）と異な
り、内部状態の一時退避（移行）に特化した機能を持たないことが多い。そのため、ＧＰＵやＦＰＧＡ等のデバイスは、ソフトウェアによる退避処理が必要であり、その退避処理に比較的長い時間を要する。つまり、ＧＰＵやＦＰＧＡ等のデバイスは、退避時の設定コストが比較的高いデバイスになっている。物理サーバに接続された複数のデバイスの中には、このようなＧＰＵやＦＰＧＡ等のデバイスが含まれている。そのため、或るデバイスのメンテナンス作業においても、メンテナンス対象のデバイスを利用しない他の仮想マシンを退避させず、継続して利用できることが好ましい。

また、各物理サーバには、発出すべきでない警報（監視の対象外の警報）をフィルタしてその警報の発出を抑止するためのフィルタ設定部が設けられている。例えば、第１サーバ２０ａには、フィルタ設定部２６ａが設けられている。同様に、第２サーバ２０ｂには、フィルタ設定部２６ｂが設けられている。第１の実施形態では、フィルタ設定部２６ａ，２６ｂは、デバイスのメンテナンスに伴う警報の発出を抑止する際に動作する。

コントローラサーバ１０には、記憶媒体９９から、コンピュータをサーバメンテナンス制御装置として機能させるための制御プログラムＰｒが予めインストールされている。コントローラサーバ１０は、各物理サーバ（第１の実施形態では、第１サーバ２０ａと第２サーバ２０ｂ）と、メンテナンス指示装置９１とに通信可能に接続されている。

コントローラサーバ１０は、制御プログラムＰｒを実行することにより、図２に示す構成を内部に構築する。これにより、コントローラサーバ１０は、以下の第１機能乃至第６機能を実現する。

割当部１１ａは、ユーザの仮想マシンへのデバイスの割当機能（第１機能）を具現化するものである（図１Ａ及び図１Ｂ参照）。「ユーザへのデバイスの割当機能」とは、ユーザが管理する各仮想マシンに対して、サーバに接続されたデバイスを任意の数だけ割り当てる機能である。

利用状況管理部１１ｂは、デバイスの利用状況記録機能（第２機能）を具現化するものである（図１Ａ及び図１Ｂ参照）。「デバイスの利用状況記録機能」とは、ユーザが管理する各仮想マシンと、この仮想マシンが利用するデバイスとの対応を記録する機能である。デバイスの利用状況記録機能は、この利用状況管理部１１ｂと、後記する利用状況データベース１２ａ（図２参照）によって実現される。

警報関係管理部１１ｃは、警報関係記録機能（第３機能）を具現化するものである（図１Ａ及び図１Ｂ参照）。「警報関係記録機能」とは、デバイスと、このデバイスのメンテナンス時に発生しうる警報種別との対応を記録管理する機能であり、即ち、各デバイスとそれのメンテナンス時に監視の除外対象となる除外対象警報種別との対応関係を記録管理する。警報関係記録機能は、この警報関係管理部１１ｃと、後記する警報関係データベース１２ｂ（図２参照）によって実現される。

メンテナンス制御部１１ｄは、メンテナンス要求受付機能（第４機能）を具現化するものである（図１Ｂ参照）。「メンテナンス要求受付機能」とは、外部のメンテナンス指示装置９１からデバイスのメンテナンス要求Ｒｑ（図１Ｂ参照）を受け付けると、デバイスのメンテナンス時に発生しうる警報の発出の除外（抑止）指示とデバイスのメンテナンスにより影響を受ける仮想マシンの他の物理サーバへの退避指示との順序を決定する機能である。以下、デバイスのメンテナンスにより影響を受ける仮想マシンを「影響仮想マシン」と称する。

警報除外設定部１１ｅは、警報除外設定機能（第５機能）を具現化するものである（図１Ｂ参照）。「警報除外設定機能」とは、デバイスのメンテナンスにより発生しうる警報の発出の除外（抑止）を物理サーバに指示する機能である。

影響ユーザ特定退避部１１ｆは、影響ユーザ特定・退避機能（第６機能）を具現化するものである（図１Ｂ参照）。「影響ユーザ特定・退避機能」とは、影響仮想マシンを特定して、この影響仮想マシンを物理サーバ（第１の実施形態では、第１サーバ２０ａ）から他の物理サーバ（第１の実施形態では、第２サーバ２０ｂ）に退避させる機能である。

物理サーバは、複数のユーザ端末からの要求に応じて、オンデマンドに提供される。各ユーザは、提供された物理サーバ上の仮想マシンを利用する。例えば、図１Ａに示す例では、第１サーバ２０ａは、第１ユーザが使用する第１ユーザ端末６１ａからの要求に応じて、オンデマンドで第１ユーザに提供される。第１ユーザは、第１ユーザ端末６１ａを介して、この第１サーバ２０ａ上の第１仮想マシン２１ａを利用する。また、第１サーバ２０ａは、第２ユーザが使用する第２ユーザ端末６１ｂからの要求に応じて、オンデマンドで第２ユーザに提供される。第２ユーザは、第２ユーザ端末６１ｂを介して、この第１サーバ２０ａ上の第２仮想マシン２２ａを利用する。

各ユーザは、オンデマンドに各仮想マシンに対してリソースを要求し、一時的に仮想マシンを利用する。このとき、各仮想マシンは、任意の数のデバイスを利用する。例えば、図１Ａに示す例では、第１ユーザは、オンデマンドに第１仮想マシン２１ａに対して、リソースである第１デバイス３１ａを要求する。このとき、第１仮想マシン２１ａは、第１デバイス３１ａを利用する。第２ユーザは、オンデマンドに第２仮想マシン２２ａに対して、リソースである第２デバイス３２ａと第３デバイス３３ａを要求する。このとき、第２仮想マシン２２ａは、第２デバイス３２ａと第３デバイス３３ａを利用する。

第１仮想マシン２１ａは、第１デバイス３１ａが接続されており、第１ユーザ端末６１ａに仮想化環境を提供する。一方、第２仮想マシン２２ａは、第２デバイス３２ａと第３デバイス３３ａとが接続されており、第２ユーザ端末６１ｂに仮想化環境を提供する。
第１デバイス３１ａや第２デバイス３２ａや第３デバイス３３ａは、それぞれ不定期にメンテナンス作業が必要となる。デバイスのメンテナンス中に、仮想マシンは当該デバイスを利用できない。

各物理サーバは、予め規定された異常を検知した場合に、能動的に警報Ｗａ（図１Ｃ参照）を警報監視システム９２に発出する。これに応答して、警報監視システム９２は、管理者等に警報を発出する。

図１Ｂに示すように、任意のタイミングでメンテナンス指示装置９１からコントローラサーバ１０にメンテナンス要求Ｒｑが出力される。メンテナンス要求Ｒｑは、メンテナンス対象であるデバイス（以下、「メンテナンス対象デバイス」と称する）を指定する形態になっている。

ここでは、メンテナンス要求Ｒｑがメンテナンス対象デバイスとして第３デバイス３３ａを指定しているものとして説明する。この場合、メンテナンス対象デバイスである第３デバイス３３ａを利用している第２仮想マシン２２ａは、影響仮想マシンとなる。

コントローラサーバ１０は、メンテナンス要求Ｒｑに応答して、メンテナンス制御部１１ｄ（第４機能）によりメンテナンス要求を受け付ける。そして、コントローラサーバ１０は、警報除外設定部１１ｅ（第５機能）により物理サーバに警報除外設定を行うとともに、影響ユーザ特定退避部１１ｆ（第６機能）により影響仮想マシンを特定して退避させる。ここで影響ユーザ特定退避部１１ｆが退避させるのは、影響仮想マシンである第２仮想マシン２２ａに限られる。影響ユーザ特定退避部１１ｆは、第１仮想マシン２１ａを退避しない。

このとき、コントローラサーバ１０は、警報除外設定部１１ｅ（第５機能）により、デバイスのメンテナンスに伴う警報の発出の除外（抑止）を指示するための警報除外設定指示Ｃｍ１を第１サーバ２０ａに出力する。警報除外設定指示Ｃｍ１に応答して、第１サーバ２０ａは、フィルタ設定部２６ａに対して、メンテナンス対象デバイスである第３デバイス３３ａのメンテナンスに伴う警報の発出を除外（抑止）するためのフィルタ設定を行う。

また、コントローラサーバ１０は、影響ユーザ特定退避部１１ｆ（第６機能）により、影響仮想マシンの他のサーバへの退避（移行）を指示するための退避指示Ｃｍ２を第１サーバ２０ａに出力する。退避指示Ｃｍ２に応答して、第１サーバ２０ａは、影響仮想マシンである第２仮想マシン２２ａを第２サーバ２０ｂへ退避（移行）する。

その結果、図１Ｃに示すように、第２ユーザ端末６１ｂは、第２サーバ２０ｂに構築された第２仮想マシン２２ｂに接続される。そして第２サーバ２０ｂの第２仮想マシン２２ｂは、第２デバイス３２ｂ及び第３デバイス３３ｂを利用して、第２仮想マシン２２ａと同じ仮想化環境を第２ユーザに提供する。
このとき、第３デバイス３３ａのメンテナンス作業においても、第３デバイス３３ａを利用しない第１仮想マシン２１ａを退避させず、継続して利用できる。

＜コントローラサーバ（サーバメンテナンス制御装置）の構成＞
以下、図２を参照して、コントローラサーバ１０（サーバメンテナンス制御装置）の構成について説明する。図２は、コントローラサーバ１０の構成ブロック図である。

図２に示すように、コントローラサーバ１０は、制御部１１と、記憶部１２と、通信部１９と、を備えている。

制御部１１は、割当部１１ａと、利用状況管理部１１ｂと、警報関係管理部１１ｃと、メンテナンス制御部１１ｄと、警報除外設定部１１ｅと、影響ユーザ特定退避部１１ｆと、を有している。制御部１１は、このコントローラサーバ１０のＣＰＵであり、制御プログラムＰｒを実行することにより、各部の機能を具現化する。

割当部１１ａは、物理サーバに対し、ユーザが管理する仮想マシンに対して、サーバに接続されたデバイスを任意の数だけ割り当てる。これにより、仮想マシンは割り当てられたデバイスを利用できる。

利用状況管理部１１ｂは、各ユーザが管理する仮想マシンと、この仮想マシンが利用するデバイスとの対応を記録する。
警報関係管理部１１ｃは、デバイスと、このデバイスのメンテナンス時に発生しうる警報種別との対応を記録する。

メンテナンス制御部１１ｄは、外部のメンテナンス指示装置９１などからデバイスのメンテナンス要求Ｒｑを受け付けて、デバイスのメンテナンスにより発生しうる警報の発出の除外（抑止）指示とデバイスのメンテナンスにより影響を受けるユーザの仮想マシンである影響仮想マシンの他の物理サーバへの退避指示との順序を決定する。第１の実施形態において、メンテナンス制御部１１ｄは、警報除外設定指示Ｃｍ１（図１Ｂ参照）が退避指示Ｃｍ２（図１Ｂ参照）よりも早く第１サーバ２０ａに出力されるようにする。

警報除外設定部１１ｅは、警報関係管理部１１ｃにより記録された警報種別に基づいてデバイスのメンテナンスにより発生しうる警報の発出の除外（抑止）を物理サーバに指示する。
影響ユーザ特定退避部１１ｆは、メンテナンス対象のデバイスＩＤをキーとして、デバイスとこのデバイスを利用する仮想マシンとの対応に基づいて影響仮想マシンを特定して、この影響仮想マシンを他の物理サーバに退避させる。デバイスとこのデバイスを利用する仮想マシンとの対応は、利用状況管理部１１ｂにより利用状況データベース１２ａに記録されている。

記憶部１２には、制御プログラムＰｒが格納されている。また、記憶部１２には、利用状況データベース１２ａと警報関係データベース１２ｂとが構築されている。

利用状況データベース１２ａ（第１データベース）は、ユーザへのデバイス割当機能であり、各ユーザが管理する仮想マシンと、それが利用するデバイスとの対応を記録する。
警報関係データベース１２ｂ（第２データベース）は、各デバイスと、メンテナンス時にこのデバイスに発生しうる警報種別との対応を記録する。

＜利用状況データベースの構成＞
以下、図３を参照して、利用状況データベース１２ａの構成について説明する。図３は、利用状況データベース１２ａの説明図である。

利用状況データベース１２ａは、ユーザの仮想マシンを識別するユーザＩＤと、この仮想マシンが利用するデバイスのデバイスＩＤとを対応付けている。図３に示す例では、第１ユーザの第１仮想マシン２１ａに対して第１デバイス３１ａが対応付けられている。また、第２ユーザの第２仮想マシン２２ａに対して第２デバイス３２ａと第３デバイス３３ａとが対応付けられている。

影響ユーザ特定退避部１１ｆは、メンテナンス要求受付時に、利用状況データベース１２ａを参照してメンテナンス要求で指定されたメンテナンス対象デバイスを利用する仮想マシンを、影響仮想マシンとして特定する。このようにすることで、影響ユーザ特定退避部１１ｆは、メンテナンス対象デバイスのデバイスＩＤに紐づく仮想マシンを容易かつ短時間に特定することができる。

＜警報関係データベースの構成＞
以下、図４を参照して、警報関係データベース１２ｂの構成について説明する。図４は、警報関係データベース１２ｂの説明図である。

警報関係データベース１２ｂは、デバイスＩＤと除外対象警報種別とを対応付けている。ここで、「除外対象警報種別」は、デバイスＩＤで示されるデバイスのメンテナンス時に監視の除外対象とする警報の種別を意味している。図４に示す例では、第１デバイス３１ａに対する除外対象警報種別として「リブート（Reboot）」が対応付けられている。リブートとは、デバイスを再起動することをいう。また、第１デバイス３１ｂ対する除外対象警報種別として「シャットダウン（Shut down）」が対応付けられている。シャットダ
ウンとは、デバイスを終了させて電源を切ることをいう。また、３１ｃに対する除外対象警報種別として「アンアベイラブル（unavailable）」が対応付けられている。アンアベ
イラブルとは、デバイスが使用不能であることをいう。

警報除外設定部１１ｅは、メンテナンス要求受付時に、警報関係データベース１２ｂを参照して、メンテナンス要求で指定されたデバイスのメンテナンスにより発生しうる警報の発出の抑止を物理サーバに指示する。このようにすることで、警報除外設定部１１ｅは、デバイスのメンテナンスにより発生しうる警報の発出を除外（抑止）できる。

＜コントローラサーバ（サーバメンテナンス制御装置）の動作＞
以下、図５乃至図７を参照して、コントローラサーバ１０（サーバメンテナンス制御装置）の動作について説明する。図５は、コントローラサーバ１０の全体の動作を表すフローチャートである。図６は、図５に示すステップＳ１２５の警報関係記録時のコントローラサーバ１０の動作を表すフローチャートである。図７は、図５に示すステップＳ１４０のメンテナンス準備時のコントローラサーバ１０の動作を表すフローチャートである。

図５に示すように、コントローラサーバ１０のメンテナンス制御部１１ｄは、ユーザ端末であるメンテナンス指示装置９１からの要求があるか否かを繰り返し判定し（ステップＳ１０５）、ユーザ端末からの要求があった場合（“Ｙｅｓ”の場合）に、ユーザ端末からの要求を受け付ける（ステップＳ１１０）。このユーザ端末からの要求には、利用するデバイスのＩＤが含まれている。
ステップＳ１０５において、メンテナンス制御部１１ｄは、ユーザ端末からの要求が無かった場合（“Ｎｏ”の場合）に、ステップＳ１０５の処理に戻る。

次に、コントローラサーバ１０の割当部１１ａは、ユーザの仮想マシンに、要求されたデバイスを割り当てる（ステップＳ１１５）。すると、コントローラサーバ１０の利用状況管理部１１ｂが、ユーザが管理する各仮想マシンのＩＤと、この仮想マシンが利用するデバイスのＩＤとの対応を利用状況データベース１２ａに記録することで、デバイスの利用状況を記録する（ステップＳ１２０）。また、コントローラサーバ１０の警報関係管理部１１ｃが、デバイスＩＤと、このデバイスのメンテナンス時に発生しうる警報種別との対応関係を警報関係データベース１２ｂに記録する（ステップＳ１２５）。

ステップＳ１２５では、例えば、図６に示す警報関係記録処理が行われる。
図６に示すように、まず、コントローラサーバ１０の警報関係管理部１１ｃは、ユーザがデバイスの利用を開始した後に、ユーザ端末から各デバイスのメンテナンス時に発生しうる警報種別の入力を受け付ける（ステップＳ１２５ａ）。次に、警報関係管理部１１ｃは、各デバイスのメンテナンス時に発生しうる警報種別を警報関係データベース１２ｂに記録する（ステップＳ１２５ｂ）。なお、各デバイスのメンテナンス時に発生しうる警報種別は、ユーザによって入力される。

警報関係管理部１１ｃは、デバイスのメンテナンス時に発生しうる全ての警報関係の記録が完了したか否かを判定する（ステップＳ１２５ｃ）。ステップＳ１２５ｃにおいて、警報関係管理部１１ｃは、記録が完了していないと判定した場合（“Ｎｏ”の場合）に、処理はステップＳ１２５ｂに戻る。一方、警報関係管理部１１ｃは、記録が完了していると判定した場合（“Ｙｅｓ”の場合）に、図６の処理は終了する。この場合に、処理は、図５のステップＳ１３０に進む。

図５に戻り、ステップＳ１２５の後、コントローラサーバ１０のメンテナンス制御部１１ｄは、メンテナンス指示装置９１からのデバイスのメンテナンス要求Ｒｑがあるか否かを判定する（ステップＳ１３０）。ステップＳ１３０の判定で、デバイスのメンテナンス要求Ｒｑがないと判定された場合（“Ｎｏ”の場合）に、処理はステップＳ１３０に戻る。

一方、デバイスのメンテナンス要求Ｒｑがあると判定された場合（“Ｙｅｓ”の場合）に、メンテナンス制御部１１ｄは、デバイスのメンテナンス要求Ｒｑを受け付ける（ステップＳ１３５）。このとき、メンテナンス制御部１１ｄは、メンテナンスにより発生しうる警報の発出の除外（抑止）指示とメンテナンスにより影響を受ける影響仮想マシンの他の物理サーバへの退避指示との順序を決定する。そしてメンテナンス制御部１１ｄは、メンテナンス準備を行う（ステップＳ１４０）。

ステップＳ１４０では、例えば、図７に示す処理が行われる。
図７に示すように、まず、コントローラサーバ１０のメンテナンス制御部１１ｄは、メンテナンス対象デバイスのメンテナンスにより発生しうる警報の発出の除外（抑止）を警報除外設定部１１ｅに指示する。これに応答して、警報除外設定部１１ｅは、メンテナンス対象デバイスに付されたデバイスＩＤ（以下、「指定デバイスＩＤ」と称する）を引数にして警報関係データベース１２ｂを参照する（ステップＳ１４０ａ）。これにより、警報除外設定部１１ｅは、このデバイスのメンテナンスにより発生しうる警報種別を特定する。そして警報除外設定部１１ｅは、指定デバイスＩＤに紐づく除外対象警報があるか否かを判定する（ステップＳ１４０ｂ）。

ステップＳ１４０ｂの判定で、指定デバイスＩＤに紐づく除外対象警報がないと判定された場合（“Ｎｏ”の場合）に、処理はステップＳ１４０ｄに進む。一方、指定デバイスＩＤに紐づく除外対象警報があると判定された場合（“Ｙｅｓ”の場合）に、警報除外設定部１１ｅは、警報除外設定指示を物理サーバに出力し、この物理サーバのフィルタ設定部に対して指定デバイスＩＤに紐づく除外対象警報種別の警報をフィルタに設定させる（ステップＳ１４０ｃ）。具体的にいうと、図１Ｂに示すように、警報除外設定部１１ｅは、警報除外設定指示Ｃｍ１を第１サーバ２０ａに出力して、第１サーバ２０ａのフィルタ設定部２６ａに対して指定デバイスＩＤに紐づく除外対象警報種別の警報を設定させる。これにより、第１サーバ２０ａは、後記するステップＳ１４５でデバイスのメンテナンスが実行される際に、警報の発出を抑止できる。

ステップＳ１４０ｂの判定で、指定デバイスＩＤに紐づく除外対象警報がないと判定された場合（“Ｎｏ”の場合）、又は、ステップＳ１４０ｃの後、メンテナンス制御部１１ｄは、メンテナンスにより影響を受ける仮想マシンである影響仮想マシンの他の物理サーバへの退避を影響ユーザ特定退避部１１ｆに指示する。これに応答して、影響ユーザ特定退避部１１ｆは、指定デバイスＩＤを引数にして利用状況データベース１２ａを参照する（ステップＳ１４０ｄ）。そして影響ユーザ特定退避部１１ｆは、指定デバイスＩＤのデバイス（すなわち、メンテナンス対象デバイス）を利用中のユーザＩＤがあるか否かを判定する（ステップＳ１４０ｅ）。このユーザＩＤは、影響仮想マシンを識別するものである。ここで、影響ユーザ特定退避部１１ｆは、影響仮想マシンがあるか否かを判定する。

ステップＳ１４０ｅの判定で、このデバイスを利用中のユーザＩＤがあると判定された場合（“Ｙｅｓ”の場合）に、影響ユーザ特定退避部１１ｆは、物理サーバに対し、ユーザＩＤを引数にして影響仮想マシンの退避を指示する（ステップＳ１４０ｆ）。具体的にいうと、図１Ｂに示すように、影響ユーザ特定退避部１１ｆは、第１サーバ２０ａに対して、第３デバイス３３ａを利用中のユーザＩＤを引数にして影響仮想マシンである第２仮想マシン２２ａの退避を指示する。これに応答して、第１サーバ２０ａと第２サーバ２０ｂとの間で、第２仮想マシン２２ａの退避（移行）が行われる。

ステップＳ１４０ｅの判定で、利用中のユーザＩＤがないと判定された場合（“Ｎｏ”の場合）、又は、ステップＳ１４０ｆの後に、ステップＳ１４０の処理は終了する。この場合に、処理は、図５のステップＳ１４５に進む。

図５に戻り、ステップＳ１４０の後、作業者等は、デバイスをメンテナンスし（ステップＳ１４５）、ステップＳ１３０に戻る。

《第２の実施形態》
第２の実施形態のサーバシステム１００Ａでは、デバイス故障をトリガに、デバイス単位でのメンテナンスを自動的に行う機能を追加し、故障発生からデバイス単位でのメンテナンスと、影響のあるユーザのみの退避までの一連の処理を自律的に行う。

以下、図８を参照して、第２の実施形態に係るコントローラサーバ１０Ａを含むサーバシステム１００Ａの全体構成と動作について説明する。図８は、第２の実施形態に係るコントローラサーバ１０Ａ（サーバメンテナンス制御装置）を含むサーバシステムの全体構成と動作の説明図である。

図８に示すサーバシステム１００Ａは、第１の実施形態とは異なるコントローラサーバ１０Ａと警報監視システム９２Ａとを備えている。これ以外の構成は、第１の実施形態のサーバシステム１００と同様である。

コントローラサーバ１０Ａは、サーバのメンテナンス処理を制御するサーバメンテナンス制御装置として機能するコンピュータである。コントローラサーバ１０Ａは、第１の実施形態のコントローラサーバ１０と同様な構成に加えて更に、メンテナンス要求生成部１１ｇを備えている。

警報監視システム９２Ａは、各物理サーバから発出される警報を監視して管理者等に通知するシステムであり、デバイス故障通知部９２１ａと、デバイス故障管理部９２１ｂとを備えている。

デバイス故障通知部９２１ａは、デバイス故障通知機能（第７機能）を具現化するものである（図８及び図９参照）。「デバイス故障通知機能」とは、デバイスの故障に係る故障情報をコントローラサーバ１０Ａのメンテナンス要求生成部１１ｇに通知する機能である。つまりデバイス故障通知部９２１ａは、デバイスを搭載した物理サーバからの通知を入力に、デバイス故障通知機能の各レコードとの比較を行うことで、この通知がデバイス故障であるか否かを判定する。この通知がデバイス故障に係るものであれば、コントローラサーバ１０Ａのメンテナンス要求生成部１１ｇに対し、対象とする物理サーバおよびデバイスを一意に識別する情報とともに、故障の発生を通知する。

デバイス故障通知部９２１ａは、サーバメンテナンス制御装置のメンテナンス要求生成部１１ｇにデバイスの故障を自律的に通知するので、デバイスの故障にいち早く対処できる。

ここでのデバイスを搭載する物理サーバからの通知は、システムログを遠隔サーバに転送するrsyslogやSNMP(Simple Network Management Protocol)である。しかし、これに限
られず、警報監視システム９２Ａがデバイスを搭載する物理サーバに対し、ポーリングによる周期的なチェックを行う形態でもよい。

第２の実施形態のデバイス故障通知部９２１ａは、デバイス故障であることを検知した場合に、自律的にメンテナンス要求生成部１１ｇに通知する。しかし、これに限られず、デバイス故障通知部９２１ａは、デバイス故障であることを検知した場合にオペレータに通知し、そのうえでメンテナンス要求生成部１１ｇに通知するか否かをオペレータが判定してもよい。

また、デバイス故障通知部９２１ａは、コントローラサーバ１０Ａまたは独立したサーバに配置され、警報監視とは独立したインタフェースによって、デバイス故障通知を受け付けてもよい。

デバイス故障管理部９２１ｂは、デバイス故障通知機能を具現化するものである。「デバイス故障通知機能」とは、デバイスの故障に該当する故障情報を、デバイス故障データベース９２２ｂ（図１０参照）に記録する機能である。デバイス故障管理部９２１ｂにより、予め決められた故障情報に限ってメンテナンス要求生成部１１ｇに通知されるので、サーバメンテナンス制御装置の負荷を軽減させることができる。

コントローラサーバ１０Ａは、制御プログラムＰｒを実行することにより、図８に示す構成を内部に構築する。これにより、コントローラサーバ１０Ａは、第１の実施形態と同様な第１機能乃至第６機能に加え、第８機能を実現する。

メンテナンス要求生成部１１ｇは、メンテナンス要求生成機能（第８機能）を具現化するものである。「メンテナンス要求生成機能」とは、警報監視システム９２Ａから通知されたデバイス故障情報と対象サーバ情報とを元に、故障対応のメンテナンス要求をメンテナンス制御部１１ｄに通知する機能である。これにより、デバイスの故障検知をトリガとしてデバイスのメンテナンスを行うことができる。

故障発生時に、警報監視システム９２Ａのデバイス故障通知部９２１ａは、デバイス故障であるか否かを判定する。デバイス故障通知部９２１ａは、デバイス故障であることを判定したならば、オペレータ（ユーザ）に警報を通知すると共に、コントローラサーバ１０のメンテナンス要求生成部１１ｇに通知する。

メンテナンス要求生成部１１ｇは、デバイス故障情報を元に、そのデバイスのメンテナンス要求Ｒｑを生成して、メンテナンス制御部１１ｄに通知する。デバイスのメンテナンス要求Ｒｑには、故障デバイスを一意に識別するデバイスＩＤが含まれている。これにより第２の実施形態は、デバイス故障をユーザに通知しつつ、故障発生時の警報を最小化し、仮想マシンへの影響を最小化する。
以降のサーバシステム１００Ａの動作は、第１の実施形態のサーバシステム１００の動作と同様である。

図９は、コントローラサーバ１０Ａの構成ブロック図である。
図９に示すように、コントローラサーバ１０Ａは、制御部１１Ａと、第１の実施形態と同様な記憶部１２と、通信部１９とを備えている。

制御部１１Ａは、第１の実施形態と同様な割当部１１ａと、利用状況管理部１１ｂと、警報関係管理部１１ｃと、メンテナンス制御部１１ｄと、警報除外設定部１１ｅと、影響ユーザ特定退避部１１ｆとを有している。制御部１１Ａは更に、メンテナンス要求生成部１１ｇを備えている。制御部１１Ａは、このコントローラサーバ１０ＡのＣＰＵであり、制御プログラムＰｒを実行することにより、各部の機能を具現化する。メンテナンス要求生成部１１ｇの機能は、図８で説明済である。

図１０は、警報監視システム９２Ａの構成ブロック図である。
図１０に示すように、警報監視システム９２Ａは、制御部９２１と、記憶部９２２と、通信部９２３とを備えている。

制御部９２１は、デバイス故障通知部９２１ａと、デバイス故障管理部９２１ｂとを有している。制御部９２１は、警報監視システム９２Ａを構成する装置のＣＰＵであり、後記する警報監視プログラム９２２ａを実行することにより、各部の機能を具現化する。

デバイス故障通知部９２１ａは、図８で説明済である。
デバイス故障管理部９２１ｂは、デバイス故障記録機能を具現化するものである。「デバイス故障記録機能」とは、デバイスの故障に該当する故障情報を記録管理する機能である。デバイスの故障記録機能は、このデバイス故障管理部９２１ｂと、後記するデバイス故障データベース９２２ｂによって実現される。

記憶部９２２には、警報監視プログラム９２２ａと、デバイス故障データベース９２２ｂとが格納されている。デバイス故障データベース９２２ｂは、デバイスの故障に該当する故障情報を記録する第３のデータベースである。

図１１は、デバイス故障データベース９２２ｂの説明図である。
図１１に示すように、デバイス故障データベース９２２ｂは、デバイスの故障に該当する故障情報を記録する。“Device Failure”とは、デバイスが動作を失敗した旨の故障情報である。“Error”とは、デバイスの動作中にエラーが発生した旨の故障情報である。
“unavailable”とは、デバイスが使用不能である旨の故障情報である。

図１２は、利用状況データベース１２ａへの登録処理のフローチャートである。
最初、割当部１１ａは、ユーザの仮想マシンへのデバイス割り当てを行い（Ｓ２００）、割当結果を利用状況データベース１２ａに登録すると（Ｓ２０１）、図１２の処理を終了する。これにより利用状況データベース１２ａには、ユーザが管理する各仮想マシンと、この仮想マシンが利用するデバイスとの対応が記録される。

図１３は、警報関係データベース１２ｂへの登録処理のフローチャートである。
ユーザは、端末などを介して除外対象とする警報種別を入力する（Ｓ２１０）。ここで除外対象とする警報種別とは、デバイスのメンテナンス時に発生しうる警報種別のことをいう。

警報関係管理部１１ｃは、入力された除外対象の警報種別のうち１つを警報関係データベース１２ｂに記録する（Ｓ２１１）。そして警報関係管理部１１ｃは、記録が完了したか否かを判定する（Ｓ２１２）。警報関係管理部１１ｃは、記録が完了していないならば（Ｎｏ）、ステップＳ２１１の処理に戻り、記録が完了したならば（Ｙｅｓ）、図１３の処理を終了する。

図１４Ａと図１４Ｂは、デバイスの故障検知処理と仮想マシンの退避処理のフローチャートである。
最初、警報監視システム９２Ａのデバイス故障通知部９２１ａは、デバイスからのアラームをもとに、デバイス故障データベース９２２ｂと照合する（Ｓ２２１）。そして、デバイス故障通知部９２１ａは、アラームがデバイス故障でなければ（Ｎｏ）、図１４Ａの処理を終了し、アラームがデバイス故障ならば（Ｙｅｓ）、ステップＳ２２２に進む。このように、デバイス故障通知部９２１ａは、デバイス故障の場合に限って、コントローラサーバ１０Ａに通知するので、コントローラサーバ１０Ａの負荷を軽減することができる。

ステップＳ２２２において、デバイス故障通知部９２１ａは、デバイス故障である旨をオペレータに通知する。デバイス故障通知部９２１ａは更に、アラームに含まれるデバイスＩＤとともに、メンテナンス要求生成部１１ｇを呼び出す（Ｓ２２３）。

メンテナン要求生成部１１ｇは、デバイスＩＤをもとに、メンテナンス制御部１１ｄを呼び出す（Ｓ２２４）。そして、メンテナンス制御部１１ｄは、デバイスＩＤをもとに、メンテナンス対象デバイスのメンテナンスにより発生しうる警報の発出の除外（抑止）を指示するために警報除外設定部１１ｅを呼び出すと（Ｓ２２５）、図１４ＢのステップＳ２２６に進む。

図１４ＢのステップＳ２２６において、警報除外設定部１１ｅは、メンテナンス対象デバイスに付されたデバイスＩＤ、すなわち指定されたデバイスＩＤを引数に、警報関係データベース１２ｂを参照する。これにより、警報除外設定部１１ｅは、メンテナンスにより発生しうる警報種別を特定する。そして、警報除外設定部１１ｅは、指定されたデバイスＩＤに紐づく除外対象警報があるか否かを判定する（Ｓ２２７）。

ステップＳ２２７において、警報除外設定部１１ｅは、指定されたデバイスＩＤに紐づく除外対象警報が有れば（Ｙｅｓ）、ステップＳ２２８に進み、除外対象の警報をフィルタ設定部に設定し、ステップＳ２２９に進む。警報除外設定部１１ｅは、指定されたデバイスＩＤに紐づく除外対象警報が無ければ（Ｎｏ）、ステップＳ２２９に進む。

ステップＳ２２９において、メンテナンス制御部１１ｄは、メンテナンス対象に指定されたデバイスＩＤを引数に、影響ユーザ特定退避部１１ｆを呼び出す。
ステップＳ２３０において、影響ユーザ特定退避部１１ｆは、指定デバイスＩＤを利用中の仮想マシンに係るユーザＩＤが有るか否かを判定する。影響ユーザ特定退避部１１ｆは、指定デバイスＩＤを利用中の仮想マシンに係るユーザＩＤが有るならば（Ｙｅｓ）、指定されたユーザＩＤを引数に仮想マシンの退避を指示し、図１４Ｂの処理を終了する。影響ユーザ特定退避部１１ｆは、指定デバイスＩＤを利用中の仮想マシンに係るユーザＩＤが無いならば（Ｎｏ）、図１４Ｂの処理を終了する。

デバイスの故障をトリガに警報監視システム９２Ａが起動され、更にデバイス情報をもとにメンテナンス制御部１１ｄが起動される。これにより、警報監視システム９２Ａは、故障検知に伴う警報を発出し、コントローラサーバ１０Ａは、デバイスのメンテナンスに伴う警報の発出を抑止したのち、デバイスを利用する影響仮想マシンを退避させる。これにより、サーバに接続されたデバイスの故障時に、いち早くメンテナンスを行うことができる。

＜効果＞
以下、本発明に係るサーバメンテナンス制御装置の構成と効果について説明する。

（１）本発明に係るサーバメンテナンス制御装置は、ユーザが管理する仮想マシンに対して、サーバに接続されたデバイスを割り当てる割当部と、前記仮想マシンとそれが利用するデバイスとの対応を記録する利用状況管理部と、メンテナンス時に各前記デバイスに発生しうる警報種別を記録する警報関係管理部と、メンテナンス要求を受け付けると、メンテナンス時に前記デバイスに発生しうる警報の発出の抑止指示と前記仮想マシンのうちメンテナンスにより影響を受ける影響仮想マシンの他のサーバへの退避指示との順序を決定するメンテナンス制御部と、前記警報関係管理部に記録された前記警報種別に基づいて前記メンテナンス時にデバイスに発生しうる警報の発出の抑止を前記サーバに指示する警報除外設定部と、前記利用状況管理部に記録された前記仮想マシンとそれが利用するデバイスとの対応に基づいて前記影響仮想マシンを特定して前記サーバから前記他のサーバに退避させる影響ユーザ特定退避部と、を有する。

このような本発明に係るサーバメンテナンス制御装置は、各仮想マシンへのデバイスの割り当てを管理する。そして、本発明に係るサーバメンテナンス制御装置は、サーバに接続されたメンテナンス対象デバイス（第３デバイス３３ａ）のメンテナンスを行う場合に、メンテナンスに伴って発生する警報が発出されないようにサーバ（第１サーバ２０ａ）にフィルタ設定を行わせるとともに、メンテナンス対象デバイスに割り当てられた仮想マシンを特定してサーバ（第１サーバ２０ａ）から他のサーバ（第２サーバ２０ｂ）に退避（移行）させる。

このようにすることで、本発明に係るサーバメンテナンス制御装置は、メンテナンス対象デバイスが接続されたサーバ上で、このデバイスを利用しない仮想マシンの他の物理サーバへの退避処理を抑止するとともに、メンテナンスに伴う警報の発出を抑止することができる。その結果、本発明に係るサーバメンテナンス制御装置は、影響仮想マシンを除く他の仮想マシンの動作を継続できる。また、デバイスのメンテナンスに伴う警報の発出を抑止することができる。

（２）前記利用状況管理部は、前記仮想マシンとそれが利用するデバイスとの対応を第１データベースに記録しておき、前記影響ユーザ特定退避部は、メンテナンス要求受付時に、前記第１データベースを参照して前記メンテナンス要求で指定されたデバイスを利用する仮想マシンを、前記影響仮想マシンとして特定する、ことを特徴とする請求項１に記載のサーバメンテナンス制御装置とした。

このようにすることで、本発明に係るサーバメンテナンス制御装置は、メンテナンス対象デバイスのデバイスＩＤに紐づく仮想マシンを容易かつ短時間に特定することができる。

（３）前記警報関係管理部は、各デバイスとそれのメンテナンス時に監視の除外対象となる除外対象警報種別との対応関係を第２データベースに記録しておき、前記警報除外設定部は、メンテナンス要求受付時に、前記第２データベースを参照して前記メンテナンス要求で指定されたデバイスのメンテナンスにより発生しうる警報の発出の抑止を前記サーバに指示する、ことを特徴とする請求項１に記載のサーバメンテナンス制御装置とした。

このようにすることで、本発明に係るサーバメンテナンス制御装置は、デバイスのメンテナンスにより発生しうる警報の発出を除外（抑止）できる。

（４）前記デバイスのうち何れかの故障情報に基づき、前記故障情報に係るデバイスのメンテナンス要求を生成するメンテナンス要求生成部、を更に備えることを特徴とする請求項１に記載のサーバメンテナンス制御装置とした。

このようにすることで、デバイスの故障検知をトリガとしてデバイスのメンテナンスを行うことができる。

（５）本発明のサーバメンテナンスシステムは、（４）に記載のサーバメンテナンス制御装置と、デバイスの故障を検知すると前記メンテナンス要求生成部に当該デバイスの故障情報を通知するデバイス故障通知部を備える警報監視装置と、を有することを特徴とする。

このようにすることで、サーバメンテナンス制御装置のメンテナンス要求生成部にデバイスの故障を自律的に通知するので、デバイスの故障にいち早く対処できる。

（６）前記警報監視装置は、前記デバイス故障通知部が前記メンテナンス要求生成部に通知する故障情報を記録する第３のデータベースを備える、ことを特徴とする請求項５に記載のサーバメンテナンスシステムとした。

このようにすることで、予め決められた故障情報に限ってメンテナンス要求生成部に通知されるので、サーバメンテナンス制御装置の負荷を軽減させることができる。

（７）本発明に係るサーバメンテナンス制御方法は、サーバメンテナンス制御装置のサーバメンテナンス制御方法であって、前記サーバメンテナンス制御装置は、ユーザが管理する仮想マシンに対して、サーバに接続されたデバイスを割り当てるステップと、前記仮想マシンとそれが利用するデバイスとの対応を第１データベースに記録するステップと、メンテナンス時に各前記デバイスに発生しうる警報種別を第２データベースに記録するステップと、メンテナンス要求を受け付けるステップと、前記第２データベースに記録された前記警報種別に基づいてメンテナンス時に前記デバイスに発生しうる警報の発出の除外を前記サーバに指示するステップと、前記第１データベースに記録された前記仮想マシンとそれが利用するデバイスとの対応に基づいてメンテナンスにより影響を受ける前記仮想マシンである影響仮想マシンを特定して前記サーバから他のサーバに退避させるステップと、を実行する、ことを特徴とする。

このようにすることで、本発明に係るサーバメンテナンス制御方法は、メンテナンス対象デバイスが接続されたサーバ上で、このデバイスを利用しない仮想マシンの他のサーバへの退避処理を抑止するとともに、メンテナンスに伴う警報の発出を抑止することができる。その結果、本発明に係るサーバメンテナンス制御方法は、影響仮想マシンを除く他の仮想マシンの動作を継続させることができる。また、デバイスのメンテナンスに伴う警報の発出を抑止する。

（８）本発明に係るプログラムは、サーバメンテナンス制御装置としてコンピュータに、ユーザが管理する仮想マシンに対して、サーバに接続されたデバイスを割り当てる手順、前記仮想マシンとそれが利用するデバイスとの対応を第１データベースに記録する手順、メンテナンス時に各前記デバイスに発生しうる警報種別を第２データベースに記録する手順、メンテナンス要求を受け付けると、メンテナンスにより発生しうる警報の発出の抑止指示と前記仮想マシンのうちメンテナンスにより影響を受ける影響仮想マシンの他のサーバへの退避指示との順序を決定する手順、前記第２データベースに記録された前記警報種別に基づいて前記メンテナンスにより発生しうる警報の発出の除外を前記サーバに指示する手順、前記第１データベースに記録された前記仮想マシンとそれが利用するデバイスとの対応に基づいて前記影響仮想マシンを特定して前記サーバから前記他のサーバに退避させる手順、を実行させるためのものである。

このようにすることで、本発明に係るプログラムは、メンテナンス対象デバイスが接続されたサーバ上で、このデバイスを利用しない仮想マシンの他のサーバへの退避処理を抑止するとともに、メンテナンスに伴う警報の発出を抑止することができる。その結果、本発明に係るプログラムは、影響仮想マシンを除く他の仮想マシンの動作を継続させることができる。また、デバイスのメンテナンスに伴う警報の発出を抑止する。

なお、本発明は、前記した実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲で種々の変更や変形を行うことができる。また、前記した実施形態は、本発明の要旨を分かり易く説明するために詳細に説明したものである。そのため、本発明は、必ずしも説明した全ての構成要素を備えるものに限定されるものではない。また、本発明は、ある構成要素に他の構成要素を追加したり、一部の構成要素を他の構成要素に変更したりすることができる。また、本発明は、一部の構成要素を削除することもできる。

１０，１０Ａコントローラサーバ（サーバメンテナンス制御装置）
１１，１１Ａ制御部
１１ａ割当部
１１ｂ利用状況管理部
１１ｃ警報関係管理部
１１ｄメンテナンス制御部
１１ｅ警報除外設定部
１１ｆ影響ユーザ特定退避部
１１ｇメンテナンス要求生成部
１２記憶部
１２ａ利用状況データベース（第１データベース）
１２ｂ警報関係データベース（第２データベース）
１９通信部
２０ａ第１サーバ
２０ｂ第２サーバ
２１ａ第１仮想マシン
２２ａ，２２ｂ第２仮想マシン
２６ａ，２６ｂフィルタ設定部
３１ａ，３１ｂ第１デバイス
３２ａ，３２ｂ第２デバイス
３３ａ，３３ｂ第３デバイス
６１ａ第１ユーザ端末
６１ｂ第２ユーザ端末
９１メンテナンス指示装置
９２，９２Ａ警報監視システム
９２１制御部
９２１ａデバイス故障通知部
９２１ｂデバイス故障管理部
９２２記憶部
９２２ａ警報監視プログラム
９２２ｂデバイス故障データベース（第３のデータベース）
９２３通信部
９９記憶媒体
１００，１００Ａサーバシステム（サーバメンテナンスシステム）
Ｃｍ１警報除外設定指示
Ｃｍ２退避指示
Ｐｒ制御プログラム
Ｒｑメンテナンス要求
Ｗａ警報

Claims

ユーザが管理する仮想マシンに対して、サーバに接続されたデバイスを割り当てる割当部と、
前記仮想マシンとそれが利用するデバイスとの対応を記録する利用状況管理部と、
メンテナンス時に各前記デバイスに発生しうる警報種別を記録する警報関係管理部と、
メンテナンス要求を受け付けると、メンテナンス時に前記デバイスに発生しうる警報の発出の抑止指示と前記仮想マシンのうちメンテナンスにより影響を受ける影響仮想マシンの他のサーバへの退避指示との順序を決定するメンテナンス制御部と、
前記警報関係管理部に記録された前記警報種別に基づいて前記メンテナンス時にデバイスに発生しうる警報の発出の抑止を前記サーバに指示する警報除外設定部と、
前記利用状況管理部に記録された前記仮想マシンとそれが利用するデバイスとの対応に基づいて前記影響仮想マシンを特定して前記サーバから前記他のサーバに退避させる影響ユーザ特定退避部と、を有する、
ことを特徴とするサーバメンテナンス制御装置。
前記利用状況管理部は、前記仮想マシンとそれが利用するデバイスとの対応を第１データベースに記録しておき、
前記影響ユーザ特定退避部は、メンテナンス要求受付時に、前記第１データベースを参照して前記メンテナンス要求で指定されたデバイスを利用する仮想マシンを、前記影響仮想マシンとして特定する、
ことを特徴とする請求項１に記載のサーバメンテナンス制御装置。
前記警報関係管理部は、各デバイスとそれのメンテナンス時に監視の除外対象となる除外対象警報種別との対応関係を第２データベースに記録しておき、
前記警報除外設定部は、メンテナンス要求受付時に、前記第２データベースを参照して前記メンテナンス要求で指定されたデバイスのメンテナンスにより発生しうる警報の発出の抑止を前記サーバに指示する、
ことを特徴とする請求項１に記載のサーバメンテナンス制御装置。
前記デバイスのうち何れかの故障情報に基づき、前記故障情報に係るデバイスのメンテナンス要求を生成するメンテナンス要求生成部、
を更に備えることを特徴とする請求項１に記載のサーバメンテナンス制御装置。
請求項４に記載のサーバメンテナンス制御装置と、
デバイスの故障を検知すると前記メンテナンス要求生成部に当該デバイスの故障情報を通知するデバイス故障通知部を備える警報監視装置と、
を有することを特徴とするサーバメンテナンスシステム。
前記警報監視装置は、前記デバイス故障通知部が前記メンテナンス要求生成部に通知する故障情報を記録する第３のデータベースを備える、
ことを特徴とする請求項５に記載のサーバメンテナンスシステム。
サーバメンテナンス制御装置のサーバメンテナンス制御方法であって、
前記サーバメンテナンス制御装置は、
ユーザが管理する仮想マシンに対して、サーバに接続されたデバイスを割り当てるステップと、
前記仮想マシンとそれが利用するデバイスとの対応を第１データベースに記録するステップと、
メンテナンス時に各前記デバイスに発生しうる警報種別を第２データベースに記録するステップと、
メンテナンス要求を受け付けるステップと、
前記第２データベースに記録された前記警報種別に基づいてメンテナンス時に前記デバイスに発生しうる警報の発出の除外を前記サーバに指示するステップと、
前記第１データベースに記録された前記仮想マシンとそれが利用するデバイスとの対応に基づいてメンテナンスにより影響を受ける前記仮想マシンである影響仮想マシンを特定して前記サーバから他のサーバに退避させるステップと、を実行する、
ことを特徴とするサーバメンテナンス制御方法。
サーバメンテナンス制御装置としてコンピュータに、
ユーザが管理する仮想マシンに対して、サーバに接続されたデバイスを割り当てる手順、
前記仮想マシンとそれが利用するデバイスとの対応を第１データベースに記録する手順、
メンテナンス時に各前記デバイスに発生しうる警報種別を第２データベースに記録する手順、
メンテナンス要求を受け付けると、メンテナンスにより発生しうる警報の発出の抑止指示と前記仮想マシンのうちメンテナンスにより影響を受ける影響仮想マシンの他のサーバへの退避指示との順序を決定する手順、
前記第２データベースに記録された前記警報種別に基づいて前記メンテナンスにより発生しうる警報の発出の除外を前記サーバに指示する手順、
前記第１データベースに記録された前記仮想マシンとそれが利用するデバイスとの対応に基づいて前記影響仮想マシンを特定して前記サーバから前記他のサーバに退避させる手順、
を実行させるためのプログラム。