JP2009265848A - 情報処理システムの制御方法、情報処理システム、およびプログラム - Google Patents

情報処理システムの制御方法、情報処理システム、およびプログラム Download PDF

Info

Publication number
JP2009265848A
JP2009265848A JP2008113042A JP2008113042A JP2009265848A JP 2009265848 A JP2009265848 A JP 2009265848A JP 2008113042 A JP2008113042 A JP 2008113042A JP 2008113042 A JP2008113042 A JP 2008113042A JP 2009265848 A JP2009265848 A JP 2009265848A
Authority
JP
Japan
Prior art keywords
server device
standby
information
processing system
standby server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008113042A
Other languages
English (en)
Other versions
JP4802207B2 (ja
Inventor
Kimimichi Fukuyama
公通 福山
Atsushi Nakayama
淳 中山
Koji Masuda
浩司 増田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008113042A priority Critical patent/JP4802207B2/ja
Priority to US12/392,094 priority patent/US8074098B2/en
Publication of JP2009265848A publication Critical patent/JP2009265848A/ja
Application granted granted Critical
Publication of JP4802207B2 publication Critical patent/JP4802207B2/ja
Priority to US13/285,064 priority patent/US8423162B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2033Failover techniques switching over of hardware resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

【課題】通信可能に接続された複数のサーバ装置を有する情報処理システムにおけるフェイルオーバ実施時の信頼性や可用性を確保する。
【解決手段】通信可能に接続された複数のサーバ装置20とサーバ装置20と通信可能に接続する管理サーバ10とを含み、現用サーバ装置20における障害の発生を検知した場合に、電源がオフしている待機サーバ装置20の電源をオンした後、現用サーバ装置20から待機サーバ装置20へのフェイルオーバを行うように構成された情報処理システム1において、管理サーバ10が、待機サーバ装置20の電源をオンしてから待機サーバ装置20の情報を取得し、情報を取得した後、待機サーバ装置20の電源をオフし、取得した情報に基づき待機サーバ装置20にフェイルオーバ可能か否かを判定するようにする。また待機サーバ装置20の割当て状況に応じて情報の取得方法を選択するようにする。
【選択図】図1

Description

本発明は、情報処理システムの制御方法、情報処理システム、およびプログラムに関し、とくに通信可能に接続された複数のサーバ装置を有する情報処理システムにおいてフェイルオーバ実施時の信頼性や可用性を確保する技術に関する。
特許文献1には、複数のサーバがネットワーク上の外部ディスク装置に接続される計算機システムにおいて、現用サーバにおける障害発生を検知し、現用サーバと同じ構成を有する予備サーバを検索し、予備サーバから外部ディスク装置へのアクセスを可能にすることにより、当該予備サーバに業務の引き継ぎを行うことが記載されている。
また特許文献2には、複数のCPU、複数の入出力インタフェースを備える計算機装置において、CPUと入出力インタフェースとの接続関係を任意に設定することが可能な入出力インタフェーススイッチ(以下、I/Oスイッチと称する。)が開示されている。
特開2006−163963号公報 特開2005−301488号公報
上記特許文献1に示されるような計算機システムにおいて、現用されているサーバ装置(以下、現用サーバ装置と称する。)の待機用として設定されているサーバ装置(以下、待機サーバ装置と称する。)は、消費電力の節約等を目的として待機中はその電源がオフされている。
このため、たとえばフェイルオーバを実施した際に初めて待機サーバ装置に障害が生じていることが発覚し、もしくは待機サーバ装置の構成や性能等が現用サーバ装置のフェイルオーバ先として不十分であることが判明するなどして業務やサービスに支障を来すことがあった。
とくに上記特許文献2に開示されるようなI/Oスイッチを情報処理システムに導入することにより構成変更が柔軟に行えるようになれば、情報処理システムの信頼性や可用性が損なわれる可能性が高くなると考えられる。
本発明はこのような背景に鑑みてなされたもので、フェイルオーバ実施時の信頼性や可用性を確保することが可能な情報処理システムの制御方法、情報処理システム、およびプログラムを提供することを目的とする。
上記目的を達成するための本発明のうちの一つは、通信可能に接続された複数のサーバ装置と、前記サーバ装置と通信可能に接続する管理サーバとを含み、第1の前記サーバ装置における障害の発生を検知した場合に、動作が停止している第2の前記サーバ装置の動作を開始させた後、前記現用サーバ装置から前記待機サーバ装置へのフェイルオーバを行う情報処理システムによる前記サーバ装置の障害検知方法であって、前記管理サーバが、動作が停止している前記待機サーバ装置の動作を開始させて前記待機サーバ装置の情報を取得するステップと、前記情報を取得した後、前記待機サーバ装置の動作を停止させるステップと、前記情報に基づき前記待機サーバ装置に問題があるか否かを判定するステップとを含む。
その他、本願が開示する課題、およびその解決手段は、発明を実施するための最良の形態の欄、および図面により明らかになる。
本発明によれば、通信可能に接続された複数のサーバ装置を有する情報処理システムにおけるフェイルオーバ実施時の信頼性や可用性を確保することができる。
以下、図面を用いて本願発明の実施の形態を説明する。図1に本発明の一実施形態として説明する情報処理システム1の構成を示している。同図に示すように、情報処理システム1は、ネットワークスイッチ5、管理サーバ10、複数のサーバ装置20、ストレージ装置30、およびSVP40(SVP : SerVice Processor)を備えている。尚、同図に示すような情報処理システム1の一例として、サーバ装置20に相当するブレードが複数枚実装されて構成されるブレードサーバがある。
管理サーバ10は、サーバ装置20およびSVP40とネットワークスイッチ5を介して通信可能に接続されている。またサーバ装置20とSVP40は通信可能に接続されている。
SVP40は、サーバ装置20の動作を開始または停止させることができる。サーバ装置20は、例えば電源をオンすることにより動作を開始する。またサーバ装置20は、例えば電源をオフもしくはシャットダウン等することにより動作を停止する。
管理サーバ10は、例えば図2Aに示すハードウエアを有するコンピュータ(情報処理装置)である。同図に示すコンピュータ100は、中央制御部101(CPU(Central Processing Unit)、MPU(Micro Processing Unit)等)、主記憶装置102(RAM(Random Access Memory)、ROM(Read Only Memory)等)、補助記憶装置103(ハードディスク、CD、DVD等)、および通信装置(NIC(Network Interface Card)等)を備えている。
一方、サーバ装置20は、例えば図2Bに示すハードウエアを有するコンピュータである。同図に示すコンピュータ120は、中央制御部121(CPU、MPU等)、主記憶装置122(RAM、ROM等)、通信装置123(NIC等)、I/Oインタフェース124、および管理コントローラ125を備えている。
I/Oインタフェース124は、ストレージ装置30と通信するためのインタフェースであり、例えばサーバ装置20とストレージ装置との間の通信がLAN(Local Area Network)を介して行われるのであればNICであり、SAN(Storage Area Network)を介して行われるのであればHBA(Host Bus Adaptor)である。
管理コントローラ125は、サーバ装置20上で動作するソフトウエアとは独立してサーバ装置20におけるハードウエアの状態を監視する機能を有する装置であり、例えばBMC(Baseboard Management Controller)である。管理コントローラ125は、サーバ装置20上で動作するオペレーティングシステムやSVP40にハードウエアエラーの発生を通知する。上記ハードウエアエラーには、例えば電源の供給電圧の異常、冷却ファンの回転数の異常、各種デバイスの温度や電源電圧の異常等がある。
管理コントローラ125は、サーバ装置20の動作を開始または停止させる指示を受信すると、これに応じてサーバ装置20を開始または停止させる。尚、管理コントローラ125は、中央制御部121や主記憶装置122といったサーバ装置20の他の構成要素とは独立して動作することができ、他の構成要素とは独立してSVP40や管理サーバ10に障害の発生を通知することができる。
ストレージ装置30は、例えばディスクアレイ装置等の記憶装置である。ストレージ装置30はサーバ装置20にデータの記憶領域を提供する。本実施形態では、ストレージ装置30は論理デバイス(LU(Logical Unit))を単位としてサーバ装置20に記憶領域を提供する。尚、ストレージ装置30は、管理サーバ10からの指示に応じてサーバ装置20とLUとを結ぶ物理的または論理的な経路(パス)を設定する。以下、この機能のことをパス切り替え部31と称する。
図3Aに管理サーバ10が有する機能および管理サーバ10に保持されるデータを示している。管理サーバ10は、障害管理部310、およびサーバ管理部320を機能として有している。これらの機能は、管理サーバ10が有するハードウエアにより、もしくは中央制御部103が主記憶装置102や補助記憶装置103に記憶されているプログラムを読み出して実行することにより実現される。
障害管理部310は、障害検出部311およびサーバ制御部312を有している。障害管理部310は、現用中のサーバ装置20(以下、現用サーバ装置20と称する場合がある。)の障害の有無をリアルタイムに監視しており、障害を検知すると、現用サーバ装置20が行っていた業務やサービスを他のサーバ装置20(以下、待機サーバ装置20と称する場合がある。)に引き継ぐ、いわゆるフェイルオーバを行う。
サーバ管理部320は、サーバ装置20に関する情報(サーバ装置20の電源の状態、サーバ装置20が有する構成、サーバ装置20に割り当てられているLU、サーバ装置20の異常の有無、サーバ装置20が前回オフされた日時等)を収集し、収集した情報を後述の構成管理テーブル330に管理する。図3Aに示しているように、サーバ管理部320は、情報取得部322、状態判定部323、時間起動判定部324、構成変更起動判定部325、および調停部326を有している。
図3Aに示すように、管理サーバ10は、構成管理テーブル330、構成比較テーブル340、許容機能テーブル350、サーバ切り替え管理テーブル360を記憶している。また管理サーバ10は、検査プログラム370を記憶している。
図3Bにサーバ装置20のソフトウエア構成を示している。同図に示すように、サーバ装置20では、オペレーティングシステム211および各種のアプリケーションプログラム212が動作している。
図4Aは管理サーバ10が記憶している構成管理テーブル330の一例である。同図に示すように、構成管理テーブル330は、サーバ装置識別子401、電源状態402、サーバ装置構成403、許容機能404、割当領域405、待機サーバフラグ406、要検査フラグ407、サーバ状態408、サーバ最終オフ日時409の各項目を有する。このうちサーバ装置識別子401には、各サーバ装置20に固有に付与される識別子が設定される。電源状態402にはサーバ装置20の現在の電源の投入状態(オンまたはオフ)が設定される。サーバ装置構成403には、サーバ装置20の構成要素、例えばCPU、メモリ(MEM)、HBA、NIC等が設定される。
許容機能404には、現用サーバ装置20の待機用として設定される待機サーバ装置20について要求される仕様(機能や性能)を示す情報である後述の許容タイプが設定される。割当領域405には、サーバ装置20に割り当てられているLU(Logical Unit)の識別子が設定される。待機サーバフラグ406には、そのサーバ装置20が待機サーバ装置20であるなら「1」が設定され、待機サーバ装置20でなければ「0」が設定される。要検査フラグ407には、該当のサーバ装置20の検査が必要な場合は「1」が設定され、検査が必要でない場合は「0」が設定される。サーバ状態408には、該当のサーバ装置20が正常に動作している場合は「正常」が設定され、正常に動作していない場合は「異常」が設定される。サーバ最終オフ日時409にはそのサーバ装置20がオフされた直近の日時が設定される。
図4Bは管理サーバ10が記憶している構成比較テーブル340の一例である。構成比較テーブル340は、サーバ装置識別子411、電源状態412、サーバ装置構成413、および割当領域415の各項目を有している。尚、各項目の意味は構成管理テーブル330の対応する同名称の項目と同じである。構成比較テーブル340には、構成管理テーブル330に反映するためのサーバ装置20関する情報が一時的に格納される。
図4Cは管理サーバ10が記憶している許容機能テーブル350の一例である。許容機能テーブル350には、サーバ装置20のフェイルオーバ先となる待機サーバ装置20が満たすべき機能の許容範囲がタイプ別に登録される。同図に示すように、許容機能テーブル350は、許容タイプ421、CPU422、MEM423、HBA424、およびNIC425の各項目を有している。このうち許容タイプ421には、許容範囲のタイプごとに付与される情報である許容タイプが設定される。CPU422には、待機サーバ装置20のCPUに求められる仕様の許容範囲が設定される。MEM423には、待機サーバ装置20の主記憶装置122(メモリ)に求められる仕様の許容範囲が設定される。HBA424には、I/Oインタフェース124(HBA)に求められる仕様の許容範囲が設定される。NIC425には、I/Oインタフェース124(NIC)に求められる仕様の許容範囲が設定される。
図4Dは管理サーバ10が記憶しているサーバ切り替え管理テーブル360の一例である。同図に示すように、サーバ切り替え管理テーブル360は、サーバ装置識別子431、および切り替え用待機サーバ装置432の各項目を有している。サーバ装置識別子431には、サーバ装置20の識別子が設定される。切り替え用待機サーバ装置432には、サーバ装置20の引き継ぎ先となる待機サーバ装置20の識別子が設定される。サーバ装置20にその引き継ぎ先となるサーバ装置20をどのように割り当てるかは、例えば情報処理システム1の運用ポリシに従って定められる。尚、運用ポリシによっては、一台の現用サーバ装置20に複数の待機サーバ装置20が設定される場合(一対多の設定)、一台の待機サーバ装置20が複数の現用サーバ装置20の待機用に設定される場合(多対一の設定)もある。
図3Aに示した検査プログラム370は、サーバ装置20で実行されるプログラムである。検査プログラム370は、サーバ装置20に関する情報(デバイスの種類や動作状況等を)をSVP40または管理サーバ10に送信する。
−−−動作説明−−−
次に情報処理システム1の具体的な動作についてフローチャートとともに説明する。尚、以下において、符号の前に付した「S」の文字はステップを意味する。
図5は現用サーバ装置20に障害が発生してフェイルオーバが行われる際の情報処理システム1の動作を示すフローチャートである。以下、同図とともに説明する。
いずれかの現用サーバ装置20で障害が発生すると、SVP40がこれを検知し、SVP40から管理サーバ10に障害発生通知が送信される(S511)。
管理サーバ10の障害検出部311は、障害発生通知を受信すると(S512)フェイルオーバを実施する必要があるか否かを判定する(S513)。この判定は、例えば障害が現用サーバ装置20自身の障害であるか否かを判定することにより行う。
障害検出部311がフェイルオーバが必要であると判定した場合は(S513:YES)S514に進み、必要でないと判定した場合は(S513:NO)処理が終了する。
S514では、サーバ制御部312が、障害が発生している現用サーバ装置20の識別子(S512で受信した障害発生通知に含まれているサーバ装置20の識別子)を取得する。
S515では、サーバ制御部312が、障害が発生している現用サーバ装置20の電源をオフさせる指示をSVP40に送信する(S515)。SVP40は、上記指示を受信すると(S516)、該当のサーバ装置20の電源をオフする(S517)。
S518では、サーバ制御部312が、サーバ切り替え管理テーブル360を参照し、障害が発生している現用サーバ装置20に待機サーバ装置20が設定されているか否かを判定する。待機サーバ装置20が設定されていない場合には(S518:NO)、フェイルオーバを実施できない旨を管理者に通知する(S519)。尚、この通知は、例えば表示装置や印刷装置への出力や電子メールによって行う。一方、待機サーバ装置20が設定されている場合には(S518:YES)、S520に進む。
S520では、サーバ制御部312が、障害が発生している現用サーバ装置20のリソース情報(例えば構成管理テーブル330の割当領域405やサーバ装置構成403に設定されている内容)を構成管理テーブル330から取得する。
S521では、サーバ制御部312が、障害が発生している現用サーバ装置20に割り当てられているパスを待機サーバ装置20への切り替える指示(以下、パス切替指示と称する。)をSVP40に送信する。
SVP40は、パス切替指示を受信すると(S522)、ストレージ装置30のパス切り替え部31にパスの切り替えを実施する(S523)。パスの切り換えは、例えばサーバ装置20のI/Oインタフェース124がHBAであれば障害が発生している現用サーバ装置20のHBAに付与されているWWN(World Wide Name)を待機サーバ装置20のHBAに付与することにより行われる。パスの切り替え後はSVP40から管理サーバ10に完了通知が送信される(S524)。
管理サーバ10は、完了通知を受信すると(S525)、待機サーバ装置20の電源をオンさせる指示(以下、電源オン指示と称する。)をSVP40に送信する(S526)。SVP40は、電源オン指示を受信すると(S527)、待機サーバ装置20の電源をオンする(S528)。
以上がフェイルオーバが行われるときの情報処理システム1の動作である。
次に、管理サーバ10が、サーバ装置20を検査する処理(以下、検査処理と称する。)について、図6A乃至図6Cに示すフローチャートとともに説明する。尚、図6Aに示す検査処理が開始される際、情報の取得対象となるサーバ装置20は(以下、取得対象装置と称する。)特定されており、管理サーバ10は取得対象装置の識別子を取得しているものとする。
図6Aに示すように、検査処理では、まず管理サーバ10がサーバ装置20の情報を取得する(以下、この処理のことを情報取得処理と称する。)(S611)。
図6Bは情報取得処理の詳細を説明するフローチャートである。まずサーバ管理部320の情報取得部322が、構成管理テーブル330の待機サーバフラグ406の内容を参照し、検査対象装置が待機サーバ装置20であるか否かを判定する(S621)。検査対象装置が待機サーバ装置20であった場合には(S621:YES)、S622に進む。待機サーバ装置20でなかった場合には(S621:NO)、S625に進む。
S622では、情報取得部322が、待機サーバ装置20の電源をオンさせる指示(以下、電源オン指示と称する。)をSVP40に送信する。SVP40は、電源オン指示を受信すると(S623)、検査対象装置たる待機サーバ装置20の電源をオンする(S624)。
S625では、情報取得部322が、サーバ装置20から情報を取得する方法を決定する。この情報処理システム1では、上記情報取得方法として、サーバ装置20のBIOS(Basic Input Output System)が出力するダンプ情報(以下、POST情報と称する。)を利用し、短時間で情報取得する方法(以下、第1の情報取得方法と称する。)、およびサーバ装置20で検査プログラム370を実行し、時間を掛けて情報取得(以下、詳細情報と称する。)する方法(以下、第2の情報取得方法と称する。)のいずれかを選択することができる。
上記情報取得方法の決定は、例えば検査対象装置が待機サーバ装置20である場合には当該検査対象装置について検査を行っていても現用サーバ装置20のフェイルオーバ先を確保できるか否か(例えば現用サーバ装置20に複数の待機サーバ装置20が設定されている場合、そのうちの一つで検査プログラムを実行してもフェイルオーバ先が確保される場合は第2の情報取得方法を選択し時間を掛けて情報取得し、待機サーバ装置20が一つしか設定されていない場合はその待機サーバ装置20で検査プログラムを実行するとフェイルオーバ先が確保できなくなる場合があるので、第1の情報取得方法を選択し簡単な情報取得に留める)を調べることにより行う。もしくは、サーバ装置20の検査の累積回数に応じて決定する(例えばサーバ装置20の過去の検査回数を管理しておき、通常はPOST情報から情報を取得し、所定回数ごとに詳細情報から情報を取得するように切り替える)。
S625において、第2の情報取得方法が選択された場合には(S625:詳細)、S626に進み、第1の情報取得方法が選択された場合には(S625:POST)、S629に進む。
S626では、情報取得部322が、検査対象装置に検査プログラム370を送信する。SVP40は、検査プログラム370を受信すると(S627)、検査対象装置に検査プログラムを格納する(S628)。尚、検査プログラム370の実行にミニオペレーティングシステムが必要な場合には、検査プログラム370とともにミニオペレーティングシステムもSVP40に送信され検査対象装置に格納される。尚、検査プログラム370やミニオペレーティングシステムは、検査の都度サーバ装置20に格納するのではなく、サーバ装置20に常駐させてもよい。
S629では、情報取得部322が、SVP40に情報を取得する指示(以下、情報取得要求と称する。)を送信する。SVP40は、情報取得要求を受信すると(S630)、管理サーバ10に情報(詳細情報またはPOST情報)を送信する(S631)。
S633において、情報取得部322は、取得した情報に基づく内容を構成比較テーブル340に反映する。
S634において、情報取得部322は、構成管理テーブル330の待機サーバフラグ406を参照し、検査対象装置が待機サーバ装置20であるか否かを判定する。検査対象装置が待機サーバ装置20である場合には(S634:YES)、S635に進み、待機サーバ装置20でない場合には(S634:NO)、処理が終了する(図6のS612に進む)。
S635において、情報取得部322は、待機サーバ装置20の電源をオフさせる指示(電源オフ指示)をSVP40に送信する。SVP40は、電源オフ指示を受信すると(S636)、待機サーバ装置20の電源をオフする(S637)。尚、検査プログラム370を用いて情報を取得した場合には、情報を取得した後に検査プログラム370の機能によって待機サーバ装置20の電源を自動的にオフするようにしてもよい。
以上によれば、サーバ装置20からサーバ装置20に関する情報(サーバ装置20の構成や動作状態等)を取得することができる。また検査対象装置が待機サーバ装置20であった場合には、まず待機サーバ装置20の電源をオンしてから情報を取得し、情報の取得後は待機サーバ装置20の電源を再びオフする。即ち電源がオフされていた待機サーバ装置20から情報を取得することができる。また情報の取得時のみ待機サーバ装置20の電源がオンされるので、消費電力を節約することができる。
また現用サーバ装置20と待機サーバ装置20の設定状態に応じて第1の情報取得方法と第2の情報取得方法のいずれかを選択するようにしたので、サーバ装置20の情報を安全に取得することができる。また安全が確認された場合に第2の情報取得方法によって詳細な情報を取得すれば、管理サーバ10においてサーバ装置20の情報を詳細に把握することができる。さらに詳細な情報を取得する場合に検査プログラム370をサーバ装置20に格納するようにしたので、サーバ装置20から詳細な情報を確実に取得することができる。またサーバ装置20の資源を有効に利用することができる。
再び図6Aに戻って説明する。S612では、管理サーバ10のサーバ管理部320が、構成管理テーブル330の待機サーバフラグ406を参照し、検査対象装置が待機サーバ装置20であるか否かを判定する。検査対象装置が待機サーバ装置20である場合には(S612:YES)、S613に進み、待機サーバ装置20でない場合には(S612:NO)、S616に進む。
S613では、サーバ管理部320の状態判定部323が、待機サーバ装置20の状態を判定する(以下、この処理を状態判定処理と称する。)。
図6Cは状態判定処理を説明するフローチャートである。まずS651において、状態判定部323が、検査対象装置たる待機サーバ装置20に故障がないか(故障部位があるか)否かを判定する。この判定は、例えば図6のS632で情報取得部322が取得した詳細情報またはPOST情報を調べることにより行う。また例えば構成管理テーブル330と構成比較テーブル340の対応する項目の内容を比較し、相違点があるか否かを調べることにより行う。
S652では、状態判定部323が、サーバ切り替え管理テーブル360を参照し、検査対象装置たる待機サーバ装置20が待機用に設定されているサーバ装置20があるか否かを判定する。検査対象装置がいずれかのサーバ装置20に待機用に設定されている場合は(S652:YES)、S653に進み、いずれのサーバ装置20の待機用にも設定されていない場合は(S652:NO)、処理が終了する(図6AのS614に進む)。
S653において、状態判定部323は、検査対象装置たる待機サーバ装置20が、当該待機サーバ装置20が待機用に設定されているサーバ装置20の引き継ぎ先として要求される仕様(構成、性能、機能等)を満たしているか否かを判定する(S653)。この判定は、例えば許容機能テーブル350を参照しつつ、構成管理テーブル330の現用サーバ装置20の構成と構成比較テーブル340の検査対象装置である待機サーバ装置20の構成とを比較して、待機サーバ装置20の機能が構成管理テーブル330の許容機能404に登録されている許容タイプで特定される許容範囲内か否かを調べることにより行う。尚、このように待機サーバ装置20が引き継ぎ先として要求される仕様を満たしているか否かを判定することで、フェイルオーバを安全かつ確実に行うことができる。
再び図6Aに戻って説明する。S614では、サーバ管理部320が、図6CのS651またはS653における判定の結果に何らかの問題があるか否かを判定する。判定の結果、問題があった場合には(S614:YES)、S615に進み、問題がなかった場合には(S614:NO)、S616に進む。
S615では、管理サーバ10が問題がある旨およびその内容を管理者に通知する。尚、この通知は例えば表示装置や印刷装置への出力や電子メールによって行う。S616では、サーバ管理部320が、構成比較テーブル340の内容を構成管理テーブル330に反映する。S617では、サーバ管理部320が、構成管理テーブル330の検査対象装置の要検査フラグ407に「0」を設定する。S618において、サーバ管理部320は、構成管理テーブル330の待機サーバフラグ406を参照し、検査対象装置が待機サーバ装置20であるか否かを判定する。検査対象装置が待機サーバ装置20であれば(S618:YES)S619に進み、検査対象装置が待機サーバ装置20でなければ(S618:NO)処理が終了する。S619では、管理サーバ10は、構成管理テーブル330の検査対象装置たる待機サーバ装置20のサーバ最終オフ日時409に当該待機サーバ装置20をオフした日時(例えば現在日時)を設定する。検査処理は以上のようにして行われる。
図7Aおよび図7Bは、以上に説明した検査処理の起動に関する処理の一例(以下、時間起動処理と称する。)を説明するフローチャートである。以下、同図とともに時間起動処理について説明する。
時間起動処理では、まずサーバ管理部320の時間起動判定部324が、構成管理テーブル330から、待機サーバ装置20(待機サーバフラグ406に「1」が設定されているもの)のサーバ装置最終オフ日時409の内容(最終オフ日時)を取得する(S711)。
次に時間起動判定部324が、S711で取得した最終オフ日時と現在日時とを比較し、予め設定されている所定期間(例えば1時間、1日等)が経過している待機サーバ装置20の要検査フラグ407に「1」を設定する(S712)。
次のS713では、時間起動判定部324が、構成管理テーブル330に、要検査フラグ407に「1」が設定されているサーバ装置20があるか否かを判定する。要検査フラグ407に「1」が設定されているサーバ装置20があれば(S713:YES)、S713に進み、要検査フラグ407に「1」が設定されているサーバ装置20がなければ(S713:NO)、処理が終了する。
S713では、時間起動判定部324は、構成管理テーブル330から要検査フラグ407に「1」が設定されているサーバ装置20のうち未選択のもの(まだ後述する調停処理(S714)を行っていないもの)を1つ選択する。
S714において、管理サーバ10は、調停処理S714を行う。調停処理S714については後述する。
S715では、時間起動判定部324は、S713において要検査フラグ407に「1」が設定されているサーバ装置20のうち未選択のものがあるか否かを判定する(S715)。未選択のものがあれば(S715:YES)、S713に進む。未選択のものがなければ(S715:NO)、処理が終了する。
図7Bは調停処理S714を説明するフローチャートである。まずサーバ管理部320の調停部326が、S713で選択されたサーバ装置20が待機用に設定されているか否か(待機サーバ装置20か否か)を判定する(S721)。待機用に設定されていなければ(S721:NO)、S722に進み、待機用に設定されていれば(S721:YES)、S723に進む。
S723では、調停部326が、サーバ切り替え管理テーブル360を参照し、当該サーバ装置20が待機用に設定されている現用サーバ装置20に、他のサーバ装置20が待機用に設定されているか否かを判定する。尚、この判定によって、当該サーバ装置20について検査を実施しても現用サーバ装置20に待機用のサーバ装置20が確保されるか否かを確認することができる。設定されている場合には(S723:YES)、S722に進み、設定されていない場合には(S723:NO)、S724に進む。
S724では、調停部326が、検査が必要とされているサーバ装置20について検査を実施できない旨を管理者に通知する。尚、この通知は、例えば表示装置や印刷装置への出力や電子メールによって行う。その後は処理が終了する。S722では、選択されている待機サーバ装置20について、前述した検査処理(図6A乃至図6C)を実施する。
尚、S723において、待機用に設定されている他のサーバ装置20が存在する場合(S723:YES)、待機用に設定されている他のサーバ装置20が既に検査中である場合、検査待ちである場合、もしくはそのサーバ装置20に障害が生じている場合(例えば構成管理テーブル330のサーバ状態408の内容から障害が生じていることを検知した場合)にも、検査処理(S722)を行わずにS724に進んで検査を実施することができない旨を管理者に通知するようにしてもよい。またこの場合には、待機用に設定されている他のサーバ装置20の検査が終了した後や障害が普及した後に検査処理(S722)を行うようにしてもよい。時間起動処理は以上のようにして行われる。
以上によれば、所定時間ごとにサーバ装置20を検査して構成管理テーブル330の内容を最新の状態に保つことができる。これによりサーバ装置20の障害を早期かつ確実に発見することができ、情報処理システム1の信頼性や可用性を確保することができる。
図8は検査処理の起動に関する処理の他の一例(以下、構成変更起動処理と称する。)を説明するフローチャートである。以下、同図とともに構成変更起動処理について説明する。
まず同図に示すように、サーバ装置20について構成変更があると、SVP40からその旨の通知(以下、構成変更通知と称する。)が管理サーバ10に送信される(S811)。
管理サーバ10の構成変更起動判定部325は、構成変更通知を受信すると(S812)、構成変更通知から特定されるサーバ装置20について、それが現用サーバ装置20か否かを判定する(S813)。判定の結果、現用サーバ装置20であれば(S813:現用)、S814に進み、現用サーバ装置20でなければ(S813:現用でない)、S815に進む。
S814では、構成変更起動判定部325が、構成管理テーブル330の、当該現用サーバ装置20の要検査フラグ407に「1」を設定する。また構成変更起動判定部325は、当該現用サーバ装置20に待機用として設定されているサーバ装置20の要検査フラグ407にも「1」を設定する。尚、このように現用サーバ装置20である場合にその待機サーバ装置20についても検査対象とするのは、現用サーバ装置20について構成変更が行われるとその待機用に設定されているサーバ装置20について当該現用サーバ装置20について要求される仕様を満たしているか否かを再度判定する必要があるからである。
S815では、構成変更起動判定部325は当該サーバ装置20の要検査フラグ407に「1」を設定する。S816〜S819の処理は、図7AのS713〜S715の処理と同様である。構成変更起動処理は以上のようにして行われる。
以上によれば、サーバ装置20に構成変更があると、自動的に検査処理が行われるので、現用サーバ装置20に障害が発生した際、現用サーバ装置20から待機サーバ装置20へのフェイルオーバを確実に行うことができ、情報処理システム1の信頼性や可用性を確保することができる。
尚、以上の実施形態の説明は本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明はその趣旨を逸脱することなく、変更、改良され得ると共に本発明にはその等価物が含まれることは勿論である。
実施形態として説明する情報処理システム1の構成図である。 管理サーバ10のハードウエアの一例である。 サーバ装置20のハードウエアの一例である。 管理サーバ10が有する機能およびデータを示す図である。 サーバ装置20のソフトウエア構成を示す図である。 構成管理テーブル330の一例である。 構成比較テーブル340の一例である。 許容機能テーブル350の一例である。 サーバ切り替え管理テーブル360の一例である。 フェイルオーバが行われる際の情報処理システム1の動作を示すフローチャートである。 検査処理を説明するフローチャートである。 情報取得処理を説明するフローチャートである。 状態判定処理を説明するフローチャートである。 時間起動処理を説明するフローチャートである。 調停処理を説明するフローチャートである。 構成変更起動処理を説明するフローチャートである。
符号の説明
1 情報処理システム
5 ネットワークスイッチ
10 管理サーバ
20 サーバ装置
30 ストレージ装置
310 障害管理部
311 障害検出部
312 サーバ制御部
320 サーバ管理部
322 情報取得部
323 状態判定部
324 時間起動判定部
325 構成変更起動判定部
326 調停部
330 構成管理テーブル
340 構成比較テーブル
350 許容機能テーブル
360 サーバ切り替え管理テーブル
40 SVP

Claims (10)

  1. 通信可能に接続された現用サーバ装置と待機サーバ装置と、前記現用サーバ装置と待機サーバ装置と通信可能に接続する管理サーバとを含み、前記現用サーバ装置における障害の発生を検知した場合に、前記待機サーバ装置の電源をオンさせた後、前記現用サーバ装置から前記待機サーバ装置へのフェイルオーバを行う情報処理システムによる前記サーバ装置の障害検知方法であって、
    前記管理サーバが、
    前記待機サーバ装置の電源をオンさせて、前記待機サーバ装置の情報を取得するステップと、
    前記情報を取得した後、前記待機サーバ装置の電源をオフさせるステップと、
    前記情報に基づき前記待機サーバ装置にフェイルオーバ可能であるか否かを判定するステップと
    を含むことを特徴とする情報処理システムの管理方法。
  2. 請求項1に記載の情報処理システムの管理方法であって、
    前記待機サーバ装置から前記情報を取得する方法として、前記サーバ装置のBIOSが出力する情報から取得する第1の情報取得方法と、前記サーバ装置において実行されるプログラムである検査プログラムから取得する第2の情報取得方法を選択可能であり、
    前記管理サーバは、
    前記待機サーバ装置の情報を取得している最中でも、
    前記現用サーバ装置のフェイルオーバが可能な場合は、前記第2の情報取得方法により前記情報を取得し、
    前記現用サーバ装置のフェイルオーバが不可な場合は、前記第1の情報取得方法により前記情報を取得すること
    を特徴とする情報処理システムの管理方法。
  3. 請求項2に記載の情報処理システムの管理方法であって、
    前記管理サーバは、前記第2の情報取得方法により前記情報を取得するに先立ち、前記検査プログラムを前記サーバ装置に格納すること
    を特徴とする情報処理システムの管理方法。
  4. 請求項1に記載の情報処理システムの管理方法であって、
    前記管理サーバは、前記現用サーバ装置の待機用となる前記待機サーバ装置に要求される仕様を記憶し、前記待機サーバ装置にフェイルオーバ可能であるか否かを判定する前記ステップにおいて、前記待機サーバ装置から取得した前記情報から特定される当該待機サーバ装置の仕様が、当該待機サーバ装置が待機用に設定されている前記現用サーバ装置の前記要求仕様を満たしていない場合に、当該待機サーバ装置にフェイルオーバ不可能であると判定すること
    を特徴とする情報処理システムの管理方法。
  5. 請求項1に記載の情報処理システムの管理方法であって、
    前記管理サーバは、前記待機サーバ装置の電源をオフさせた日時を記憶し、前記日時から所定期間が経過した場合に、前記情報を取得する前記ステップおよび前記フェイルオーバ可能であるか否かを判定する前記ステップを実行すること
    を特徴とする情報処理システムの管理方法。
  6. 請求項1に記載の情報処理システムの管理方法であって、
    前記管理サーバは、前記待機サーバ装置に構成変更があったことを検知した場合に、前記情報を取得する前記ステップおよび前記フェイルオーバ可能であるか否かを判定する前記ステップを実行すること
    を特徴とする情報処理システムの管理方法。
  7. 請求項6に記載の情報処理システムの管理方法であって、
    前記管理サーバは、前記構成変更が行われた前記待機サーバ装置が待機用に設定されている前記現用サーバ装置および当該現用サーバ装置の待機用に設定されている他の前記待機サーバ装置について、前記情報を取得する前記ステップおよび前記フェイルオーバ可能であるか否かを判定する前記ステップを実行すること
    を特徴とする情報処理システムの管理方法。
  8. 請求項1に記載の情報処理システムの管理方法であって、
    前記管理サーバは、現用サーバ装置に他の前記待機サーバ装置がさらに待機用に設定されているか否かを判定し、判定の結果、他の待機サーバ装置が待機用に設定されていた場合に前記情報を取得する前記ステップおよび前記フェイルオーバ可能であるか否かを判定する前記ステップを実行すること
    を特徴とする情報処理システムの管理方法。
  9. 通信可能に接続された現用サーバ装置と待機サーバ装置と、前記現用サーバ装置と待機サーバ装置と通信可能に接続する管理サーバとを含み、前記現用サーバ装置における障害の発生を検知した場合に、前記待機サーバ装置の電源をオンさせた後、前記現用サーバ装置から前記待機サーバ装置へのフェイルオーバを行う情報処理システムであって、
    前記管理サーバが、
    動作が停止している前記待機サーバ装置の動作を開始させて前記待機サーバ装置の情報を取得する情報取得部と、
    前記情報を取得した後、前記待機サーバ装置の電源をオフさせるサーバ制御部と、
    前記情報に基づき前記待機サーバ装置にフェイルオーバ可能か否かを判定する状態判定部と
    を備えることを特徴とする情報処理システム。
  10. 通信可能に接続された現用サーバ装置と待機サーバ装置と、前記サーバ装置と通信可能に接続する管理サーバとを含み、前記現用サーバ装置における障害の発生を検知した場合に、前記待機サーバ装置の電源をオンさせた後、前記現用サーバ装置から前記待機サーバ装置へのフェイルオーバを行う情報処理システムにおける前記管理サーバで実行され、
    動作が停止している前記待機サーバ装置の電源をオンさせて前記待機サーバ装置の情報を取得する機能と、
    前記情報を取得した後、前記待機サーバ装置の電源をオフさせる機能と、
    前記情報に基づき前記待機サーバ装置にフェイルオーバ可能であるか否かを判定する機能と
    を実現するプログラム。
JP2008113042A 2008-04-23 2008-04-23 情報処理システムの制御方法、情報処理システム、およびプログラム Active JP4802207B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008113042A JP4802207B2 (ja) 2008-04-23 2008-04-23 情報処理システムの制御方法、情報処理システム、およびプログラム
US12/392,094 US8074098B2 (en) 2008-04-23 2009-02-24 Control method for information processing system, information processing system, and program
US13/285,064 US8423162B2 (en) 2008-04-23 2011-10-31 Control method for information processing system, information processing system, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008113042A JP4802207B2 (ja) 2008-04-23 2008-04-23 情報処理システムの制御方法、情報処理システム、およびプログラム

Publications (2)

Publication Number Publication Date
JP2009265848A true JP2009265848A (ja) 2009-11-12
JP4802207B2 JP4802207B2 (ja) 2011-10-26

Family

ID=41216167

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008113042A Active JP4802207B2 (ja) 2008-04-23 2008-04-23 情報処理システムの制御方法、情報処理システム、およびプログラム

Country Status (2)

Country Link
US (2) US8074098B2 (ja)
JP (1) JP4802207B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4802207B2 (ja) 2008-04-23 2011-10-26 株式会社日立製作所 情報処理システムの制御方法、情報処理システム、およびプログラム
US20100289921A1 (en) * 2009-05-14 2010-11-18 Napoli Thomas A Digital camera having last image capture as default time
JP5383529B2 (ja) * 2010-01-21 2014-01-08 キヤノン株式会社 管理装置、システム、管理方法、及びプログラム
JP5441875B2 (ja) * 2010-12-07 2014-03-12 株式会社日立製作所 計算機システム
US8468383B2 (en) * 2010-12-08 2013-06-18 International Business Machines Corporation Reduced power failover system
US20130268801A1 (en) * 2010-12-10 2013-10-10 Nec Corporation Server management apparatus, server management method, and program
DE102012210161A1 (de) * 2012-06-15 2013-12-19 Airbus Operations Gmbh Koppelvorrichtung für ein Datenübertragungsnetzwerk und Datenübertragungsnetzwerk

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS607548A (ja) * 1983-06-27 1985-01-16 Fujitsu Ltd 自動切替制御装置
JPH02132529A (ja) * 1988-11-14 1990-05-22 Hitachi Ltd 自動監視切替制御装置
JP2005301488A (ja) * 2004-04-08 2005-10-27 Hitachi Ltd 入出力インタフェースモジュールの管理方法
JP2006163963A (ja) * 2004-12-09 2006-06-22 Hitachi Ltd ディスク引き継ぎによるフェイルオーバ方法
JP2007066216A (ja) * 2005-09-02 2007-03-15 Hitachi Ltd ブート構成変更方法
JP2007183701A (ja) * 2006-01-04 2007-07-19 Hitachi Ltd スナップショット再起動方法

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4377000A (en) * 1980-05-05 1983-03-15 Westinghouse Electric Corp. Automatic fault detection and recovery system which provides stability and continuity of operation in an industrial multiprocessor control
US4958270A (en) * 1989-01-23 1990-09-18 Honeywell Inc. Method for control data base updating of a redundant processor in a process control system
US5136498A (en) * 1990-09-26 1992-08-04 Honeywell Inc. Method for enacting failover of a 1:1 redundant pair of slave processors
US6275953B1 (en) * 1997-09-26 2001-08-14 Emc Corporation Recovery from failure of a data processor in a network server
US6625750B1 (en) * 1999-11-16 2003-09-23 Emc Corporation Hardware and software failover services for a file server
US6898727B1 (en) * 2000-03-22 2005-05-24 Emc Corporation Method and apparatus for providing host resources for an electronic commerce site
US7318107B1 (en) * 2000-06-30 2008-01-08 Intel Corporation System and method for automatic stream fail-over
US6823477B1 (en) * 2001-01-23 2004-11-23 Adaptec, Inc. Method and apparatus for a segregated interface for parameter configuration in a multi-path failover system
US7287187B2 (en) * 2001-10-15 2007-10-23 Sun Microsystems, Inc. Method and apparatus for supplying redundant power
JP2003131900A (ja) * 2001-10-24 2003-05-09 Hitachi Ltd サーバシステム運用管理方式
US20030149750A1 (en) * 2002-02-07 2003-08-07 Franzenburg Alan M. Distributed storage array
US6820098B1 (en) * 2002-03-15 2004-11-16 Hewlett-Packard Development Company, L.P. System and method for efficient and trackable asynchronous file replication
US7130899B1 (en) * 2002-06-14 2006-10-31 Emc Corporation Robust indication processing
US7096333B2 (en) * 2002-07-18 2006-08-22 International Business Machines Corporation Limited concurrent host access in a logical volume management data storage environment
DE10318107A1 (de) * 2003-04-22 2004-11-11 Bayer Materialscience Ag Wässrige Klebstoff-Dispersionen
US7661014B2 (en) * 2003-04-23 2010-02-09 Dot Hill Systems Corporation Network storage appliance with integrated server and redundant storage controllers
US7159234B1 (en) * 2003-06-27 2007-01-02 Craig Murphy System and method for streaming media server single frame failover
JP4462969B2 (ja) * 2004-03-12 2010-05-12 株式会社日立製作所 フェイルオーバクラスタシステム及びフェイルオーバ方法
US7478263B1 (en) * 2004-06-01 2009-01-13 Network Appliance, Inc. System and method for establishing bi-directional failover in a two node cluster
US7219255B2 (en) * 2004-07-27 2007-05-15 Mks Instruments, Inc. Failsafe switching of intelligent controller method and device
JP2006048122A (ja) * 2004-07-30 2006-02-16 Ntt Docomo Inc 通信システム
JP2006163969A (ja) 2004-12-09 2006-06-22 Dainippon Printing Co Ltd サーバ、電子ペン、電子ペン用帳票及びプログラム
JP4671399B2 (ja) * 2004-12-09 2011-04-13 株式会社日立製作所 データ処理システム
US7529783B2 (en) * 2004-12-22 2009-05-05 International Business Machines Corporation Log shipping data replication with parallel log writing and log shipping at the primary site
US8275749B2 (en) * 2005-02-07 2012-09-25 Mimosa Systems, Inc. Enterprise server version migration through identity preservation
US8161318B2 (en) * 2005-02-07 2012-04-17 Mimosa Systems, Inc. Enterprise service availability through identity preservation
US7464302B2 (en) * 2005-05-04 2008-12-09 International Business Machines Corporation Method and apparatus for expressing high availability cluster demand based on probability of breach
JP4487920B2 (ja) 2005-12-12 2010-06-23 株式会社日立製作所 ブート制御方法および計算機システム並びにその処理プログラム
JP4414961B2 (ja) 2005-12-13 2010-02-17 株式会社日立製作所 管理サーバによる管理方法、管理サーバ、計算機システムおよび管理プログラム
US8359112B2 (en) * 2006-01-13 2013-01-22 Emerson Process Management Power & Water Solutions, Inc. Method for redundant controller synchronization for bump-less failover during normal and program mismatch conditions
US7613749B2 (en) * 2006-04-12 2009-11-03 International Business Machines Corporation System and method for application fault tolerance and recovery using topologically remotely located computing devices
JP2007293448A (ja) * 2006-04-21 2007-11-08 Hitachi Ltd ストレージシステム及びその電源制御方法
US7562247B2 (en) * 2006-05-16 2009-07-14 International Business Machines Corporation Providing independent clock failover for scalable blade servers
US7444541B2 (en) * 2006-06-30 2008-10-28 Seagate Technology Llc Failover and failback of write cache data in dual active controllers
JP4923990B2 (ja) * 2006-12-04 2012-04-25 株式会社日立製作所 フェイルオーバ方法、およびその計算機システム。
US7711979B2 (en) * 2007-02-16 2010-05-04 Symantec Corporation Method and apparatus for flexible access to storage facilities
US8028193B2 (en) * 2007-12-13 2011-09-27 International Business Machines Corporation Failover of blade servers in a data center
JP4802207B2 (ja) 2008-04-23 2011-10-26 株式会社日立製作所 情報処理システムの制御方法、情報処理システム、およびプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS607548A (ja) * 1983-06-27 1985-01-16 Fujitsu Ltd 自動切替制御装置
JPH02132529A (ja) * 1988-11-14 1990-05-22 Hitachi Ltd 自動監視切替制御装置
JP2005301488A (ja) * 2004-04-08 2005-10-27 Hitachi Ltd 入出力インタフェースモジュールの管理方法
JP2006163963A (ja) * 2004-12-09 2006-06-22 Hitachi Ltd ディスク引き継ぎによるフェイルオーバ方法
JP2007066216A (ja) * 2005-09-02 2007-03-15 Hitachi Ltd ブート構成変更方法
JP2007183701A (ja) * 2006-01-04 2007-07-19 Hitachi Ltd スナップショット再起動方法

Also Published As

Publication number Publication date
US8423162B2 (en) 2013-04-16
US8074098B2 (en) 2011-12-06
US20120047395A1 (en) 2012-02-23
JP4802207B2 (ja) 2011-10-26
US20090271654A1 (en) 2009-10-29

Similar Documents

Publication Publication Date Title
JP4802207B2 (ja) 情報処理システムの制御方法、情報処理システム、およびプログラム
JP6530774B2 (ja) ハードウェア障害回復システム
US8661290B2 (en) Saving power in computing systems with redundant service processors
US9092453B2 (en) Monitoring device, information processing apparatus, and monitoring method
US8255928B2 (en) Automated termination of selected software applications in response system events
AU2014376751B2 (en) Redundant system and method for managing redundant system
US20170149925A1 (en) Processing cache data
JP2010067042A (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
US9208124B2 (en) Reset of processing core in multi-core processing system
JP2013097553A (ja) 切替制御装置、切替制御方法、情報処理装置および切替制御プログラム
CN111949320B (zh) 提供系统数据的方法、系统及服务器
JP4655718B2 (ja) コンピュータシステム及びその制御方法
JP2019121338A (ja) 機器ラック及び機器ラックからの状態報告を保証する方法
WO2007094041A1 (ja) サーバ管理装置及びサーバ管理プログラム
JP2013149128A (ja) 計算機システム、電源切断処理装置、電源切断処理方法およびプログラム
JP4852585B2 (ja) マルチパス・データ通信においてエネルギーを節約するためのコンピュータ実行される方法、コンピュータ使用可能なプログラム製品、およびデータ処理システム
JP5884801B2 (ja) パス切替装置、パス切替方法及びパス切替プログラム
JP6697102B1 (ja) 情報処理装置、情報処理装置の制御方法、及び、情報処理装置の制御プログラム
KR101564144B1 (ko) 펌웨어 관리 장치 및 방법
TWI715005B (zh) 用於監控基板管理控制器之常駐程序的方法
JP2007004364A (ja) デバッグシステム、デバッグ方法およびプログラム
US20140025982A1 (en) Information processing equipment and control method
JP2024102723A (ja) 監視プログラム,監視装置および監視方法
JP2013149201A (ja) 情報処理システム、及び、情報処理システムの制御方法
TW201820134A (zh) 電子裝置及電子裝置之操作方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110712

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110808

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140812

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4802207

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150