JPWO2013072985A1 - 計算機システムを管理する管理システム、計算機システムの管理方法及び記憶媒体 - Google Patents

計算機システムを管理する管理システム、計算機システムの管理方法及び記憶媒体 Download PDF

Info

Publication number
JPWO2013072985A1
JPWO2013072985A1 JP2013544002A JP2013544002A JPWO2013072985A1 JP WO2013072985 A1 JPWO2013072985 A1 JP WO2013072985A1 JP 2013544002 A JP2013544002 A JP 2013544002A JP 2013544002 A JP2013544002 A JP 2013544002A JP WO2013072985 A1 JPWO2013072985 A1 JP WO2013072985A1
Authority
JP
Japan
Prior art keywords
switching destination
computer
candidate
performance
adapter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013544002A
Other languages
English (en)
Other versions
JP5779254B2 (ja
Inventor
穣毅 荒田
穣毅 荒田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2013072985A1 publication Critical patent/JPWO2013072985A1/ja
Application granted granted Critical
Publication of JP5779254B2 publication Critical patent/JP5779254B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2033Failover techniques switching over of hardware resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2035Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • G06F11/2092Techniques of failing over between control units

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本発明の一実施形態の管理システムは、複数計算機の性能を管理する計算機性能管理情報、複数I/Oアダプタによる通信のI/O性能を管理するI/O性能管理情報、切替先計算機候補と切替先I/Oアダプタ候補との切替先組合せ候補の優先度を切替元計算機と前記切替先計算機候補との間の計算機性能関係及び切替元I/Oアダプタと前記切替先I/Oアダプタ候補との間のI/O性能関係に関連付ける優先度管理情報を有する。管理システムは、現用計算機と現用I/Oアダプタとの組合せにおける一方の装置を他の装置に切替えるため、切替先計算機候補と切替先I/Oアダプタ候補との1以上の切替先候補組合せを決定する。管理システムは、前記1以上の切替先組合せ候補のそれぞれの優先度を、前記現用計算機と前記切替先計算機候補との間の性能関係及び前記現用I/Oアダプタと前記切替先I/Oアダプタ候補との間の性能関係に基づき決定する。

Description

本発明は、計算機システムを管理する管理システム、計算機システムの管理方法及び記憶媒体に関し、特に、計算機システムにおける装置の切替えに関する。
従来の計算機システムの一つは、サーバ計算機と、サーバ計算機にボリュームを提供するストレージシステムとを含み、サーバ計算機は、同一筺体内に実装されそのサーバ計算機に直接に筺体内配線により接続されているI/O(Input/Output)アダプタを介して、ストレージシステムにアクセスする。
現用サーバ計算機又は現用I/Oアダプタで障害が発生すると、計算機システムは、障害が発生した現用サーバ計算機及び現用I/Oアダプタの組合せから、待機サーバ計算機及び待機I/Oアダプタの組合せに切替える。計算機システムは、I/Oアダプタとストレージシステムとのパスを、現用I/Oアダプタから待機I/Oアダプタに切替える。
従来の計算機システムの他の一つは、サーバ計算機とI/Oアダプタをネットワークで接続した構成において、現用サーバ計算機に障害が発生した場合の障害復旧において、現用I/Oアダプタへのパスを他の待機サーバ計算機に切替えることで現用サーバ計算機のみを待機サーバ計算機に切替え、現用I/Oアダプタを引継ぐ。
特許文献1に開示の管理計算機は、現用サーバ計算機に障害が発生したとき、現用サーバ計算機から待機サーバ計算機に、ストレージシステムへのパスを切り替えることで、待機サーバ計算機に業務を引き継がせる。管理計算機は、サーバ計算機における機器情報と切替方法とが対応付けられている切替戦略テーブルを参照し、現用サーバ計算機及び待機サーバ計算機の機器に応じて切替戦略を選択する。
特開2010−128644号公報
上記従来技術の現用サーバ計算機から待機サーバ計算機への切替えにおいて、待機サーバ計算機に接続するI/Oアダプタは予め決められている。そのため、上記従来技術は、切替先にいずれのI/Oアダプタを使用するか判定しない。しかし、切替先のサーバ計算機とI/Oアダプタの選び方により性能又は信頼性に差が生じるシステム構成において、従来技術の切替方法は、障害復旧後に、サーバ計算機とI/Oアダプタとによる処理性能又は信頼性の低下を引き起こすリスクが高い。
本発明の一態様は、複数の計算機と、前記複数の計算機がネットワークに接続するための複数のI/Oアダプタと、を含む計算機システムを管理し、プロセッサと記憶装置とを含む管理システムでる。前記記憶装置は、前記複数の計算機のそれぞれの性能を管理する計算機性能管理情報を格納する。前記記憶装置は、前記複数のI/Oアダプタのそれぞれによる通信のI/O性能を管理するI/O性能管理情報を格納する。前記記憶装置は、切替先計算機候補と切替先I/Oアダプタ候補との切替先組合せ候補の優先度を、切替元計算機と前記切替先計算機候補との間の計算機性能関係、及び、切替元I/Oアダプタと前記切替先I/Oアダプタ候補との間のI/O性能関係、に関連付ける優先度管理情報を格納する。前記プロセッサは、現用計算機と現用I/Oアダプタとの組合せにおける一方の装置を他の装置に切替えるため、切替先計算機候補と切替先I/Oアダプタ候補との1以上の切替先候補組合せを決定する。前記プロセッサは、前記1以上の切替先組合せ候補のそれぞれの優先度を、前記計算機性能管理情報、前記I/O性能管理情報及び前記優先度管理情報を参照して、前記現用計算機と前記切替先計算機候補との間の性能関係及び前記現用I/Oアダプタと前記切替先I/Oアダプタ候補との間の性能関係に基づき決定する。
本発明の一態様によれば、計算機とI/Oアダプタの組合せの切替えの後に、性能又は信頼性が低下するリスクを軽減することができる。
本実施形態の計算機システムの構成例を模式的に示す図である。 本実施形態の管理サーバ計算機の構成例を模式的に示す図である。 本実施形態のサーバ計算機の構成例を模式的に示す図である。 本実施形態のPCIeスイッチの構成例を模式的に示す図である。 本実施形態におけるフェイルオーバの例を示す図である。 本実施形態におけるフェイルオーバの他の例を示す図である。 本実施形態のサーバ計算機性能管理テーブルの例を示す図である。 本実施形態のHBA性能管理テーブルの例を示す図である。 本実施形態のFCスイッチ性能管理テーブルの例を示す図である。 本実施形態のサーバHBA間接続管理テーブルの例を示す図である。 本実施形態のPCIeスイッチ間接続管理テーブルの例を示す図である。 本実施形態のサーバ計算機性能優先度管理テーブルの例を示す図である。 本実施形態のI/O性能優先度管理テーブルの例を示す図である。 本実施形態のトポロジ優先度管理テーブルの例を示す図である。 本実施形態の切替方式優先度管理テーブルの例を示す図である。 本実施形態のサーバ位置関係優先度管理テーブルの例を示す図である。 本実施形態のテーブル優先度管理テーブルの例を示す図である。 本実施形態の切替先候補テーブルの例を示す図である。 本実施形態のユーザ要件管理テーブルの例を示す図である。 本実施形態において、管理者によるユーザ要件の変更により発行されるユーザ要件変更イベントに応答したユーザ要件受付プログラムのフロー例を示すフローチャートである。 本実施形態のユーザ要件受付プログラム、切替プログラム及び切替先選定プログラムのフロー例を示すフローチャートである。 本実施形態のユーザ要件受付プログラムのフロー例を示すフローチャートである。 本実施形態の切替プログラムのフロー例を示すフローチャートである。 本実施形態の切替先選定プログラムのフロー例を示すフローチャートである。 本実施形態の切替先選定プログラムのフロー例を示すフローチャートである。 本実施形態において、管理サーバ計算機が管理者に提示する切替先候補画像の一例を示す図である。
以下、図面を参照しつつ、本発明を実施するための形態を説明する。説明の明確化のため、以下の記載及び図面は、適宜、省略及び簡略化がなされている。本実施形態の計算機システムは、管理システムと、複数の計算機と、複数のI/O(Input/Output)アダプタを含む。計算機は、割り当てられているI/Oアダプタを介してネットワークに接続し、例えば、データ通信ネットワークを介してストレージシステムにアクセスする。
本実施形態の管理システムは、切替先組合せを決定するための優先度管理テーブルを持つ。計算機若しくはI/Oアダプタにおいて障害が発生すると、管理システムは、切替先計算機候補と切替先I/Oアダプタ候補との組合せである切替先組合せ候補を選択し、それらの優先度を決定する。これにより、管理者又はシステムは適切な切替先組合せを選択することができる。
図1は、本実施形態の計算機システムの構成例を模式的に示すブロック図である。計算機システムは、複数(本例において二つ)のサーバシステム110A、110B、ネットワークスイッチ120、管理サーバ計算機130、ファイバチャネルスイッチ(FCスイッチ)140、ストレージシステム150を含む。本実施形態の計算機システムにおいて、各装置の数は設計により変化する。
サーバシステム110Aは、筺体111A内にサーバ計算機(業務サーバ計算機)112A〜112C及びPCIeスイッチ113Aを含む。PCIeスイッチ113Aは、HBA(Host Bus Adapter)114A、114Bを含む。サーバシステム110Bは、筺体111B内にサーバ計算機112D、112E及びPCIeスイッチ113Bを含む。PCIeスイッチ113Bは、HBA114C、114Dを含む。HBAは、サーバ計算機のI/Oアダプタであり、計算機をネットワークに接続するためのプロトコル変換等を行うインタフェースである。
PCIeスイッチ113A、113Bは、筐体111A、111B間の配線により通信可能に接続されている。サーバシステム110A、110Bは、それぞれ、サーバシステム全体を制御するコントローラ(不図示)を含む。
ネットワークスイッチ120を含むネットワークは管理ネットワークであり、管理サーバ計算機130は、ネットワークスイッチ120を介して他の装置、つまり、サーバシステム110A、110B、ファイバチャネルスイッチ140及びストレージシステム150に接続する。管理サーバ計算機130は、ネットワークスイッチ120を介して、各装置の管理のために必要なデータの送受信を行う。典型的には、管理ネットワークはIPネットワークであるが、他のプロトコルを使用してもよい。
ファイバチャネルスイッチ140を含むネットワークはストレージシステム150に格納されるデータの通信用のネットワークであって、本構成においては、SAN(Storage Area Network)である。本例において、SANは、ファイバチャネルを利用する。SANは、複数のファイバチャネルスイッチを含むことができる。
このデータの通信用のネットワークは、データ通信用のネットワークであればファイバチャネルと異なるプロトコルを利用してもよく、SAN以外のネットワーク、例えばiSCSI(Internet Small Computer System Interface)ネットワークやIPネットワークでもよい。
ストレージシステム150は、サーバシステム110A、110Bのそれぞれにボリュームを提供する。サーバシステム110A、110Bの各サーバ計算機は、FCスイッチ140を介して、ストレージシステム150のボリュームにアクセスする。PCIeスイッチ113A、113Bは筺体間配線により接続されており、サーバシステム110A、110Bのそれぞれのサーバ計算機には、PCIeスイッチ113A又はPCIeスイッチ113BのいずれかのHBAが割り当てられる。
サーバシステム110A、110Bのそれぞれのサーバ計算機は、割り当てられたHBAに接続して、それを介してファイバチャネルスイッチ14に接続する。図1において、サーバ計算機112A、112B、112Dは現用サーバ計算機であり、それぞれ、HBA114A、114B、HBA114Cを介してストレージシステム150のボリュームにアクセスする。サーバ計算機112C、112Eは待機サーバ計算機であり、いずれのHBAにも接続していない。HBA114Dは、待機HBAであり、いずれのサーバ計算機にも割り当てられていない。
一つの現用サーバ計算機には一つの現用HBAが割り当てられ、現用サーバ計算機は、障害発生又は管理者による指示による切替えがなければ、ストレージシステム150とのデータ通信のために、割りてられている同一の現用HBAを使用し続ける。
図2は、管理サーバ計算機130のハードウェア構成及びソフトウェア構成を模式的に示すブロック図である。管理サーバ計算機130は、プロセッサ131、主記憶装置であるメモリ132、二次記憶装置133、ネットワークインタフェース134、入力装置137、ディスプレイ138を備える。これらは、バスを介して接続している。
管理サーバ計算機130は、ネットワークインタフェース134を介してネットワークスイッチ120と接続しており、システム内の他の装置との間で通信を行う。管理者(ユーザ)は、入力装置137及びディスプレイ138を使用して、必要な情報の入力及び確認を行う。入力装置137は、典型的には、マウスとキーボードである。
管理サーバ計算機130は、ディスプレイ138とは異なる出力装置を備えていてもよい。図2は、入出力装置137を備える管理サーバ計算機130を例示するが、管理者は、ネットワークを介して、別の端末から管理サーバ計算機130の機能を利用してもよい。本例の管理システムは管理サーバ計算機130で構成されているが、管理システムは複数の計算機で構成してもよい。複数の計算機の一つは表示用計算機であってもよく、管理処理の高速化や高信頼化のために、複数の計算機が管理計算機と同等の処理を実現してもよい。
プロセッサ131は、メモリ132に格納されているプログラムを実行することによって管理サーバ計算機130の所定の機能を実現する。具体的には、管理サーバ計算機130は、不図示のOS(Operating System)に加え、切替プログラム321、切替先選定プログラム322、ユーザ要件受付プログラム323を格納している。本例は、管理サーバ計算機130の管理機能を3つのプログラムにより示すが、プログラムの数はいくつでもよい。これらプログラムの詳細は後述する。
メモリ132は、さらに、これらプログラム321〜323が利用する情報を格納している。具体的には、メモリ132は、性能管理情報324、接続管理情報325、優先度管理情報326、切替先候補情報327、ユーザ要件管理情報328を格納している。各情報の詳細は後述する。
後述するように、本構成例においては、システム管理に使用される情報は、テーブルに格納されている。必要な情報を含むテーブルの数及び各テーブルが格納する情報は、システム設計に依存する。本実施形態において、データ記憶領域に格納される情報はデータ構造に依存せず、どのようなデータ構造で表現されていてもよい。例えば、テーブル、リスト若しくはデータベースが情報を示すことができる。この点は、他の装置について同様である。
プロセッサ131は、上記プログラムに従って動作することで、これらの機能を実現する機能部として動作する。従って、プログラムの行う処理は、プロセッサ131及びそのプロセッサ131を含む管理サーバ計算機130の処理である。図2は、説明の便宜上、メモリ132内にプログラム及び情報を示しているが、管理サーバ計算機130の処理において必要とされるデータ(プログラムを含む)は、典型的に、二次記憶装置133からメモリ132にロードされる。二次記憶装置133はネットワークを介してメモリ132に接続していてもよい。これらの点は、他の計算機について同様である。
図3は、サーバ計算機112A〜112Eのハードウェア構成を模式的に示すブロック図である。サーバ計算機112A〜112Eは、同様の基本的ハードウェア構成を有している。各サーバ計算機112A〜112Eは、プロセッサ301、主記憶装置であるメモリ302、PCIeスイッチインタフェース303、BMC(Base board Manegement Controller)304を含む。
図示していないが、メモリ302は、OS、アプリケーションプログラム及びプログラムが参照する情報が格納されており、プロセッサ301は、それらプログラムに従って動作する。サーバ計算機は、それぞれ、PCIeスイッチインタフェース303を介して、PCIeスイッチ113A又は113Bに接続する。本計算機システムにおいて、メモリ302に格納される上記データは、ストレージシステム150からロードされる。
BMC224は、サーバ計算機がネットワークスイッチ120に接続するためのインタフェースとして機能する。さらに、BMC224は、サーバ計算機112Aの管理用コントローラであり、サーバ計算機112Aにおけるハードウェア・エラーを監視し、サーバ計算機112AのOSやサーバシステムの筐体コントローラ(不図示)に通知する。
図4は、PCIeスイッチ113A、113Bの構成を模式的に示すブロック図である。PCIeスイッチ113A、113Bは、それぞれ、スイッチ制御機構401と複数のHBAを含む。図4の例において二つのHBA402A、402Bが組み込まれている。本例において、HBA402A、402Bは、FCネットワークに接続するための通信インタフェースカードである。
スイッチ制御機構401は、サーバ計算機とHBAとの接続(組合せ)を制御する。スイッチ制御機構401は、サーバ計算機と、そのサーバ計算機に割り当てられているHBAとを接続する。サーバ計算機とストレージシステム150との通信において、スイッチ制御機構401は、そのサーバ計算機に割り当てられているHBAを介して、データをサーバ計算機とストレージシステム150に転送する。
スイッチ制御機構401は、他のPCIeスイッチ(他のサーバシステム筺体内のPCIeスイッチ)のスイッチ制御機構401に接続することができる。スイッチ制御機構401は、同一筺体内のサーバ計算機に別筺体のHBAが割り当てられている場合、その同一筺体内のサーバ計算機から受信したデータを別筺体に収容されているPCIeスイッチのスイッチ制御機構401に転送し、そして、別筺体内のHBAが受信したデータを別筺体のスイッチ制御機構401から受信して同一筺体内のサーバ計算機に転送する。
割り当てられているHBAと同一筺体内のスイッチ制御機構401は、別筺体のスイッチ制御機構401から転送されたデータを同一筺体内のHBAに転送し、そのHBAから受信したデータを別筺体のPCIeスイッチのスイッチ制御機構401に転送する。
計算機システムが3以上のサーバシステムを含み、異なる筺体に収容されている3以上のPCIeスイッチが存在する場合、PCIeスイッチは直列に接続される。組合せを構成するサーバ計算機とHBAとの間において、各PCIeスイッチが通信データを順次転送する。
図5は、本実施形態の計算機システムにおけるフェイルオーバの例を示す。計算機システムは、サーバ計算機若しくはHBAにおいて障害発生した場合に自動的に又はメンテナンスための管理者からの指示等によって、フェイルオーバ(切替え)を実施する。本計算機システムは、所定の基準に基づいて、現用サーバ計算機と現用HBAの組合せを、他の組合せに切替える。切替先組合せと切替元組合せとの間において、サーバ計算機とHBA双方又は一方の装置が異なる。図5の例においては、双方の装置が切替えられている。
図5において、現用サーバ計算機112Bにおいて発生した障害に対するフェイルオーバを示している。現用サーバ計算機112Bは、現用HBA114Bを介して、ストレージシステム150と通信を行う。計算機システムは、現用サーバ計算機112Bを別の筺体111B内の待機サーバ計算機112Eに切替え、現用HBA114Bを筺体111B内の待機HBA114Dに切替える。
切替先のサーバ計算機112Eは、切替先のHBA114Dを介して、ストレージシステム150のブートディスク155から必要なデータを読み込み、サーバ計算機112Bのタスクを引き継ぐ。サーバ計算機112Eは、その後、HBA114Dを使用してストレージシステム150と通信を行う。
典型的に、管理者は、障害発生したサーバ計算機112Eを新たなサーバ計算機に交換し、その後、管理サーバ計算機130を使用して、サーバ計算機112EとHBA114Dの組合せを、新たに組み込んだサーバ計算機とHBA114Bの組合せに切替える。
管理サーバ計算機130は、切替先のサーバ計算機及びHBAの組合せによる性能及び信頼性が、現用組合せの性能及び信頼性からできるだけ低下しないように、切替先のサーバ計算機及びHBAの組合せを選択する。これにより、フェイルオーバ後の性能及び信頼性の低下を小さくする。管理サーバ計算機130による切替先組合せの決定方法の詳細は後述する。
図6は、本実施形態の計算機システムにおけるフェイルオーバの他の例を示す。現用サーバ計算機112Dにおいて発生した障害に対するフェイルオーバを示している。現用サーバ計算機112Dは、現用HBA114Cを介して、ストレージシステム150と通信を行う。計算機システムは、現用サーバ計算機112Dを同一筺体111B内の待機サーバ計算機112Eに切替え、現用HBA114Cを切替えることなく使用し続ける。
切替先のサーバ計算機112Eは、現用HBA114Cを介して、ストレージシステム150のブートディスク155から必要なデータを読み込み、サーバ計算機112Dのタスクを引き継ぐ。サーバ計算機112Eは、その後、HBA114Dを使用してストレージシステム150と通信を行う。図5の例と同様に、管理サーバ計算機130は、切替先のサーバ計算機及びHBAの組合せによる性能及び信頼性が、現用の組合せの性能及び信頼性からできるだけ低下しないように、切替先のサーバ計算機及びHBAの組合せを選択する。
図7A〜図7Cは、管理サーバ計算機130が格納する性能管理情報324の例を示している。性能管理情報324は、サーバ計算機112A〜112E、HBA114A〜114DそしてFCスイッチ140の性能を管理する。具体的には、性能管理情報324は、図7Aに示すサーバ計算機性能管理テーブル701、図7Bに示すHBA性能管理テーブル702、そして、図7Cに示すFCスイッチ性能管理テーブル703を含む。
サーバ計算機性能管理テーブル701は、サーバ識別子カラム711、スロット番号カラム712、CPU性能カラム713、メモリ性能カラム714、SMP(Symmetric MultiProcessing)構成カラム715、運用形態カラム716、そして状態カラム717を有する。
サーバ識別子カラム711は、サーバ計算機を識別するためのサーバ識別子を格納する。サーバ計算機A〜サーバ計算機Eは、それぞれ、サーバ計算機112A〜サーバ計算機112Eに該当する。スロット番号カラム712は、各筺体内においてサーバ計算機が取り付けられているスロットを識別するためのスロット番号を格納する。本実施形態において、特に言及がない場合、「識別情報」、「識別子」、「名」、「名前」、「ID」という表現は、互いに置換が可能である。
CPU性能カラム713及びメモリ性能カラム714、は、それぞれ、サーバ計算機のCPU及びメモリの性能を格納する。CPU性能は、本例において、CPUの動作周波数及びコア数により示されている。メモリ性能は、本例において、メモリ容量により示されている。これらの性能は他の指標で表されていてもよい。
SMP構成カラム715は、サーバ計算機がSMP構成を有するか、SMP構成を有する場合にそれに含まれるサーバ計算機(スロット)の数を示すデータを格納する。広く知られているように、SMP構成のサーバ計算機は、結合された複数のサーバ計算機を含み、一つのサーバ計算機として機能する。例えば、サーバ計算機A(112A)は、2スロットに取り付けられた二つのサーバ計算機により構成されている。
SMP構成のサーバ計算機のスロット番号は、それに含まれる一つのサーバ計算機のスロット番号である。そのCPU性能及びメモリ性能は、構成要素の全てのサーバ計算機のCPUの性能及びメモリ性能により示される。例えば、サーバ計算機Aは二つのサーバ計算機で構成されており、それぞれが2GHz×4コアのCPU及び128GByteのメモリを有する。
運用形態カラム716は、サーバ計算機が現用サーバ計算機であるか待機サーバ計算機であるかを示すデータを格納する。本例において、サーバ計算機の運用形態が変更されることはない。状態カラム717は、サーバ計算機の動作状態を示すデータを格納する。具体的には、状態カラム717は、サーバ計算機の動作が正常であるか、異常であるか、又は切替中であるかを示すデータ格納する。
「正常」である現用サーバ計算機に障害が発生すると、その現用サーバ計算機の状態は、「異常」(不図示)に変更され、その障害サーバ計算機は、「正常」の待機サーバ計算機に切替えられる。切替えられた待機サーバ計算機の状態は、「正常」から「切替中」(不図示)に変更される。
管理サーバ計算機130、例えば切替プログラム321又は他のテーブル管理プログラムは、サーバシステム110A、110Bからサーバ計算機性能管理テーブル701に格納する情報を取得することができる。サーバシステム110A、110Bのコントローラは、管理サーバ計算機130から要求に応答して必要な情報を送信する。この点は、次に説明するHBA性能管理テーブル702について同様である。
図7Bに示すHBA性能管理テーブル702は、HBA識別子カラム721、スロット番号カラム722、性能カラム723、ベンダカラム724、運用形態カラム725、状態カラム726を有する。HBA識別子カラム721は、計算機システム内でHBAを識別するための識別子を格納する。HBA−A〜HBA−Dは、それぞれ、HBA114A〜HBA114Dに対応する。スロット番号カラム712は、各サーバシステムの筺体内においてHBAが取り付けられているスロットを識別するためのスロット番号を格納する。
性能カラム723は、HBAの性能を示す値を格納し、それはリンク速度(Gbps)で表されている。ベンダカラム724は、HBAのベンダを識別する値を格納する。運用形態カラム725と状態カラム726が格納する情報は、上記サーバ計算機性能管理テーブル701と同様であり、説明を省略する。
図7Cに示すFCスイッチ性能管理テーブル703は、FCスイッチ識別子カラム731及び性能カラム732を有する。本例の計算機システムに含まれるFCスイッチは一つのみであるため、ファイバチャネルスイッチ性能管理テーブル703のエントリも一つである。
FCスイッチ識別子カラム731は、FCスイッチの識別子を格納し、性能カラム732はFCスイッチの性能を示すデータを格納する。FCスイッチの性能は、そのリンク速度(Gbps)で表されている。サーバ計算機とストレージシステム150との間のI/O性能(リンク速度)は、HBAとFCスイッチのリンク速度の最小値で決まる。
本例において、FCスイッチ性能管理テーブル703には一つのFCスイッチのみ登録されている。計算機システムが複数のFCスイッチを含む場合、FCスイッチ性能管理テーブル703はそれらの情報を格納する。管理サーバ計算機130は、FCスイッチ140から、FCスイッチ性能管理テーブル703に格納する情報を取得することができる。
図8A、図8Bは、接続管理情報325の例を示している。接続管理情報325は、サーバ計算機とHBAとの間の接続状態、及び、PCIeスイッチ間(筺体間)の接続状態を管理する。具体的には、接続管理情報325は、図8Aに示すサーバ計算機HBA間接続管理テーブル801、及び、図8Bに示すPCIeスイッチ間接続管理テーブル802を含む。
図8Aに示すサーバ計算機HBA間接続管理テーブル801は、サーバ識別子カラム811、サーバ格納筺体識別子カラム812、HBA識別子カラム813、HBA格納筺体識別子カラム814、FCスイッチ識別子カラム815を有する。サーバ格納筺体識別子カラム812の各フィールドは、同一エントリのサーバ識別子により同定されるサーバ計算機が格納されている筺体の識別子を格納する。筺体A、筺体Bは、それぞれ、筺体111A、筺体111Bである。
HBA格納筺体識別子カラム814、同一エントリのHBA識別子により同定されるHBAが格納されている筺体の識別子を格納する。FCスイッチ識別子カラム815の各フィールドは、同一エントリのHBAが接続するFCスイッチの識別子を格納する。
HBAが接続されていない(割り当てられていない)サーバ計算機(本例においてサーバ計算機C、サーバ計算機D)のエントリにおいて、HBA識別子カラム813、HBA格納筐体識別子カラム814、FCスイッチ識別子カラム815のフィールドの値は、「なし」を示す。サーバ計算機と接続されていないHBA(本例においてHBA−D)のエントリにおいて、サーバ識別子カラム811とサーバ格納筐体識別子カラム812のフィールドの値は、「なし」を示す。
本例のサーバ計算機HBA接続管理テーブル801は、例えば、筐体Aに格納されたサーバ計算機A、サーバ計算機Bが、それぞれ、筐体Aに格納されたHBA−A、HBA−Bに接続されていることを示している。さらに、HBA−A、HBA−BはFCスイッチAと接続していることを示している。また、筐体Bに格納されたサーバ装置Dと、筐体Bに格納されたHBA−Cが接続されていることを示している。さらに、HBA−CはFCスイッチAと接続していることを示している。
図8Bに示すPCIeスイッチ間接続管理テーブル802は、順序カラム821、及び、筺体識別子カラム822を有する。順序カラム821は、筺体(PCIeスイッチ)の接続順序を示すデータを格納する。本例において、各筺体(PCIeスイッチ)には、接続順に従って昇順の数字が割り当てられる。PCIeスイッチは、例えば、最大4台まで接続することができる。
例えば、筺体(PCIeスイッチ)X、筺体(PCIeスイッチ)Y、筺体(PCIeスイッチ)Zがこの順序で直列に接続している場合、筺体(PCIeスイッチ)X、筺体(PCIeスイッチ)Y、筺体(PCIeスイッチ)Zにそれぞれ、1、2、3の値が割り当てられる。管理サーバ計算機130は、順序カラム821の情報により、サーバ計算機とHBAとの間の経由筺体数(PCIeスイッチ数)、つまり、それらの間の位置関係(距離)を知ることができる。
図9A〜図9Fは、優先度管理情報326の例を示す。優先度管理情報326は、障害発生又は管理者による切替えにおける、切替先を選択する指針を示す。優先度管理情報326は、サーバ計算機性能優先度管理テーブル901、I/O性能優先度管理テーブル902、トポロジ優先度管理テーブル903、切替方式優先度管理テーブル904、サーバ位置関係優先度管理テーブル905を含む。さらに、優先度管理情報326は、テーブル優先度管理テーブル906を含む。
本例において、管理サーバ計算機130は、複数の基準(項目)に基づいて、切替先の優先度(本例において優先順位)を決定する。各基準の優先順位が、上記テーブルのそれぞれに定義されている。サーバ計算機性能優先度管理テーブル901は、切替えられる二つのサーバ計算機間の性能関係に対する優先順位を定義する。サーバ計算機性能優先度管理テーブル901は、性能関係カラム911及び優先順位カラム912を有し、サーバ計算機間の三つの性能関係と優先順位とが関連付けてられている。
定義されている関係は、現用サーバ計算機の性能と待機サーバ計算機の性能が同一である関係「現用=待機」、現用サーバ計算機の性能よりも待機サーバ計算機の性能が高い関係「現用<待機」、そして、現用サーバ計算機の性能よりも待機サーバ計算機の性能が低い関係「現用>待機」である。優先順位カラム912において、小さい数字が高い優先順位(優先度)を示し、「1」が最も高い優先順位を示す。優先度の表し方は、他のテーブルで同様である。
「現用=待機」の優先順位が最も高く、「現用>待機」の優先順位が最も低い。「現用」と「待機」とは、切替元と切替先のサーバ計算機を示すものであって、同一サーバ計算機間の切替えも含まれる。この点は、HBAについて同様である。
具体的には、HBAの障害に対応するフェイルオーバにおいて、同一のサーバ計算機が使用される場合(切替先サーバ計算機が現用サーバ計算機である場合)、サーバ計算機性能の優先順位は、「現用=待機」に対応する「1」である。フェイルオーバによるサーバ計算機性能の低下防止及び将来の他のフェイルオーバにおける適切なサーバ計算機の選択の観点から、本例の優先度は定義されている。
サーバ計算機の性能は、サーバ計算機性能管理テーブル701のCPU性能及びメモリ性能を使用して判定される。例えば、CPU性能、メモリ性能ともに現用サーバ計算機より待機サーバ計算機の方が高い場合、関係は「現用<待機」と判定される。CPU性能及びメモリ性能が同一の場合、関係は「現用=待機」と判定される。それら以外の組合せの場合、関係は「現用>待機」と判定される。サーバ計算機性能の判定は、CPU性能又はメモリ性能の一方のみを使用してもよい。
図9Bに示すI/O性能優先度管理テーブル902は、I/O性能カラム921及び優先順位カラム922を有し、切替えられる二つのHBA間のI/O性能の関係に対する優先順位を定義する。I/O性能関係として、サーバ計算機性能優先度管理テーブル901と同様に三つの関係が定義されている。
HBAによる通信のI/O性能は、HBAの転送性能(リンク速度)と、HBAが接続するFCスイッチのスイッチ性能(リンク速度)から決まる。具体的には、HBAのリンク速度とFCスイッチのリンク速度の最小値が、HBAのI/O性能として採用される。本例において、図7B及び図7Cに示すように、FCスイッチ140のリンク速度は、全てのHBAのリンク速度以上であり、各HBAに対するI/O性能は、HBAのリンク速度に一致する。
図9Cに示すトポロジ優先度管理テーブル903は、切替先サーバ計算機と切替先HBAとの間の位置関係(トポロジ)に対する優先順位を定義する。トポロジ優先度管理テーブル903は、トポロジカラム931及び優先順位カラム932を有し、切替先サーバ計算機と切替先HBAとの間の各位置関係に対して、異なる優先順位を対応づける。
具体的には、それらが、同一筺体内に存在する関係「同一筺体」、隣接する別筺体内に存在する関係「別筺体(隣接)」、二つ隣りの別筺体内に存在する関係(サーバ計算機とHBAを収容する二つの筺体間にさらに一つの別の筺体が存在)「別筺体(二つ隣り)」、三つ隣りの別筺体内に存在する関係(サーバ計算機とHBAを二つの筺体間にさらに二つの別の筺体が存在)「別筺体(三つ隣り)」、が定義されている。
本例において、最大四つのPCIeスイッチが縦接続可能であり、HBAとサーバ計算機の最も遠い位置関係は、「別筺体(三つ隣り)」である。接続可能なスイッチ数は設計に依存する。図9Cに示すように、HBAとサーバ計算機が近い、つまりデータ通信のための経由スイッチ数が少ない程優先順位が高い。例えば、同一筺体内の位置関係の優先順位が最も高い。HBAとサーバ計算機の距離が遠い程、データ通信ために経由するPCIeスイッチの数が増加し、リンク性能及び信頼性が低下するからである。トポロジは、切替先組合せの性能及び信頼性の基準である。
図9Dに示す切替方式優先度管理テーブル904は、切替方式カラム941及び優先順位カラム942を有し、異なる切替方式に関連付けられた優先順位を定義する。図9Dにおいて、「HBA承継」は、現用サーバ計算機を異なる待機サーバ計算機に切替え、同一のHBAを使用する(HBAの切替先は同一の現用HBA、図6参照)。
「HBA切替え」は、現用HBAから異なる待機HBAに切替え、同一の現用サーバ計算機を使用する(サーバ計算機の切替先は同一の現用サーバ計算機)。「双方切替え」は、現用サーバ計算機及び現用HBAを、それぞれ、異なる待機サーバ計算機及び待機HBAに切替える(図5参照)。
図9Eに示すサーバ位置関係優先度管理テーブル905は、切替えられる二つのサーバ計算機間の位置関係と優先順位とを関連付けて定義する。具体的には、「同一サーバ」、「同一筺体内の別サーバ」、「別筺体の別サーバ」の位置関係が定義されおり、各関係に対して優先順位1〜3が割り当てられている。「同一サーバ」は、切替先サーバ計算機が現用サーバ計算機と同一であることを意味する。
図9Fに示すテーブル優先度管理テーブル906は、切替先優先度の決定において参照する上記テーブル901〜905の優先度(本例で優先順位)を定義する。本例において、サーバ計算機性能優先度管理テーブル901、HBA性能優先度管理テーブル902、トポロジ優先度管理テーブル903、切替方式優先度管理テーブル904、サーバ位置関係優先度管理テーブル905の順に、高い優先順位が付与されている。本例において、ユーザ要件受付プログラム323は、管理者から要求に応じて、テーブル優先度管理テーブル906の優先順位を変更する。この点は後述する。
図10は、切替先候補情報327の例を示す。切替先候補情報327は、切替先候補テーブル500を含む。管理サーバ計算機130は、サーバ計算機及びHBAの切替処理において、切替先候補テーブル500を動的に作成する。切替処理は、現用サーバ計算機及び現用HBAの少なくとも一方を、他の待機装置に切替える。
図10に示す切替先候補テーブル500は、図5に示すフェイルオーバの例に対応している。切替先候補テーブル500は、切替可能組合せカラム501、サーバ計算機性能カラム502、I/O性能カラム503、トポロジカラム504、切替方式カラム505、サーバ位置関係カラム506を有する。カラム502〜506のそれぞれは、優先度管理テーブル901〜905のそれぞれで定義されているデータを格納する。
切替可能組合せカラム501は、切替処理において選択可能な、切替先の組合せを格納している。サーバ計算機において障害が発生した場合、切替先として選択可能なサーバ計算機は待機状態のサーバ計算機であり、選択可能なHBAは、障害発生したサーバ計算機に接続している現在のHBA及び待機状態のHBAである。
HBAにおいて障害が発生した場合、切替先として選択可能なHBAは待機状態のHBAであり、選択可能なサーバ計算機は、障害発生したHBAに接続している現在のサーバ計算機及び待機状態のサーバ計算機である。
図5に示す例において、サーバ計算機B(112B)において障害が発生している。切替先として選択可能なサーバ計算機は、待機サーバ計算機C(112C)及び待機サーバ計算機E(112E)である。選択可能なHBAは、現用HBA−B(114B)及び待機HBA−D(114D)である。これらサーバ計算機とHBAの各組合せが選択可能な組合せであり、切替先候補テーブル500のエントリ数は選択可能な組合せ数(本例で4組合せ)に一致する。図10の例において、切替可能組合せカラム501は、上記全ての組合せを格納している。
サーバ計算機性能カラム502、I/O性能カラム503、トポロジカラム504、切替方式カラム505、サーバ位置関係カラム506は、それぞれ、図9A〜図9Fを参照した優先度管理情報326の説明の通りである。
例えば、四番目のエントリであるサーバ計算機EとHBA−Dの組合せにおいて、サーバ計算機Eの性能は、サーバ計算機Bの性能と一致している(図7Aのサーバ計算機性能管理テーブル701参照)。サーバ計算機性能カラム502のデータは、「現用=待機」を示す。HBA−Dの性能はHBA−Bの性能と一致しており(図7BのHBA性能管理テーブル702参照)、それらが接続するFCスイッチは同一である(図8Aのサーバ計算機HBA間接続管理テーブル801参照)。I/O性能カラム503のデータは、「現用=待機」を示す。
サーバ計算機DとHBA−Dとは同一筺体内に収容されており(図5及び図8Aのサーバ計算機HBA間接続管理テーブル801参照)、トポロジカラム504のデータは「同一筺体」を示す。サーバ計算機とHBAの双方が現用装置と異なる待機装置に切替えられるので、切替方式カラム505のデータは「双方切替え」を示す。サーバ計算機Bとサーバ計算機Dとは、異なる筺体111A、111Bに収容されており(図1及び図8Aのサーバ計算機HBA接続管理テーブル801参照)、サーバ位置関係カラム506のデータは、「別筺体内の別サーバ計算機」を示す。
図11は、ユーザ要件を管理する、ユーザ要件管理情報328の例を示す。ユーザ要件管理情報328は、ユーザ要件管理テーブル600を含む。ユーザ要件管理テーブル600は、切替先優先度を決定する方針及び切替えにおいて切替先サーバ計算機のSMP構成を維持するか否かを示す情報を含む。
具体的には、ユーザ要件管理テーブル600は、設定項目カラム601及び内容カラム602を有する。内容カラム602のデータは、管理者により設定される。設定項目カラム601は、「切替先決定優先度」と「SMP構成のサーバ計算機への切替え」のフィールドを含む。「切替先決定優先度」の「内容」は、優先度管理テーブル901〜905の優先順位(図9Fのテーブル優先度管理テーブル906参照)を定義する。
本例において、管理者は、サーバ計算機性能優先度管理テーブル901、I/O性能優先度管理テーブル902、トポロジ優先度管理テーブル903の優先順位を設定することができる。これら三つのテーブルの優先順位が可変であるのに対して、切替方式優先度管理テーブル904、サーバ位置関係優先度管理テーブル905の優先順位は固定である。全てのテーブルの優先順位が可変でもよい。
管理者は、サーバ計算機性能優先度管理テーブル901、I/O性能優先度管理テーブル902、トポロジ優先度管理テーブル903のそれぞれに対して、1〜3のいずれかの優先順位を割り当てることができる。図11の例において、これら三つのテーブル901〜903の優先度の順序は、図9Fに示すテーブル優先度管理テーブル906の例に一致している。
「SMP構成のサーバ計算機への切替え」の「内容」は、切替先サーバ計算機のSMP構成を維持するか崩すかを示す。図11の例において、切替先サーバ計算機のSMP構成を維持することが、管理者により要求されている。つまり、切替先として選択されたサーバ計算機が、複数サーバ計算機が結合したSMP構成である場合、そのSMP構成のサーバ計算機が現用サーバ計算機のタスクを引き継ぐ。
一方、SMP構成を崩して切替えることを要求されている場合、SMP構成に含まれる一部のサーバ計算機が、現用サーバ計算機のタスクを引き継ぐ。このように、管理者は、SMP構成のサーバ計算機への切替えにおいて、そのSMP構成を維持したまま切替えるか、SMP構成を崩して切替えるかを選択できる。
ユーザ要件管理テーブル600における「切替先決定優先度」の内容は、テーブル優先度管理テーブル906に反映される。後述するように、管理者が「切替先決定優先度」の「内容」を更新すると、ユーザ要件受付プログラム323は、その更新に応じて、テーブル優先度管理テーブル906を更新する。
以下において、管理サーバ計算機130の管理プログラム321〜323による処理を説明する。管理プログラム321〜323は、イベントドリブンプログラムである。図12は、管理者によるユーザ要件の変更により発行されるユーザ要件変更イベントに応答したユーザ要件受付プログラム323のフローを示している。
管理者は、ユーザ要件受付プログラム323が提供するユーザインタフェースを利用して、ユーザ要件管理テーブル600のユーザ要件を変更することができる。管理者は、ディスプレイ138に表示された画像を見ながら、入力装置137により新たなユーザ要件を入力する。
ユーザ要件受付プログラム323は、管理者の入力を受信すると(S101)、それに応じてユーザ要件管理テーブル600を更新する(S102)。ユーザ要件受付プログラム323は、ユーザ要件管理テーブル600における「切替先決定優先度」の「内容」の更新に応じて、テーブル優先度管理テーブル906のける各テーブルの優先順位を更新する(S103)。
図13は、障害発生や管理者の切替指示により発行される切替要求イベントに応答したフローを示している。例えば、サーバシステム110Aにおいて障害が発生すると、サーバシステム110Aのコントローラが、切替要求を管理サーバ計算機130に送信する。管理者は、入力装置137により切替指示を入力し、ユーザ要件受付プログラム323がそれを切替プログラム321に転送する。
切替要求は、切替えられるべきサーバ計算機又はHBAを指定する識別子を含む。切替要求は、現用サーバ計算機とHBAの双方の切替えを指示してもよい。切替えられるべき装置(サーバ計算機又はHBA)は、障害が発生した装置又は管理者により指定された装置である。
切替プログラム321は、切替要求を受信すると(S201)、ユーザ要件受付プログラム323に、ユーザ要件取得要求を送信する(S202)。ユーザ要件受付プログラム323は、ユーザ要件取得要求に応答して、ユーザ要件情報を切替プログラム321に送信する(S203)。ユーザ要件情報は、ユーザ要件管理テーブル600における「SMP構成のサーバ計算機への切替え」の「内容」を含む。
切替プログラム321は、切替先選定プログラム322に、切替先選定要求を送信する(S204)。切替先選定要求は、他の装置に切替えられるべき装置(サーバ計算機又はHBA)を指定する識別子を含む。これは、切替プログラム321により受信された切替要求が指定する装置の識別子である。
切替先選定プログラム322は、受信した切替先選定要求に応答して、切替先候補テーブル500を作成する(S205)。切替先候補テーブル500の作成方法の詳細は後述する。切替先選定プログラム322は、さらに、優先度管理情報326を参照し、切替先候補テーブル500から切替先を選定し(S206)、それを示す情報を切替プログラム321に送信する(S207)。切替先選定の詳細は後述する。
切替プログラム321は、切替先情報を受け取り、その情報が示す切替先への切替えを実行する(S208)。具体的には、切替プログラム321は、切替元のサーバ計算機及びHBAと、切替先のサーバ計算機及HBAと、を指定して、サーバシステム110A及び/又はサーバシステム110Bに、切替えを指示する。サーバシステム110A及び/又はサーバシステム110Bが、切替プログラム321からの指示に従って切替えを行う。
図14は、図12、図13に示すユーザ要件受付プログラム323の処理フローの詳細を示す。ステップS302〜ステップS304は図12のフローチャートに含まれ、ステップS305、ステップS306は図13のフローチャートに含まれる。
ユーザ要件受付プログラム323は、要求を受信するまで待ち状態にある(S301)。ユーザ要件受付プログラム323は、ユーザ要件変更要求を受信した場合(S302:YES)、ユーザ要件管理テーブル600を更新する。さらに、ユーザ要件受付プログラム323は、ユーザ要件管理テーブル600の更新に応じて、テーブル優先度管理テーブル906を更新する(S304)。
ユーザ要件受付プログラム323は、ユーザ要件取得要求を受信すると(S305:YES)、ユーザ要件管理テーブル600から必要な情報、本例において、「SMP構成のサーバ計算機への切替え」の「内容」を含む情報を取り出し、要求元(本例において切替プログラム321)に送信する。
図15は、図13における切替プログラム321の処理フローの詳細を示す。本フローは、切替要求を受信した場合にのみ実行される。図13におけるユーザ要件取得要求送信のステップS202、切替先選定要求送信のステップS204は、それぞれ、図15におけるステップS401、ステップS402に対応する。図13における切替実行のステップS208は、図15におけるステップS403〜ステップS406に対応する。
上述のように、切替要求は、切替元装置の識別子を含む。まず、切替プログラム321は、ユーザ要件受付プログラムを呼び出し、ユーザ要件管理テーブル600に格納されている情報を取得する(S401)。具体的には、切替プログラム321は、「SMP構成のサーバ計算機への切替え」の「内容」の情報を取得する。
さらに、切替プログラム321は、切替先選定プログラム322を呼び出し、切替先選定プログラム322に切替先選定要求を送信する(S402)。切替先選定要求は、切替要求により指定された切替元装置の識別子を含む。その後、切替プログラム321は、切替先選定プログラム322から、選定された切替先のサーバ計算機及びHBAの情報を受信する。切替先のサーバ計算機及びHBAの双方又はその一方のみが、切替元のサーバ計算機及びHBAと異なる。
切替プログラム321は、選定された切替先のサーバ計算機のSMP構成と切替元のサーバ計算機のSMP構成が異なるか否かを判定する(S403)。一方のサーバ計算機の構成がSMP構成であり、他方のサーバ計算機の構成がSMP構成ではない場合、又は、双方のサーバ計算機の構成がSMP構成であるが、それらの構成スロット数が異なる場合、切替プログラム321は、二つのサーバ計算機のSMP構成が異なると判定する(S403:YES)。
二つのサーバ計算機のSMP構成が異なる場合(S403:YES)、切替プログラム321は、さらに、切替先サーバ計算機のスロット数が、切替元サーバ計算機のスロット数よりも多いが否かを判定する(S404)。SMP構成ではないサーバ計算機のスロット数は1である。
ステップS404の判定結果がYESである場合、切替プログラム321は、ユーザ要件受付プログラム323から取得したユーザ要件管理情報328の内容に従って、切替先サーバ計算機のSMP構成を変更又は維持する(S405)。
ユーザ要件管理情報328が切替先サーバ計算機のSMP構成を崩すことを示す場合、切替プログラム321は、切替先のサーバ計算機のSMP構成を変更して現用(切替元)サーバ計算機の構成に一致させることを、切替先サーバ計算機を含むサーバシステムに指示する。切替プログラム321は、サーバ計算機のSMP構成変更に応じて、サーバ計算機性能管理テーブル701及びサーバ計算機HBA間接続管理テーブル801を更新する。SMP構成が崩されると、1又は複数のサーバ計算機のエントリ数が追加される。
ステップS403若しくはステップS404の判定結果がNOである場合、又は、ステップS405の後、切替プログラム321は、サーバシステム110A及び/又はサーバシステム110Bに切替えを指示する(S406)。
図16A、図16Bは、図13における切替先選定プログラム322の処理フローの詳細を示す。本フローは、切替先選定要求を受信した場合にのみ実行される。切替先選定プログラム322の処理は、切替先候補テーブル500の作成と、切替先選定との、主に2つの処理から成る。
図16Aのフローチャートを参照して、切替先候補テーブル500の作成を説明する。切替先選定プログラム322は、まず、切替え可能な組合せ(可能な切替先)を選定する(S501)。選定方法を以下に示す。
切替先選定プログラム322は、サーバ計算機性能管理テーブル701から、運用形態カラムの値が「待機」である全てのサーバ計算機を選択する。さらに、HBA性能管理テーブル703から、運用形態カラムの値が「待機」である全てのHBAを選択する。さらに、切替先選定プログラム322は、切替元サーバ計算機及び切替元HBAのうち、障害が発生していない装置を選択する。ステップS501において選択されたサーバ計算機及びHBAが、切替先候補の装置である。
切替先選定プログラム322は、切替先候補として選択したHBAが、現用HBA(切替元HBA)とベンダが異なるHBA及び現用HBAとベンダ同一のHBAの双方を含むかを判定する(S502)。現用HBAとベンダが同一のHBAとベンダが異なるHBAとが混在する場合(S502:YES)、切替先選定プログラム322は、現用HBAとベンダが異なるHBAを切替先候補のHBAから除外する(S503)。
現用HBAとベンダが同一のHBAのみ、又は、現用HBAとベンダが異なるHBAのみが存在する場合(S502:NO)、切替先選定プログラム322は、ステップS503をスキップする。
さらに、切替先選定プログラム322は、切替先候補として選択したサーバ計算機が、現用サーバ計算機(切替元サーバ計算機)とSMP構成が異なるサーバ計算機及び現用サーバ計算機(切替元サーバ計算機)とSMP構成が同一のサーバ計算機の双方を含むかを判定する(S504)。
現用サーバ計算機とSMP構成が同一のサーバ計算機とSMP構成が異なるサーバ計算機が混在する場合(S504:YES)、切替先選定プログラム322は、現用サーバ計算機とSMP構成が異なるサーバ計算機を切替先候補のサーバ計算機から除外する(S505)。現用サーバ計算機とSMP構成が同一のサーバ計算機のみ、又は、現用サーバ計算機とSMP構成が異なるサーバ計算機のみが存在する場合(S504:NO)、切替先選定プログラム322は、ステップS505をスキップする。
切替先選定プログラム322は、切替先候補テーブル500を作成し、残された切替先候補のサーバ計算機及びHBAの全ての組合せを、切替先候補テーブル500に含める(S506)。
上述のように、図10の切替先候補テーブル500は、図5に示すフェイルオーバの例に対応している。図5において、サーバ計算機B(112B)はHBA−B(114B)を介してストレージシステム500と通信し、そのサーバ計算機B(112B)において障害が発生している。サーバ計算機B(112B)は他のサーバ計算機に切替えられるべき装置である。サーバ計算機B(112B)及びHBA−B(114B)は、切替元組合せであり、それぞれが切替元装置である。
図7Aのサーバ計算機性能管理テーブル701に示すように、待機サーバ計算機は、サーバ計算機C(112C)及びサーバ計算機(112E)である。図7BのHBA性能管理テーブル702に示すように、待機HBAは、HBA−D(114D)である。切替元サーバ計算機B(112B)において障害が発生しており、切替元HBA−B(114B)は正常動作している。したがって、ステップS501が選択する切替先候補サーバ計算機は、サーバ計算機C(112C)及びサーバ計算機(112E)である。切替先候補HBAは、HBA−B(114B)及びHBA−D(114D)である。
図7BのHBA性能管理テーブル702が示すように、HBA−B(114B)及びHBA−D(114D)のベンダは、共に「A社」であり同一である。したがって、ステップ502の判定結果はNOである。図7Aのサーバ計算機性能管理テーブル701に示すように、サーバ計算機B(112B)はSMP構成を有しておらず、サーバ計算機C(112C)及びサーバ計算機(112E)もSMP構成を有していない。したがって、ステップS504の判定結果はNOである。
ステップS503、S505が除外する切替先候補装置が存在しないため、作成される切替先候補テーブル500は、上記二つのサーバ計算機と二つのHBAの全ての組合せを含むことになる。図10において、切替先候補テーブル500に含まれる切替先候補組合せは、サーバ計算機C(112C)及びサーバ計算機(112E)並びにHBA−B(114B)及びHBA−D(114D)の全ての組合せを(4組合せ)である。
図10を参照して説明したように、切替先選定プログラム322は、サーバ計算機性能テーブル701を参照して、サーバ計算機性能カラム501にデータをセットする。切替先選定プログラム322は、HBA性能テーブル702、サーバ計算機HBA間接続管理テーブル801、FCスイッチ性能テーブル703を参照して、I/O性能カラム502にデータをセットする。切替先選定プログラム322は、サーバ計算機HBA間接続管理テーブル801を参照して、トポロジカラム504及びサーバ位置関係カラム506にデータをセットする。
次に、図16Bのフローチャートを参照して、切替先選定プログラム322による切替先選定を説明する。切替先選定プログラム322は、まず、ループカウントに初期値である1をセットする(S510)。切替先選定プログラム322は、ステップS511からステップ515からなるループを繰り返す。具体的には、切替先選定プログラム322は、ループカウントがテーブル優先度管理テーブル906に登録されているテーブル優先順位の数(エントリ数)を超える、又は、ステップS513の判定結果がYESであると、このループの繰り返しを終了する。
切替先選定プログラム322は、ステップS512を実行する。最初のループにおいて、切替先選定プログラム322は、テーブル優先度管理テーブル906を参照して、最も優先順位の高いテーブルを特定する。本例において、サーバ計算機性能優先度管理テーブル901の優先順位が最も高い。
切替先選定プログラム322は、サーバ計算機性能管理テーブル901を参照して、切替先組合せ候補において、サーバ計算機性能について優先順位の異なる組合せ(サーバ計算機とHBAの組合せ)が、切替先候補テーブル500に存在するか判定する。サーバ計算機性能について優先順位の異なる組合せが含まれている場合、切替先選定プログラム322は、それらのうちでサーバ計算機性能において最も高い優先順位の組合せ以外の組合せを、切替先候補テーブル500から除外する。
次に、切替先選定プログラム322は、不要な組合せを除外した後の切替先組合せ候補が、一つのみであるか判定する(S513)。残りの切替先組合せ候補が一つのみである場合(S513:YES)、切替先選定プログラム322は、ループを抜ける。複数の切替先組合せ候補が切替先候補テーブル500に残っている場合(S513:NO)、切替先選定プログラム322は、ループカウントをインクリメントして(S514)、ループを繰り返す。
二回目以降のループでのステップS512において、切替先選定プログラム322は、テーブル優先度管理テーブル906を参照して、前回のループにおいて選択した優先度管理テーブルの次に優先順位が高い優先度管理テーブルを選択する。例えば、切替先選定プログラム322は、二回目のループにおいてI/O性能優先度管理テーブル902を選択し、三回目のループにおいてトポロジ優先度管理テーブル903を選択する。切替先選定プログラム322は、最初のループと同様に、選択した優先度管理テーブルを参照して、切替先候補テーブル500におけるエントリの優先度について判定を行う。
切替先選定プログラム322は、ループを抜けた後に、残された切替先組合せ候補の数が複数であるが一つのみであるか判定する(S516)。残された切替先組合せ候補が一つのみである場合(S516:NO)、切替先選定プログラム322は、残された切替先組合せ候補を切替先組合せに選定し、切替プログラム321にそれを示す情報を送信する(S518)。
複数の切替先組合せ候補が残っている場合(S516:YES)、切替先選定プログラム322は、それらの中でサーバ計算機のスロット番号が最も小さい切替先組合せ候補を切替先組合せに選定し、切替プログラム321にそれを示す情報を送信する(S517)。切替先選定プログラム322は、他の基準により複数切替先組合せ候補の中から一つの切替先組合せを選択してもよい。
図16Bを参照して説明したフローを、図10の切替先候補テーブル500に適用した例を説明する。切替先選定プログラム322は、テーブル優先度管理テーブル906を参照して、最初のループにおいて、サーバ計算機性能管理テーブル701を参照してサーバ計算機性能について判定することを決定する。
切替先候補テーブル500において、サーバ計算機EとHBA−Bの組合せ及びサーバ計算機EとHBA−Dの組合せは、サーバ計算機性能カラム502のデータが「現用=待機」であるエントリである。切替先選定プログラム322は、この二つの組合せを切替先候補組む合わせとして選択し、他の組合せ候補を切替先候補テーブル500から除外する(S512)。
複数の切替先候補組合せが残っているため(S513:NO)、切替先選定プログラム322は、次のループにおいて、テーブル優先度管理テーブル906において優先順位が2であるI/O計算機性能管理テーブル702を参照して、I/O性能について判定することを決定する。切替先候補テーブル500において、I/O性能カラム503のデータは二つのエントリにおいて同一である。したがって、いずれの切替先組合せ候補も除外されず、サーバ計算機EとHBA−Bの組合せ及びサーバ計算機EとHBA−Dの組合せの両方が残る(S512)。
複数の切替先候補組合せが存在しているため(S513:NO)、切替先選定プログラム322は、次のループにおいて、優先順位が3であるトポロジ管理テーブル703を参照してトポロジについて判定することを決定する。切替先候補テーブル500において、サーバ計算機EとHBA−Bの組合せのトポロジは「別筺体(隣接)」であり、サーバ計算機EとHBA−Dの組合せのトポロジは「同一筺体」である。したがって、切替先選定プログラム322は、サーバ計算機EとHBA−Bの組合せを切替先候補テーブル500から除外して、サーバ計算機EとHBA−Dの組合せを残す(S512)。
残された切替先組合せ候補が一つのみであるので(S513:YES、S516:NO)、切替先選定プログラム322は、サーバ計算機EとHBA−Dの組合せを、切替先組合せと決定し、それを示す情報を切替プログラム321に送信する(S518)。
HBAでの障害に対する切替え(現用HBAを他の待機HBAに切替え)は、上述のサーバ計算機での障害に対する切替えと同様である。管理サーバ計算機130は、切替先組合せ候補を選定し、それらの優先度を優先度管理情報326を参照して決定する。上述のように、本実施形態の切替先組合せ候補の優先度の決定は、システムメンテナンス等のために、管理者が切替えるべき装置を指定して切替えを指示する場合にも適用できる。
上記例において、管理サーバ計算機130は、サーバ計算機及びHBAの一つの切替先組合せを決定し、自動的に切替えを実行する。これと異なり、管理サーバ計算機130は、一つ又は複数の切替先候補を決定して、それらをディスプレイ138で表示してもよい。管理者は、入力装置137を使用して、提示された切替先候補から切替先を選択し、管理サーバ計算機130は、管理者が指定する切替先に切替えることをサーバシステム110A、110Bに指示する。
図17は、管理サーバ計算機130が管理者に提示する切替先候補画像の一例である。図17において、切替先候補画像は、図10に示す切替先組合せ候補及びその情報に加え、各切替先組合せ候補の優先順位の情報を含む。切替先選定プログラム322は、切替先候補テーブル500の作成と同様のアルゴリズムにより、画像に含まれる切替先組合せ候補を選定し、優先順位を含むそれらの情報を得ることができる。管理者は、表示されている切替先組み合せ候補から一つの組合せを選択し、入力装置137により切替実行ボタンを選択することで、その組合せへの切替を指示することができる。
切替先選定プログラム322は、上述のように、優先順位の高い順に、優先度管理テーブル901〜905を順次選択して、各切替先組合せ候補の優先順位を決定する。選択した優先度管理テーブルにより決定した優先順位が同一の切替先組合せ候補が存在する場合、切替先選定プログラム322は、次の優先順位のテーブルによりそれら組合せ候補内での優先順位を決定する。図17は、この決定方法による優先順位を示している。
図10に示す切替先候補テーブル500を参照して一例を説明する。切替先選定プログラム322は、サーバ計算機性能、I/O性能、トポロジ、切替方式、サーバ位置関係の順に、これら判定基準(判定項目)により切替先組合せ候補の優先順位(優先度)を決定する。
切替先選定プログラム322は、最初に、サーバ計算機性能の判定基準で、切替先組合せ候補を分類する。優先順位の高いグループ(第1グループ)は、サーバ計算機EとHBA−Bの組合せと、サーバ計算機EとHBA−Dの組合せからなる。優先順位の低いグループ(第2グループ)は、サーバ計算機CとHBA−Bの組合せと、サーバ計算機CとHBA−Dの組合せからなる。
次に、切替先選定プログラム322は、I/O性能の判定基準により、各グループをさらに分類する。全ての組合せのI/O性能が同一なので、第1及び第2グループは、維持される。
次に、切替先選定プログラム322は、トポロジの判定基準により、各グループをさらに分類する。具体的には、第1グループにおいて、サーバ計算機EとHBA−Bの組合せの優先順位が低く、サーバ計算機EとHBA−Dの組合せの優先順位が高い。第2グループにおいて、サーバ計算機CとHBA−Bの組合せの優先順位が高く、サーバ計算機CとHBA−Dの組合せの優先順位が低い。したがって、上記四つの切替先組合せ候補の優先順位は、図16に示す通りである。
図17は表示画像の一例であって、管理サーバ計算機130は、切替先組合せ候補の優先度について、これと異なる情報を表示してもよい。管理サーバ計算機130は、選択した一部の優先度が高い切替先組合せ候補のみを表示してもよいし、図17における一部の情報のみを表示してもよい。優先度は数字とは異なる方法で表現されていてもよい。
以上、本発明の実施形態を図面を参照して詳細に説明したが、本発明はこのような具体的構成に限定されるものではなく、添付した請求の範囲の趣旨内における様々な変更及び同等の構成を含む。例えば、管理システムは管理サーバ計算機の他の計算機を含み、管理サーバ計算機の処理の少なくとも一部は、他の計算機が実行してもよい。プログラムの少なくとも一部は、専用ハードウェアによって実現されてもよい。プログラムは、プログラム配布サーバや、計算機読み取り可能な非一時的記憶媒体によって各計算機にインストールすることができ、各計算機の不揮発性記憶装置に格納することができる。
上記計算機システムにおいてPCIスイッチはサーバシステムの筺体内に内蔵されているが、PCIスイッチは、筐体外に外付けされていてもよい。この構成において、優先度の決定は、トポロジについての判定を含む必要はない。管理サーバ計算機は、切替先組合せの決定又は切替先組合せ候補の優先度の決定において、上記優先度管理テーブル(判定項目)の一部のみを使用してもよい。
上記例は、決定した優先度に従って不要な組合せ候補を切替先候補テーブルから排除するが、それらを切替先候補テーブルに残しつつ、各エントリ優先度を示す値を付与してもよい。上記優先度管理テーブルのそれぞれは、三つ又は四つの優先順位を定義するが、各テーブルで定義される優先順位の数は設計に依存する。
切替先組合せ候補優先度の決定方法は、上記方法に限らない。管理システムは、例えば、各判定基準に重み係数を与え、複数の判定基準の優先度を加算して各切替先組合せ候補の優先度を決定してもよい。管理システムは、I/O性能をHBAの性能のみを参照して決定してもよい。HBAは、サーバ計算機のI/Oアダプタの一例であって、これに限定されない。上記構成例は業務サーバ計算機を含むが、これと異なる計算機を含むシステムに本実施形態を適用できる。

Claims (11)

  1. 複数の計算機と、前記複数の計算機がネットワークに接続するための複数のI/Oアダプタと、を含む計算機システムを管理し、プロセッサと記憶装置とを含む管理システムであって、
    前記記憶装置は、前記複数の計算機のそれぞれの性能を管理する計算機性能管理情報、を格納し、
    前記記憶装置は、前記複数のI/Oアダプタのそれぞれによる通信のI/O性能を管理するI/O性能管理情報、を格納し、
    前記記憶装置は、切替先計算機候補と切替先I/Oアダプタ候補との切替先組合せ候補の優先度を、切替元計算機と前記切替先計算機候補との間の計算機性能関係、及び、切替元I/Oアダプタと前記切替先I/Oアダプタ候補との間のI/O性能関係、に関連付ける優先度管理情報、を格納し、
    前記プロセッサは、現用計算機と現用I/Oアダプタとの組合せにおける一方の装置を他の装置に切替えるため、切替先計算機候補と切替先I/Oアダプタ候補との1以上の切替先候補組合せを決定し、
    前記プロセッサは、前記1以上の切替先組合せ候補のそれぞれの優先度を、前記計算機性能管理情報、前記I/O性能管理情報及び前記優先度管理情報を参照して、前記現用計算機と前記切替先計算機候補との間の性能関係及び前記現用I/Oアダプタと前記切替先I/Oアダプタ候補との間の性能関係に基づき決定する、管理システム。
  2. 前記優先度管理情報は、さらに、前記切替先組合せ候補における前記切替先計算機候補と前記切替先I/Oアダプタ候補との間の位置関係を、前記切替先組合せ候補の前記優先度に関連付け、
    前記プロセッサは、前記1以上の切替先組合せ候補のそれぞれの優先度を、前記優先度管理情報を参照して、前記切替先計算機候補と前記切替先I/Oアダプタ候補との間の位置関係に基づき決定する、請求項1に記載の管理システム。
  3. 前記計算機システムは、
    前記複数の計算機における第1部分及び前記複数のI/Oアダプタにおける第1部分を収容する第1筺体と、
    前記第1筺体に収容され、前記複数の計算機における前記第1部分及び前記複数のI/Oアダプタにおける前記第1部分と接続する第1スイッチと、
    前記複数の計算機における第2部分及び前記複数のI/Oアダプタにおける第2部分を収容する第2筺体と、
    前記第2筺体に収容され、前記複数の計算機における前記第2部分及び前記複数のI/Oアダプタにおける前記第2部分と接続する第2スイッチと、をさらに含み、
    前記第1スイッチ及び前記第2スイッチは、筺体間配線を介して通信可能に接続されており、
    前記優先度管理情報において、同一筺体内の切替先計算機候補と切替先I/Oアダプタ候補との切替先組合せ候補の優先度は、異なる筺体の切替先計算機候補と切替先I/Oアダプタ候補との切替先組合せ候補の優先度よりも高い、請求項2に記載の管理システム。
  4. 前記優先度管理情報は、前記計算機性能関係及び前記I/O性能関係を含む、前記切替先組合せ候補の優先度の決定のための複数基準を含み、
    前記複数基準のそれぞれに優先度が予め設定されている、請求項1に記載の管理システム。
  5. 前記プロセッサは、複数の切替先組合せ候補が存在する場合、前記複数の切替先組合せ候補の優先度に基づいて、前記現用計算機と前記現用I/Oアダプタに対する切替先組合せを、前記複数の切替先組合せ候補から選択する、請求項1に記載の管理システム。
  6. 前記記憶装置は、さらに、切替先組合せ候補における計算機が結合した複数の計算機からなる構成を有する場合に前記構成を変更するか維持するかを示す、ユーザ設定された構成情報を格納し、
    前記プロセッサは、前記構成情報に従って、前記1以上の切替先組合せ候補のそれぞれにおける計算機の構成を維持するか変更するか決定する、請求項1に記載の管理システム。
  7. 前記管理システムは、前記1以上の切替先組合せ候補の優先度を表示する表示装置をさらに含む、請求項1に記載の管理システム。
  8. 前記記憶装置は、前記複数のI/Oアダプタのベンダ情報を格納し、
    前記プロセッサは、前記複数のI/Oアダプタから切替先I/Oアダプタ候補として選択可能なI/Oアダプタのベンダを、前記ベンダ情報を参照して特定し、
    前記プロセッサは、前記選択可能なI/Oアダプタのベンダが、前記現用I/Oアダプタのベンダを含む複数種類のベンダを含む場合、前記現用I/Oアダプタと同一のベンダのI/Oアダプタを、前記1以上の切替先組合せ候補における切替先I/Oアダプタ候補として選択する、請求項1に記載の管理システム。
  9. 前記一方の装置は前記現用計算機であり、
    前記プロセッサは、前記切替先計算機候補として、前記複数の計算機における待機計算機を選択し、
    前記プロセッサは、前記切替先I/Oアダプタ候補として、前記複数のI/Oアダプタにおける前記現用I/Oアダプタ及び待機I/Oアダプタを選択する、請求項1に記載の管理システム。
  10. 複数の計算機と、前記複数の計算機がネットワークに接続するための複数のI/Oアダプタと、を含む計算機システムを、管理システムが管理する方法であって、
    前記管理システムが、現用計算機と現用I/Oアダプタとの組合せにおける一方の装置を他の装置に切替えるため、切替先計算機候補と切替先I/Oアダプタ候補との1以上の切替先候補組合せを決定し、
    前記管理システムが、前記複数の計算機のそれぞれの性能を管理する計算機性能管理情報を参照し、
    前記管理システムが、前記複数のI/Oアダプタのそれぞれによる通信のI/O性能を管理するI/O性能管理情報を参照し、
    前記管理システムが、切替先計算機候補と切替先I/Oアダプタ候補との切替先組合せ候補の優先度を、切替元計算機と前記切替先計算機候補との間の計算機性能関係、及び、切替元I/Oアダプタと前記切替先I/Oアダプタ候補との間のI/O性能関係、に関連付ける優先度管理情報を参照し、
    前記管理システムが、前記1以上の切替先組合せ候補のそれぞれの優先度を、前記参照した計算機性能管理情報、I/O性能管理情報及び優先度管理情報、並びに、前記現用計算機と前記切替先計算機候補との間の性能関係及び前記現用I/Oアダプタと前記切替先I/Oアダプタ候補との間の性能関係に基づき決定する、管理方法。
  11. プログラムコードを含むコンピュータ読み取り可能な非一時的な記憶媒体であって、前記プログラムコードは、管理システムに、複数の計算機と前記複数の計算機がネットワークに接続するための複数のI/Oアダプタとを含む計算機システム、を管理する方法を実行させ、前記方法は、
    現用計算機と現用I/Oアダプタとの組合せにおける一方の装置を他の装置に切替えるため、切替先計算機候補と切替先I/Oアダプタ候補との1以上の切替先候補組合せを決定し、
    前記複数の計算機のそれぞれの性能を管理する計算機性能管理情報、を参照し、
    前記複数のI/Oアダプタのそれぞれによる通信のI/O性能を管理するI/O性能管理情報、を参照し、
    切替先計算機候補と切替先I/Oアダプタ候補との切替先組合せ候補の優先度を、切替元計算機と前記切替先計算機候補との間の計算機性能関係、及び、切替元I/Oアダプタと前記切替先I/Oアダプタ候補との間のI/O性能関係、に関連付ける優先度管理情報、を参照し、
    前記1以上の切替先組合せ候補のそれぞれの優先度を、前記参照した計算機性能管理情報、I/O性能管理情報及び優先度管理情報、並びに、前記現用計算機と前記切替先計算機候補との間の性能関係及び前記現用I/Oアダプタと前記切替先I/Oアダプタ候補との間の性能関係に基づき決定する、記憶媒体。
JP2013544002A 2011-11-14 2011-11-14 計算機システムを管理する管理システム、計算機システムの管理方法及び記憶媒体 Expired - Fee Related JP5779254B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/076187 WO2013072985A1 (ja) 2011-11-14 2011-11-14 計算機システムを管理する管理システム、計算機システムの管理方法及び記憶媒体

Publications (2)

Publication Number Publication Date
JPWO2013072985A1 true JPWO2013072985A1 (ja) 2015-04-02
JP5779254B2 JP5779254B2 (ja) 2015-09-16

Family

ID=48429099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013544002A Expired - Fee Related JP5779254B2 (ja) 2011-11-14 2011-11-14 計算機システムを管理する管理システム、計算機システムの管理方法及び記憶媒体

Country Status (3)

Country Link
US (1) US9417978B2 (ja)
JP (1) JP5779254B2 (ja)
WO (1) WO2013072985A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5761368B2 (ja) * 2011-11-10 2015-08-12 富士通株式会社 情報処理装置、情報処理方法、情報処理プログラム、および同プログラムを記録した記録媒体
JP2015069283A (ja) * 2013-09-27 2015-04-13 日本電気株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
US20150100826A1 (en) * 2013-10-03 2015-04-09 Microsoft Corporation Fault domains on modern hardware
US9454416B2 (en) 2014-10-14 2016-09-27 Netapp, Inc. Detecting high availability readiness of a distributed computing system
JP6429188B2 (ja) * 2014-11-25 2018-11-28 APRESIA Systems株式会社 中継装置
CN105700965A (zh) * 2014-11-26 2016-06-22 英业达科技有限公司 系统错误排除方法
US20160239394A1 (en) * 2015-02-13 2016-08-18 Netapp, Inc. Methods for improving management of input or output operations in a network storage environment with a failure and devices thereof
US10691628B2 (en) * 2016-05-06 2020-06-23 Quanta Computer Inc. Systems and methods for flexible HDD/SSD storage support
US10552272B2 (en) * 2016-12-14 2020-02-04 Nutanix, Inc. Maintaining high availability during N-node failover
US10275327B2 (en) * 2017-01-05 2019-04-30 Hewlett Packard Enterprises Development LP Virtual fibre channel port migration
JP6930153B2 (ja) * 2017-03-16 2021-09-01 日本電気株式会社 パス切替装置、パス切替方法及びパス切替プログラム、並びに、コンピュータシステム
US11966350B2 (en) * 2018-02-05 2024-04-23 Cisco Technology, Inc. Configurable storage server with multiple sockets
US11481296B2 (en) * 2018-09-10 2022-10-25 International Business Machines Corporation Detecting configuration errors in multiport I/O cards with simultaneous multi-processing
US10922122B2 (en) 2018-09-26 2021-02-16 EMC IP Holding Company LLC System and method for virtual machine resource tagging
US10936443B2 (en) * 2018-09-26 2021-03-02 EMC IP Holding Company LLC System and method for tag based backup infrastructure
JP7110937B2 (ja) * 2018-11-22 2022-08-02 富士通株式会社 情報処理システム及び情報処理装置
US11385975B2 (en) 2019-11-27 2022-07-12 Amazon Technologies, Inc. Systems and methods for enabling a highly available managed failover service
US11397651B2 (en) 2020-03-27 2022-07-26 Amazon Technologies, Inc. Managing failover region availability for implementing a failover service
US11411808B2 (en) * 2020-03-27 2022-08-09 Amazon Technologies, Inc. Managing failover region availability for implementing a failover service
US11397652B2 (en) * 2020-03-27 2022-07-26 Amazon Technologies, Inc. Managing primary region availability for implementing a failover from another primary region
US11709741B1 (en) 2021-03-29 2023-07-25 Amazon Technologies, Inc. Systems and methods for enabling a failover service for block-storage volumes
US11785077B2 (en) 2021-04-29 2023-10-10 Zoom Video Communications, Inc. Active-active standby for real-time telephony traffic
US11575741B2 (en) * 2021-04-29 2023-02-07 Zoom Video Communications, Inc. System and method for active-active standby in phone system management

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005234917A (ja) * 2004-02-20 2005-09-02 Hitachi Ltd 障害時のサーバ決定方法
JP2007207219A (ja) * 2006-01-06 2007-08-16 Hitachi Ltd 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
JP2009252204A (ja) * 2008-04-11 2009-10-29 Hitachi Ltd 計算機の運用管理システム及び運用管理方法
JP2010128644A (ja) * 2008-11-26 2010-06-10 Hitachi Ltd 障害復旧方法、プログラムおよび管理サーバ
JP2011197852A (ja) * 2010-03-18 2011-10-06 Fujitsu Ltd 仮想計算機システムの管理プログラム,管理装置及び管理方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002084471A1 (en) * 2001-04-13 2002-10-24 Sun Microsystems, Inc. Virtual host controller interface with multipath input/output
JP2005301442A (ja) * 2004-04-07 2005-10-27 Hitachi Ltd ストレージ装置
US7460470B2 (en) * 2005-03-18 2008-12-02 Hewlett-Packard Development Company, L.P. Systems and methods of priority failover determination
US8369212B2 (en) * 2006-08-29 2013-02-05 Hewlett-Packard Development Company, L.P. Network path validation based on user-specified criteria

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005234917A (ja) * 2004-02-20 2005-09-02 Hitachi Ltd 障害時のサーバ決定方法
JP2007207219A (ja) * 2006-01-06 2007-08-16 Hitachi Ltd 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
JP2009252204A (ja) * 2008-04-11 2009-10-29 Hitachi Ltd 計算機の運用管理システム及び運用管理方法
JP2010128644A (ja) * 2008-11-26 2010-06-10 Hitachi Ltd 障害復旧方法、プログラムおよび管理サーバ
JP2011197852A (ja) * 2010-03-18 2011-10-06 Fujitsu Ltd 仮想計算機システムの管理プログラム,管理装置及び管理方法

Also Published As

Publication number Publication date
US20140317441A1 (en) 2014-10-23
JP5779254B2 (ja) 2015-09-16
WO2013072985A1 (ja) 2013-05-23
US9417978B2 (en) 2016-08-16

Similar Documents

Publication Publication Date Title
JP5779254B2 (ja) 計算機システムを管理する管理システム、計算機システムの管理方法及び記憶媒体
JP4492084B2 (ja) ストレージパス制御方法
US7619965B2 (en) Storage network management server, storage network managing method, storage network managing program, and storage network management system
US7457925B2 (en) Storage control method and system
WO2014064756A1 (ja) ストレージプールから実記憶領域を仮想ボリュームへ割り当てる方法及び計算機システム
JP2003208267A (ja) クラスタ型ディスク制御装置および負荷分散方法
US9361255B2 (en) Method for controlling I/O switch, method for controlling virtual computer, and computer system
US20090282283A1 (en) Management server in information processing system and cluster management method
JP2008228150A (ja) スイッチ装置及びフレーム交換方法とそのプログラム
WO2013132910A1 (ja) ホスト提供システム及びホスト提供方法
US10019182B2 (en) Management system and management method of computer system
JP5843888B2 (ja) 計算機システムの管理方法、計算機システム及び記憶媒体
WO2014054070A1 (en) Management system for managing a physical storage system, method of determining a resource migration destination of a physical storage system, and storage medium
JPWO2013118243A1 (ja) 計算機システムおよびデータ入出力方法
WO2013171865A1 (ja) 管理方法及び管理システム
US10983580B2 (en) Computer system and electric power control method for computer system
US8671186B2 (en) Computer system management method and management apparatus
JP6063576B2 (ja) サーバシステム、計算機システム、サーバシステムの管理方法、及びコンピュータ読み取り可能な記憶媒体
JP7316322B2 (ja) 管理システム、データリバランス管理方法、及びデータリバランス管理プログラム
US9363316B2 (en) Apparatus and method for controlling access to a disk apparatus in an information processing system
JP2013168743A (ja) 通信システム、転送装置のコントローラ及び転送装置の制御方法
JP7332488B2 (ja) ストレージシステム及びストレージシステムの制御方法
US20070130564A1 (en) Storage performance monitoring apparatus
US20230185632A1 (en) Management system, data rebalancing management method, and recording medium
US9952776B1 (en) Automatic non-disruptive congestion control of a fabric in a data storage system

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150630

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150710

R150 Certificate of patent or registration of utility model

Ref document number: 5779254

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees