JP2005309748A - ストレージシステム及びストレージシステムの障害解消方法 - Google Patents

ストレージシステム及びストレージシステムの障害解消方法 Download PDF

Info

Publication number
JP2005309748A
JP2005309748A JP2004125622A JP2004125622A JP2005309748A JP 2005309748 A JP2005309748 A JP 2005309748A JP 2004125622 A JP2004125622 A JP 2004125622A JP 2004125622 A JP2004125622 A JP 2004125622A JP 2005309748 A JP2005309748 A JP 2005309748A
Authority
JP
Japan
Prior art keywords
failure
countermeasure
storage
bottleneck
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004125622A
Other languages
English (en)
Other versions
JP4514501B2 (ja
Inventor
Atsushi Numanoi
淳 沼野井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004125622A priority Critical patent/JP4514501B2/ja
Priority to US10/912,410 priority patent/US7702962B2/en
Publication of JP2005309748A publication Critical patent/JP2005309748A/ja
Application granted granted Critical
Publication of JP4514501B2 publication Critical patent/JP4514501B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3433Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment for load management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/349Performance evaluation by tracing or monitoring for interfaces, buses

Abstract

【課題】 ストレージシステムの構成を実際に変更する前に、ストレージシステムの各要素の状態に基づいてボトルネックの発生を検出し、このボトルネックを解消するための対策を提示する。
【解決手段】 ホストの要素N1は、要素N3、要素N6、要素N8を介して、ストレージ装置内の要素N10に接続されている(S1)。要素N1は、例えば、デバイスファイル等である。要素N10は、例えば、論理ボリューム等である。中間の要素N8にボトルネックが発生した場合(S2)、ストレージシステムの各要素に関して収集された情報に基づいて(S3)、このボトルネックが検出される(S4)。このボトルネック解消に有効な対策が検討され、選択される(S5,S6)。この対策は、経路上の両端に位置する要素N1,N2またはN9,N10のいずれかを操作するものである。
【選択図】 図1

Description

本発明は、ストレージシステム及びストレージシステムの障害解消方法に関する。
ストレージシステムは、例えば、複数のホストコンピュータ(サーバ等)によって利用される1台以上のストレージ装置を備えている。各ホストコンピュータとストレージ装置とは、ファイバチャネルスイッチやハブ等の中継装置を介して接続される。
ストレージ装置は、例えば、ディスクアレイ装置等とも呼ばれるもので、多数のディスクドライブをアレイ状に配設して構成される。ストレージ装置は、例えば、RAID(Redundant Array of Independent Inexpensive Disks)に基づく記憶領域を提供する。各ディスクドライブが有する物理的な記憶領域上には、論理的な記憶領域である論理ボリューム(論理デバイス)が形成されている。そして、サーバ等のようなホストコンピュータは、ストレージ装置に対して所定形式のライトコマンド又はリードコマンドを発行することにより、所望のデータの読み書きを行うことができる。
各ホストコンピュータは、所定の経路を介して、割り当てられた論理ボリュームにアクセスし、データの読み書きを行う。システム管理者等は、負荷の均等配分に考慮して、論理ボリュームの割当てを行うことができる。ストレージシステムに新たに追加されたホストコンピュータに対し、最も低負荷の論理ボリュームを割当てるようにした技術も知られている(特許文献1)。
また、予め複数の通信経路を設定しておき、電源障害等が発生した場合は、代替経路を介してデータを転送するようにした技術も知られている(特許文献2)。
特開平10−320126号公報 特表2004−503956号公報
前者の特許文献では、各論理ボリュームの負荷状態を検出して論理ボリュームの最適な割当てを図っている。しかし、ストレージシステムは、ストレージ装置のみで構成されるわけではなく、複数のホストコンピュータやファイバチャネルスイッチ等の複数種類の要素から構成されるものである。前者の公知技術では、ストレージ装置以外の他の要素の負荷状態を考慮することができず、ストレージシステム全体の状況に基づいて、負荷分散等を行うことができない。
後者の特許文献では、通信経路がダウンした場合に代替経路を介してデータ転送を行うものに過ぎず、ストレージシステム全体の負荷状況を考慮可能なものではない。
ストレージシステムは、例えば、ホストコンピュータやファイバチャネルスイッチ、ストレージ装置等の複数種類の要素によって構成される複雑なシステムであり、その時々の使用状況等によってシステム全体の負荷状態が変動する。ストレージシステム内で負荷の遍在が発生し、運用に支障を来したような場合、例えば、システム管理者が自己の経験等に基づいて、ディスクを追加したり、論理ボリュームの割当てを変更する。しかし、その構成変更が負荷の遍在解消に有効である保証は無い。また、24時間365日の連続稼働が要求されるストレージシステムの負荷状況は、時々刻々と変化するので、この頻繁で不規則な状況変化に対し、適切かつ速やかに対応するのは困難である。
そこで、本発明の一つの目的は、実際に構成変更を行う前に、ストレージシステムを構成する各要素の性能状態を考慮して、性能改善上の障害を解消する対策を発見可能としたストレージシステム及びストレージシステムの障害解消方法を提供することにある。本発明の一つの目的は、ホストコンピュータとストレージ装置との間の中間に位置する要素の状況を考慮しつつ、この中間の要素の構成を直接変更するのではなく、通信経路上の両端に位置するホストコンピュータ及びストレージ装置側の構成変更で対応可能としたストレージシステム及びストレージシステムの障害解消方法を提供することにある。本発明のさらなる目的は、後述する実施形態の記載から明らかになるであろう。
上記課題を解決すべく、本発明のストレージシステムは、複数の論理ボリュームを有するストレージ装置と、このストレージ装置に接続され、各論理ボリュームにアクセスするためのアクセス処理部を有するホストコンピュータと、ストレージ装置及びホストコンピュータにそれぞれ接続された管理用コンピュータと、を備える。さらに、本発明では、ホストコンピュータからストレージ装置までの通信経路上に存在する各要素の性能に関する性能情報をそれぞれ収集する性能情報収集部と、収集された各要素の性能情報に基づいて、性能改善上の障害を有する障害要素を検出する障害要素検出部と、検出された障害要素の障害内容に基づいて対策を検討し、障害に有効な対策を選択する検討部と、を備え、検討部により検討される対策は、障害要素に関連する論理ボリューム及びアクセス処理部の少なくともいずれか一方を、他の論理ボリュームまたは他のアクセス処理部に変更させるようになっている。
ここで、「アクセス処理部」とは、例えば、ホストコンピュータに実装されたアプリケーションプログラムからのデータアクセス要求を処理するための機能または構造を意味し、ファイルシステムやデバイスファイル等を挙げることができる。「通信経路上に存在する各要素」としては、例えば、論理ボリュームと、アクセス処理部と、スイッチやハブ等のような中継装置等を挙げることができる。「ホストコンピュータ」は、例えば、サーバやメインフレーム等のようなコンピュータであり、例えば、クライアント端末からの要求に応じてデータ処理を行う。「管理用コンピュータ」は、ストレージシステムの管理を行うためのコンピュータである。機能上、ホストコンピュータと管理用コンピュータとは区別されるが、例えば、物理的に同一のコンピュータ内にアプリケーションサーバと管理用サーバとを併存させる構成でもよい。
「性能情報」とは、例えば、応答性等のような各要素の性能に関連する情報を意味し、例えば、単位時間あたりのI/O量(入出力要求量等を挙げることができる。「性能改善上の障害」とは、各要素の性能を低下させている事象を意味する。例えば、特定の要素に負荷が集中しているために応答性が低下している場合、負荷の集中が「性能改善上の障害」に相当する。
検討部により選択された対策をユーザに提示する提示部を備えることもできる。提示部は、例えば、端末画面や音声合成装置等のユーザインターフェースを介して、検討部により選択された対策をユーザに提示することができる。システム管理者等のユーザは、提示された対策を採用するか否かを判断することができる。提示された対策を採用する場合、ユーザは、管理用コンピュータ等を介して、ストレージシステムの構成変更を行う。
検討部は、予め用意された複数の対策の全部または一部について障害に対する有効性を評価することにより、障害に有効な対策を選択することができる。例えば、第1の対策,第2の対策、第3の対策等のように、予め複数の対策を用意しておき、これら複数の対策の全部または一部について、障害に対する有効性を評価することができる。各対策には、それぞれ複数のサブ対策を含めることができる。そして、検討部は、例えば、最も有効性の高い対策を選択することができる。あるいは、検討部は、障害改善効果と障害改善に要する各種コストとを比較し、費用対効果の優れた対策を選択することもできる。
それぞれ異なる優先度を有する複数の対策を予め記憶する記憶部を設け、検討部は、複数の対策のうち優先度の高い対策から順番に、障害に対する有効性を評価し、障害に有効な対策を発見した場合は、この対策を選択することもできる。
例えば、第1の対策,第2の対策,第3の対策の順番で高い優先度が設定されている場合、検討部は、第1の対策から順番に有効性を評価していく。そして、有効な対策を発見した場合、検討部は、残りの対策についての評価を行わず、有効であると最初に判断された対策を選択する。例えば、最も優先度の高い第1の対策が所定の有効性を有すると判断された場合、検討部は、第2の対策及び第3の対策についての有効性評価を行わず、第1の対策を選択する。これにより、障害に有効な対策を早期に選択することができる。
それぞれ異なる優先度を有する複数の対策のそれぞれについて、その対策により影響を受ける要素の範囲を予め関連付けておき、検討部は、複数の対策のうち優先度の高い対策から順番に、その対策に予め関連付けられた要素の範囲内で障害に対する有効性を評価し、障害に有効な対策を発見した場合は、この対策を選択することもできる。
対策の種類によって、その対策が実施された場合の影響範囲は、それぞれ異なる場合がある。ある一つの対策は特定の範囲内の要素に対して影響を及ぼし、別の一つの対策は他の範囲内の要素に対して影響を及ぼす場合がある。即ち、ある一つの対策は、ある一つまたは複数の要素に対して有効であり、別の一つの対策は、他の一つまたは複数の要素に対して有効な場合がある。このような場合に、検討部は、その対策が有効な範囲内で、障害への有効性を評価する。これにより、無駄な有効性評価が行われるのを防止して、効率的に有効性を評価することができる。
本発明の他の観点に従うストレージシステムの障害解消方法は、複数の論理ボリュームを有するストレージ装置と、このストレージ装置に接続され、各論理ボリュームにアクセスするためのアクセス処理部を有するホストコンピュータと、ストレージ装置及びホストコンピュータにそれぞれ接続された管理用コンピュータと、を備えたストレージシステムの障害を解消するための方法であって、ホストコンピュータからストレージ装置までの通信経路上に存在する各要素の性能に関する性能情報をそれぞれ収集するステップと、収集された各要素の性能情報に基づいて、性能改善上の障害を有する障害要素を検出するステップと、検出された障害要素の障害内容に基づいて、障害要素に関連する論理ボリューム及びアクセス処理部の少なくともいずれか一方を他の論理ボリュームまたは他のアクセス処理部に変更させる対策を選択するステップと、選択された対策をユーザに提示するステップと、を含む。
本発明の機能、手段、ステップの全部または一部は、マイクロコンピュータにより実行されるコンピュータプログラムとして構成することもできる。そして、このコンピュータプログラムは、例えば、ハードディスク、光ディスク、半導体メモリ等の記憶媒体に固定して配布することができる。または、コンピュータプログラムをインターネット等の通信ネットワークを介して、配信することもできる。
以下、図面に基づき、本発明の実施の形態を説明する。本実施形態のストレージシステムは、データを格納する複数のデータ格納先要素(例えば、論理ボリューム)と、これら各データ格納先要素に格納されるデータにアクセスする複数のデータ利用元要素(例えば、デバイスファイル)と、各データ格納先要素と各データ利用元要素との間に設けられる少なくとも一つ以上の中継要素(例えば、スイッチ)と、各データ利用元要素から中継要素を介して各データ格納先要素に至る経路とを含む情報処理システムである。
そして、このストレージシステムは、性能情報収集部と、障害要素検出部と、検討部と、提示部とを備えることができる。性能情報収集部は、例えば、負荷情報等のような各要素の性能に関する情報をそれぞれ収集する。障害要素検出部は、収集された性能に関する情報に基づいて、例えば、性能上のボトルネック等のような性能改善上の障害を有する障害要素を検出する。検討部は、検出された障害要素の障害内容を検討し、各データ利用元要素及び各データ格納先要素のうち障害要素に関連するデータ利用元要素またはデータ格納先要素の少なくともいずれか一方を他のデータ利用元要素または他のデータ格納先要素に変更させる対策を少なくとも一つ以上シミュレートすることにより、障害に有効な対策を選択する。提示部は、選択された対策を提示する。
図1は、本実施形態の全体概念を模式的に示す説明図である。このストレージシステムは、少なくとも一つ以上のホストコンピュータ及びストレージ装置を備える。ストレージシステムは、複数の要素N1〜N10を備えている。
これらの要素N1〜N10は、その情報処理経路上の位置に応じて、幾つかのグループに分類可能である。幾つかの要素N1,N2は、情報処理経路上の一方の端点であるホストコンピュータに属する。他の幾つかの要素N9,N10は、情報処理経路上の他方の端点であるストレージ装置に属する。残りの要素N3〜N8は、情報処理経路上の中間に位置し、ホストコンピュータとストレージ装置との間に介在する。
ここで、ホストコンピュータに属する要素N1,N2は、例えば、ファイルシステムやデバイスファイル等であり、データ利用元の要素である。ストレージ装置に属する要素N9,N10は、例えば、論理ボリュームやパリティグループ等であり、データ格納先の要素である。中間に位置する要素N3〜N8は、例えば、スイッチやハブ等であり、中継要素である。
S1に示すように、一方の端点に位置する要素N1と他方の端点に位置する要素N10とは、所定の経路を介して接続されている。即ち、要素N1は、N3からN6及びN8を介して、N10に接続されている(N1→N3→N6→N8→N10)。例えば、図外のアプリケーションプログラムが、ファイルシステム(図示せず)を介して、デバイスファイル(N1)にアクセス要求を発行した場合、このアクセス要求は、N3、N6,N8を介して、論理ボリューム(N10)に到達する。
S2に示すように、ある時点で、要素N1と要素N10との経路上に位置する要素N8に、ボトルネックが発生したとする。例えば、他のデータ処理のために要素N8が使用されており、要素N8に過大な負荷が発生しているような場合、要素N8の応答性等が低下して、ボトルネックとなる。
本実施形態のストレージシステムは、各要素N1〜N10の性能に関する情報を定期的に収集している(S3)。そして、ストレージシステムは、各要素N1〜N10の最新の状態に基づいて、ボトルネック(図示の例では、N8)を検出する(S4)。ストレージシステムは、このボトルネックを解消するための対策を一つまたは複数検討し、ボトルネック解消に有効と判断される対策を選択する(S5)。
ストレージシステムは、要素N1が利用している要素N10を別の要素N9に変更させることにより、結果的に要素N8を回避する新たな経路を設定する。ホストコンピュータ側の要素N1は、要素N3から要素N5及び要素N7を介して、ストレージ装置側の要素N9にアクセスする(N1→N3→N5→N7→N9)。即ち、本実施形態では、ボトルネックとなる要素N8を直接回避する対策を検討するのではなく、情報処理経路の両端にそれぞれ位置する要素N1,N2及びN9,N10を変更させることで、結果的にボトルネックを解消するようになっている。
図2は、ストレージシステムの全体構成を示すブロック図である。このストレージシステムは、それぞれ後述するように、複数のアプリケーションサーバ10(以下、「サーバ」)と、一つのストレージ装置20と、複数のファイバチャネルスイッチ(以下、「スイッチ」)30と、一つの監視サーバ40と、一つの管理サーバ50と、複数のクライアント端末60とを備えている。
各サーバ10は、一つまたは複数のアプリケーションプログラム(「アプリケーション」と略記)11と、一つまたは複数のファイルシステム12と、一つまたは複数のデバイスファイル13と、HBA(Host Bus Adapter)等の通信ポート14と、ホスト情報収集部15とを、それぞれ備えている。各サーバ10は、例えば、CPU(Central Processing Unit)やROM(Read Only Memory)、RAM(Random Access Memory)、各種ドライバソフトウェア等のコンピュータ資源をそれぞれ備えたコンピュータである。
アプリケーションプログラム11は、ファイルシステム12を介して、デバイスファイル13にアクセスする。ファイルシステム12は、ファイル単位でデータの入出力を管理するためのプログラムである。デバイスファイル13は、OS(Operating System)のカーネルに組み込まれたデバイスドライバを呼び出すためのプログラムである。通信ポート14は、例えば、ファイバチャネルプロトコル等の所定のプロトコルに基づいて、データ通信を行うものである。
アプリケーションプログラム11がデバイスファイル13にアクセスすると、デバイスドライバが起動される。これにより、アプリケーションプログラム11は、通信ポート14を介してストレージ装置20にアクセスし、データの読み書きを行う。
ホスト情報収集部15は、サーバ10の性能に関する情報を定期的に収集し、この収集した性能情報を管理サーバ50に送信するためのプログラムである。サーバ10の性能に関する情報の一例として、ホスト情報収集部15は、デバイスファイル13の単位時間当たりのI/O量を定期的に収集する。
ストレージ装置20は、一つまたは複数の通信ポート21と、一つまたは複数のパリティグループ22と、一つまたは複数の論理ボリューム23とを備えている。図中では1台のみ示しているが、ストレージ装置20は、複数設けることもできる。各通信ポート21は、例えば、ファイバチャネルプロトコル等の所定のプロトコルに基づいて、各サーバ10とのデータ通信をそれぞれ行うものである。各パリティグループ22は、複数のディスクドライブをそれぞれグループ化したものである。各パリティグループ22により提供される物理的な記憶領域上には、少なくとも一つ以上のLDEV23をそれぞれ構築することができる。各LDEV23は、論理的な記憶デバイス(論理ボリューム)である。ストレージ装置20の構成については、さらに後述する。
各スイッチ30は、それぞれ複数のポート31を備えている。図中では、「スイッチ」を「SW」と略記している。ストレージ装置20と各サーバ10とは、スイッチ30にそれぞれファブリック接続されている。スイッチ30とサーバ10との間は、ファイバチャネルプロトコルに従う通信ネットワークCN2によって接続されている。また、スイッチ30とストレージ装置20との間も、ファイバチャネルプロトコルに従う通信ネットワークCN2により接続されている。
監視サーバ40は、各スイッチ30やストレージ装置20の状況を監視し、監視結果を管理サーバ50に報告するものである。監視サーバ40は、スイッチ30の性能情報を収集するためのスイッチ情報収集部41と、ストレージ装置20の性能情報を収集するためのストレージ情報収集部42とを備えている。スイッチ情報収集部41は、各スイッチ30の各ポート31の単位時間あたりのI/O量を収集する。ストレージ情報収集部42は、ストレージ装置20の各ポート21、各パリティグループ22及び各LDEV23の単位時間当たりのI/O量をそれぞれ収集する。なお、性能情報の一例として、I/O量(データ入出力要求量)を挙げているが、これに限らず、例えば、応答時間等のような他の情報を採用することもできる。また、監視サーバ40は、管理サーバ50と一体化することもできる。あるいは、サーバ10のいずれかに監視機能を設けてもよい。
管理サーバ50は、ボトルネック検出部51と、検討部52と、対策提示部53と、性能情報データベース54とを備えている。詳細は後述するが、管理サーバ50は、各ホスト情報収集部15とスイッチ情報収集部41とストレージ情報収集部42とから、それぞれ性能情報を定期的に収集する。そして、管理サーバ50は、ストレージシステム内のボトルネックを検出し、このボトルネックを解消するための対策を検討する。管理サーバ50は、検討結果をユーザに提示する。
図3は、管理サーバ50の機能構成を示す説明図である。性能情報データベース54には、それぞれ後述するように、ホスト性能情報T1と、スイッチ性能情報T2と、ストレージポート性能情報T3と、パリティグループ性能情報T4と、LDEV性能情報T5と、経路情報T6と、対策情報T7と、閾値情報T8とを記憶させることができる。これらの各情報T1〜T8は、同一のデータベース54内に存在させる必要性はなく、異なる複数のデータベースに分散して記憶させる構成でもよい。
ボトルネック検出部51は、ストレージシステムを構成する各要素(例えば、デバイスファイル13,スイッチポート31,ストレージポート21,パリティグループ22,LDEV23)について、性能上のボトルネックが発生しているか否かを検出する。ここで、性能上のボトルネックは顕在化している必要はなく、将来ボトルネックとなり得る状態も含ませることができる。即ち、後述の閾値の設定等によっても異なるが、実際にボトルネックとして顕在化する前の状態を、ボトルネックとして検出可能である。
検討部52は、データ量算出部52Aと、シミュレーション対象設定部52Bと、シミュレーション部52Cとを備えることができる。データ量算出部52Aは、ボトルネックとなった要素にI/Oを発生させているデバイスファイルを特定し、このボトルネックの原因となっているデバイスファイルのI/O量を算出するものである。シミュレーション対象設定部52Bは、ボトルネック解消用の対策をシミュレーションする対象を抽出するものである。シミュレーション部52Cは、抽出された対象について所定のシミュレーションを行い、その結果を評価するものである。このように、検討部52は、ボトルネックが検出された場合に、このボトルネックを解消するための対策を一つまたは複数シミュレートし、有効な対策の発見を試みる。検討部52は、有効な対策が発見された場合、この対策を選択する。
対策提示部53は、検討部52によって選択された対策をユーザに提示する。対策提示部53は、例えば、端末画面からの表示出力や音声合成装置からの音声出力等によって、有効と判断された対策を提示する。ユーザは、提示された対策を検討し、この提案を受け入れるか否かを判断することができる。提案を受け入れる場合、ユーザは、例えば、管理サーバ50を介して、ストレージシステムの構成変更を行うことができる。なお、場合によっては、ユーザへの提示を省略し、ストレージシステムの構成変更を直接実行する構成でもよい。この場合、対策提示部53は、「対策実行指示部」と呼ぶことができる。
図4は、ストレージ装置20の機能構成を示す説明図である。ストレージ装置20は、通信ネットワークCN2を介して、複数のサーバ10と双方向通信可能にそれぞれ接続されている。
通信ネットワークとしては、例えば、LAN(Local Area Network)、SAN(System Area Network)、インターネットあるいは専用回線等を採用可能である。LANを用いる場合、各サーバ10とストレージ装置20との間のデータ転送は、TCP/IPに従って行われる。SANを用いる場合、各サーバ10とストレージ装置20とは、ファイバチャネルプロトコルに従ってデータ転送を行う。また、サーバ10に替えてメインフレームマシンを用いる場合は、例えば、FICON(Fibre Connection:登録商標)、ESCON(Enterprise System Connection:登録商標)、ACONARC(Advanced Connection Architecture:登録商標)、FIBARC(Fibre Connection Architecture:登録商標)等の通信プロトコルに従ってデータ転送が行われる。
本実施例では、各サーバ10とストレージ装置20とをSANによって接続し、各サーバ10と監視サーバ40及び管理サーバ50とをLANによって接続する。また、ストレージ装置20がLANポートを備えている場合は、LANを介してストレージ装置20と管理サーバ50等とを接続することもできる。あるいは、通常のデータ転送と管理情報の転送とをSANを介して行うこともできる。
ストレージ装置20は、それぞれ後述するように、ディスクドライブ100と、チャネルアダプタ(以下、「CHA」)110と、ディスクアダプタ(以下、「DKA」)120と、キャッシュメモリ130と、共有メモリ140と、スイッチ部150と、サービスプロセッサ(以下、「SVP」)160とを備えている。
各ディスクドライブ100は、例えば、ハードディスクドライブ(HDD)や半導体メモリ装置等として実現することができる。ディスクドライブ100は、物理的な記憶デバイスである。RAID構成等によっても相違するが、例えば、3個1組あるいは4個1組等のような複数個のディスクドライブ100が、パリティグループ(RAIDグループとも呼ぶ)を構成している。そして、各パリティグループが提供する記憶領域上には、LDEV23が構築される。図中では、2個のパリティグループ22のそれぞれに2個ずつのLDEV23を構成する様子を示しているが、これに限らず、3個以上のパリティグループ22を設けることもでき、LDEV22も適宜設定することができる。なお、ストレージ装置20が各サーバ10に提供する記憶資源は、全てストレージ装置20内に設けられている必要はない。ストレージ装置20は、ストレージ装置20の外部に存在する記憶資源を、あたかも自己の記憶資源であるかのように取り込んで、利用することもできる。
各CHA110は、各サーバ10との間のデータ転送を制御するもので、複数のポート21を備えている。ストレージ装置20には、例えば32個等のような複数のCHA110を設けることができる。CHA110は、例えば、オープン系用CHA、メインフレーム系用CHA等のように、サーバ10の種類に応じて用意される。なお、1個のCHA110で複数のプロトコルをサポート可能に構成してもよい。各CHA110は、それぞれに接続されたサーバ10から、データの読み書きを要求するコマンド及びデータを受信し、サーバ10から受信したコマンドに従って動作する。
DKA120の動作も含めて先に説明すると、CHA110は、サーバ10からリードコマンドを受信すると、このリードコマンドを共有メモリ140に記憶させる。DKA120は、共有メモリ140を随時参照しており、未処理のリードコマンドを発見すると、ディスクドライブ100からデータを読み出し、キャッシュメモリ130に記憶させる。CHA110は、キャッシュメモリ130に移されたデータを読み出し、サーバ10に送信する。
一方、CHA110は、サーバ10からライトコマンドを受信すると、このライトコマンドを共有メモリ140に記憶させる。また、CHA110は、受信したデータ(ユーザデータ)をキャッシュメモリ130に記憶させる。CHA110は、キャッシュメモリ130にデータを記憶した後、サーバ10に書込み完了を報告する。DKA120は、共有メモリ140に記憶されたライトコマンドに従って、キャッシュメモリ130に記憶されたデータを読出し、所定のディスクドライブ100に記憶させる。
各DKA120は、ストレージ装置20内に例えば4個や8個等のように複数個設けることができる。各DKA120は、各ディスクドライブ100との間のデータ通信をそれぞれ制御する。各DKA120と各ディスクドライブ100とは、例えば、SAN等の通信ネットワークCN12を介して接続され、ファイバチャネルプロトコルに従ってブロック単位のデータ転送を行う。各DKA120は、各ディスクドライブ100の状態を随時監視しており、この監視結果は、LAN等の内部ネットワークCN11を介して、SVP28に送信される。
各CHA110及び各DKA120は、例えば、プロセッサやメモリ等が実装されたプリント基板と、メモリに格納された制御プログラム(いずれも不図示)とをそれぞれ備えており、これらのハードウェアとソフトウェアとの協働作業によって、それぞれ所定の機能を実現するようになっている。
キャッシュメモリ130は、例えば、ユーザデータ等を記憶するものである。キャッシュメモリ130は、例えば不揮発メモリから構成される。
共有メモリ(あるいは制御メモリ)140は、例えば不揮発メモリから構成される。共有メモリ140には、例えば、制御情報や管理情報等が記憶される。これらの制御情報等の情報は、複数の共有メモリ140により多重管理することができる。共有メモリ140及びキャッシュメモリ130は、それぞれ複数個設けることができる。
ここで、同一のメモリ基板にキャッシュメモリ130と共有メモリ140とを混在させて実装することもできる。あるいは、メモリの一部をキャッシュ領域として使用し、他の一部を制御領域として使用することもできる。
スイッチ部150は、各CHA110と、各DKA120と、キャッシュメモリ130と、共有メモリ140とをそれぞれ接続するものである。これにより、全てのCHA110,DKA120は、キャッシュメモリ130及び共有メモリ140にそれぞれアクセス可能である。スイッチ部150は、例えば超高速クロスバスイッチ等として構成することができる。
SVP28は、内部ネットワークCN11を介して、各CHA110及び各DKA120とそれぞれ接続されている。SVP28は、例えば、CHA110を経由して、共有メモリ140にアクセス可能である。また、SVP28は、通信ネットワークCN1を介して、監視サーバ40及び管理サーバ50に接続されている。SVP28は、ストレージ装置20内部の各種状態を収集し、監視サーバ40または管理サーバ50に送信する。なお、SVP28は、ストレージ装置20の筐体内に設けられている必要はなく、筐体外に設けることもできる。
次に、図5〜図11に基づいて、各情報T1〜T8の一例を説明する。図5(a)には、ホスト性能情報T1の構成が示されている。ホスト性能情報T1は、例えば、各サーバ10の名称(ホスト名)と、デバイスファイル名と、性能情報収集時刻と、単位時間当たりのI/O量とを対応付けることにより構成可能である。ホスト名「H1」で特定されるサーバ10は、2個のデバイスファイル「/dev/dsk/xxx」,「/dev/dsk/yyy」を備えており、これら各デバイスファイル毎に、それぞれ10分間隔で単位時間あたりのI/O量が収集され、記憶される。
例えば、一方のデバイスファイル「/dev/dsk/xxx」では、時刻10:00(24時間表記)において、1秒間に5000バイトのI/Oが発生している。また、同デバイスファイルの単位時間当たりのI/O量は、その10分後に1000バイト増加し、6000(バイト/秒)となっている。他方のデバイスファイル「dev/dsk/yyy」では、時刻10:00において、1秒間に1000バイトのI/Oが発生している。また、同デバイスファイルの単位時間当たりのI/O量は、その10分後も変化していない。
図5(b)に示すスイッチ性能情報T2は、例えば、スイッチ名と、ポート名と、性能情報収集時刻と、単位時間当たりのI/O量とを対応付けることにより構成可能である。図2に示すように、スイッチ名「SW-A」で特定されるスイッチ30において、ポート名「A1」で特定されるポートには、2個のデバイスファイル13がそれぞれ接続されている。このポート「A1」には、2個のデバイスファイル13からのアクセス要求がそれぞれ流入する。従って、時刻10:00において、ポート「A1」の単位時間当たりのI/O量は、6000(バイト/秒)となる。
図6(a)には、ストレージポート性能情報T3の構成が示されている。ストレージポート性能情報T3は、例えば、ストレージ装置名と、ストレージポート名と、性能情報収集時刻と、I/O量とを対応付けることにより構成することができる。図1に示すように、ストレージ装置名「SS1」で特定されるストレージ装置20において、ポート名「CL0-A」で特定されるストレージポート21には、パリティグループ「1−1」に属する2個のLDEV「0:10」及び「0:20」が接続されている。
ここで、一方のデバイスファイル「/dev/dsk/xxx」は一方のLDEV「0:10」にアクセスし、他方のデバイスファイル「/dev/dsk/yyy」は他方のLDEV「0:20」にアクセスしているものとする。従って、ストレージポート「CL0-A」には、両方のデバイスファイルからのアクセスが流入するため、時刻10:00における単位時間当たりのI/O量は、6000バイトとなっている。
図6(b)には、パリティグループ性能情報T4の構成が示されている。パリティグループ性能情報T4は、例えば、ストレージ装置名と、パリティグループ名と、性能情報収集時刻と、単位時間当たりのI/O量とを対応付けることにより構成可能である。例えば、パリティグループ名「1−1」で特定されるパリティグループ22は、2個のLDEV「0:10」及び「0:20」を有している。従って、このパリティグループ「1−1」の時刻10:00における単位時間当たりのI/O量は、6000バイトとなる。
図7には、LDEV性能情報T5の構成が示されている。LDEV性能情報T5は、例えば、ストレージ装置名と、LDEV名と、性能情報収集時刻と、単位時間当たりのI/O量とを対応付けることにより構成することができる。例えば、デバイスファイル「/dev/dsk/xxx」により使用されるLDEV「0:10」では、時刻10:00において、5000(バイト/秒)のI/Oが発生している。また、デバイスファイル「/dev/dsk/yyy」により使用されるLDEV「0:20」は、時刻10:00において、1000(バイト/秒)のI/Oを発生させている。
図8には、経路情報T6の構成が示されている。経路情報T6は、ストレージシステム内の各経路の構成を記憶するものである。経路情報T6は、例えば、ホスト名と、デバイスファイル名と、送信側のスイッチのポート名と、受信側のスイッチのポート名と、ストレージ装置名と、パリティグループ名と、ストレージ装置20のポート名と、LDEV名とを対応付けることにより構成することができる。
例えば、デバイスファイル「/dev/dsk/xxx」から出されたアクセス要求は、スイッチ「SW-A」のポート「A1」に入力されてポート「A2」から出力される。このアクセス要求は、ポート「A2」からスイッチ「SW-B」のポート「B1」に入力され、ポート「B2」から出力される。ポート「B2」から出力されたアクセス要求は、ストレージ装置20のストレージポート「CL0-A」に入力され、LDEV「0:10」に到達する。一方、他のデバイスファイル「/dev/dsk/yyy」も同様に、ポート「A1」、ポート「A2」、ポート「B1」、ポート「B2」、ストレージポート「CL0-A」を介して、LDEV「0:20」に接続されている。
図9には、対策情報T7の構成が示されている。対策情報T7は、例えば、項番と、対策名と、影響範囲と、優先度とを対応付けることにより構成可能である。ここで、「影響範囲」とは、その対策による影響が及ぶ範囲を意味し、その対策を実施した場合にボトルネック解消効果が見込まれる範囲を示す情報である。即ち、本実施例の場合、「影響範囲」には、その対策を実施した場合に、単位時間当たりのI/O量が変化する可能性のある要素名が登録されている。
「対策名」とは、予め用意された複数の対策を識別するための情報である。詳細は後述するが、対策としては、例えば、「アプリケーションプログラム11が使用するLDEVの変更」、「アプリケーションプログラム11が稼働するホストの変更」、「アプリケーションプログラム11が使用するLDEVの所属先パリティグループの変更」等を挙げることができる。対策情報T7に記憶されている各対策は、取り得る対策の種類を示すもので、具体的な対策内容は示されていない。例えば、「アプリケーションプログラム11が使用するLDEVを変更する」という対策は、LDEVの変更によってボトルネックを解消する可能性があることを示すのみで、具体的にどのLDEV23をどのLDEV23に変更するか等の情報を含んでいない。従って、対策情報T7に記憶される各対策は、例えば、「対策案」、「対策種別」、「対策方針」等と呼ぶこともできる。以下の説明では、説明の便宜上、上述の各対策を「LDEV変更」、「ホスト変更」、「パリティグループ変更」とそれぞれ略記する。
「優先度」とは、各対策の検討順序を示す情報である。優先度の数字が小さいほど、高い優先順位を有する。例えば、「LDEV変更」には優先度「1」が、「ホスト変更」には優先度「2」が、「パリティグループ変更」には優先度「3」が設定されている。検討部52は、ボトルネックの解消に際して、高い優先度を有する対策から順番に有効性を検討していく。従って、ボトルネックの発生箇所等によっても相違するが、高い優先度を有する対策であるほど、実施される可能性が高い。
各対策による影響範囲について簡単に述べると、「LDEV変更」は、スイッチポート31と、ストレージポート21と、パリティグループ22と、LDEV23とに、この順番で影響を与える可能性がある。但し、この順序で影響度合が弱まるとは限らない。また、本実施例は、この順序に制限されるものではない。「ホスト変更」は、これらに加えて、デバイスファイル13にも影響を与える可能性がある。「パリティグループ変更」は、「LDEV変更」と同様の要素に影響を与える可能性がある。
図10及び図11は、閾値情報T8の構成を示す。閾値情報T8は、各要素毎にそれぞれ用意することができる。ボトルネック発生前の状態を検出できるように、各要素の閾値を設定すれば、ボトルネックが実際に発生するよりも前に、ボトルネック発生の可能性を予測することができる。
図10(a)に示すように、ホスト閾値情報T8(1)は、例えば、ホスト名と、デバイスファイル名と、閾値とを対応付けることにより構成することができる。各デバイスファイル13に共通の閾値を設定することもできるし、それぞれ異なる閾値を設定することもできる。
図10(b)に示すように、スイッチ閾値情報T8(2)は、例えば、スイッチ名と、ポート名と、閾値とを対応付けることにより構成可能である。前記同様に、各スイッチポートに共通の閾値を設定してもよいし、それぞれ異なる閾値を設定してもよい。
図10(c)に示すように、ストレージポート閾値情報T8(3)は、例えば、ストレージ装置名と、ポート名と、閾値とを対応付けることにより構成可能である。各ストレージポートに共通の閾値を設定することもできるし、それぞれ異なる閾値を設定することもできる。
図11(a)に示すように、パリティグループ閾値情報T8(4)は、例えば、ストレージ装置名と、パリティグループ名と、閾値とを対応付けることにより構成することができる。前記同様に、各パリティグループに共通の閾値を設定してもよいし、それぞれ異なる閾値を設定してもよい。
図11(b)に示すように、LDEV閾値情報T8(5)は、例えば、ストレージ装置名と、LDEV名(LDEV番号)と、閾値とを対応付けることにより構成可能である。各LDEVに共通の閾値を設定してもよいし、それぞれ異なる閾値を設定してもよい。
図12は、管理サーバ50により実行されるボトルネック検出処理の概要を示すフローチャートである。ボトルネック検出処理を実行する前の前提として、管理サーバ50は、各要素の負荷状態(単位時間当たりのI/O量)を所定周期でそれぞれ収集し、データベース54に登録している。ボトルネック検出処理は、性能情報の収集サイクルに合わせて実行することができる。
管理サーバ50は、まず最初に、データベース54から最新のホスト性能情報T1を読込み(S11)、各デバイスファイル13の単位時間当たりのI/O量が所定の閾値以上であるか否かを判定する(S12)。所定の閾値以上のデバイスファイル13が検出された場合(S12:YES)、管理サーバ50は、その高負荷状態のデバイスファイル13について、ボトルネック検出フラグをセットする(S13)。ボトルネック検出フラグとは、その要素が現在ボトルネックである状態、またはボトルネックとなる可能性がある状態を示す情報である。
ホスト性能情報T1について検査を終えた後、管理サーバ50は、データベース54から最新のスイッチ性能情報T2を読込み(S14)、各スイッチポート31の単位時間当たりのI/O量が所定の閾値以上になったか否かを判定する(S15)。所定の閾値以上のスイッチポート31が検出された場合(S15:YES)、管理サーバ50は、そのスイッチポート31について、ボトルネック検出フラグをセットする(S16)。
スイッチ性能情報T2について検査を終えた後、管理サーバ50は、データベース54から最新のストレージポート性能情報T3を読み込む(S17)。管理サーバ50は、各ストレージポート21の単位時間当たりのI/O量が所定の閾値以上であるか否かを判定する(S18)。所定の閾値以上のI/O量が発生しているストレージポート21を検出した場合(S18:YES)、管理サーバ50は、このストレージポート21にボトルネック検出フラグをセットする(S19)。
管理サーバ50は、データベース54から最新のパリティグループ性能情報T4を読込み(S20)、単位時間当たりのI/O量が所定の閾値以上となっているパリティグループ22が存在するか否かを判定する(S21)。所定の閾値以上のパリティグループ22が検出された場合(S21:YES)、管理サーバ50は、このパリティグループ22について、ボトルネック検出フラグをセットする(S22)。
管理サーバ50は、最新のLDEV性能情報T5を読込み(S23)、単位時間当たりのI/O量が所定の閾値以上となっているLDEV23が存在するか否かを判定する(S24)。所定の閾値以上のLDEV23が検出された場合(S24:YES)、管理サーバ50は、このLDEV23について、ボトルネック検出フラグをセットする(S25)。
以上のように、管理サーバ50は、各要素の最新の性能情報に基づいて、各監視対象の要素にボトルネックが存在するか否かを判定し、ボトルネックとなっている要素を検出する。各要素から収集される性能情報が更新された場合、管理サーバ50は、図12に示すボトルネック検出処理を改めて実行することができる。
図13は、管理サーバ50によるボトルネックの解析処理(対策検討処理)の概要を示すフローチャートである。この解析処理は、ボトルネック検出処理の完了に合わせて実行することができる。
管理サーバ50は、ボトルネックが検出されたか否かを判定する(S31)。ボトルネック検出フラグがセットされている場合は、ストレージシステム内でボトルネックが検出されたことを示している。
ボトルネックが検出された場合(S31:YES)、管理サーバ50は、経路情報T6を参照することにより、ボトルネックとなっている要素にI/Oを発生させているデバイスファイル13を特定する(S32)。上述のように、経路情報T6には、ストレージシステム内の各経路毎に、各要素の接続関係がそれぞれ記録されている。なお、デバイスファイル13自体がボトルネックとなっている場合は、このデバイスファイル13がボトルネック発生原因のデバイスファイルとして特定される。
管理サーバ50は、ボトルネックを発生させているデバイスファイル13の最新の単位時間当たりのI/O量を確認する(S33)。次に、管理サーバ50は、高い優先度を有する対策から順番に、シミュレートする。本実施例では、「LDEV変更」に最も高い優先度が与えられているため、管理サーバ50は、まず最初に、「LDEV変更」を選択する(S34)。管理サーバ50は、LDEV23の変更による対策がボトルネックの解消に有効であるか否かをシミュレートする(S35)。このシミュレーション処理については、さらに後述する。
管理サーバ50は、「LDEV変更」対策を実施することによりボトルネックが解消されるか否かを判定する(S36)。ボトルネックが解消されると判断した場合(S36:YES)、管理サーバ50は、この「LDEV変更」の具体的な変更方法について、ユーザに提示する(S37)。システム管理者等のユーザは、管理サーバ50から提案された具体的な対策内容を検討することができる。管理サーバ50から提案された具体的対策を採用する場合、ユーザは、所定のタイミングを見計らって、ストレージシステムの構成を変更することができる。
例えば、管理サーバ50によって検出されたボトルネックが一時的、過渡的なものに過ぎず、放置しても特に問題が無いような場合、ユーザは、管理サーバ50からの提案を無視することができる。これとは逆に、例えば、管理サーバ50によって検出されたボトルネックが長期的、定常的なものであり、ストレージシステムの性能に悪影響を及ぼすような場合、ユーザは、直ちにまたは所望のタイミングで、ストレージシステムの構成を変更することができる。
「LDEV変更」対策によってボトルネックを解消できない場合(S36:NO)、管理サーバ50は、次に優先度の高い対策を選択する(S38)。本実施例では、「ホスト変更」対策の有効性が検討される(S39)。S39のシミュレーション処理については、さらに後述する。管理サーバ50は、この第2の対策でボトルネックを解消可能か否かを判定する(S40)。「ホスト変更」対策によってボトルネックを解消可能な場合(S40:YES)、管理サーバ50は、具体的な対策内容をユーザに提案する(S41)。この提案には、例えば、アプリケーションプログラム11を実行させるサーバをどのサーバ10に移すべきか等の情報を含めることができる。前記同様に、ユーザは、管理サーバ50からの具体的な提案を検討し、この提案を採用する場合は、所定のタイミングを見計らって実行に移すことができる。
第2の対策もボトルネック解消に有効でないと判断された場合(S40:NO)、管理サーバ40は、対策情報T7に予め登録されている全ての対策を検討したか否かを判定する(S42)。本実施例では、第3の対策として「パリティグループ変更」を用意しているので、次に、「パリティグループ変更」対策が選択され(S42:NO,S38)、前記同様にシミュレーション等が行われる(S39〜S41)。
第3の対策をシミュレーションした結果、「パリティグループ変更」対策もボトルネック解消に有効ではないと判断された場合(S40:NO)、管理サーバ50は、予め用意された全ての対策について検討を終えたことになる(S42:YES)。そこで、管理サーバ50は、ボトルネックの検出のみをユーザに通知する(S43)。この通知を受けたユーザは、ストレージ装置の増設や新製品への置換等を検討することができる。
図14〜図16に基づき、各対策のシミュレーション方法を説明する。図14は、「LDEV変更」対策のシミュレーション処理を示すフローチャートである。管理サーバ50は、I/O発生元のデバイスファイル13(大元のデバイスファイル13または原因発生元デバイスファイル13と呼ぶ)により使用されているLDEVを移動可能な全てのLDEV23を検出する(S51)。移動可能なLDEV23としては、例えば、(1)別のサーバ10やアプリケーションプログラム11によりアクセスロックが設定されていないこと、(2)大元のデバイスファイル13のI/O量が加わっても支障を生じないこと等の条件を満たすLDEV23を挙げることができる。
管理サーバ50は、リストアップされた全ての移動先候補LDEVのうち、第1番目の移動先候補LDEVを選択する(S52)。次に、管理サーバ50は、経路情報T6を参照し、第1の移動先候補LDEVと大元のデバイスファイル13との間の経路を検索する(S53)。即ち、大元のデバイスファイル13のアクセス先LDEVを第1の移動先候補LDEVに移動させた場合の経路を検索する。以下、ボトルネックとなっているLDEV23と大元のデバイスファイル13との間の現在の経路に対し、移動先候補LDEV23と大元のデバイスファイル13との間の経路を新経路と呼ぶ。
管理サーバ50は、スイッチ性能情報T2〜LDEV性能情報T5の4つのテーブルをコピーすることにより、シミュレーション用テーブルを生成する(S54)。ここで、ホスト性能情報T1のコピーは用意する必要はない。図9と共に述べたように、「LDEV変更」対策は、デバイスファイル13の性能に影響を与えないため、デバイスファイル13についてのシミュレーションは省略される。つまり、管理サーバ50は、その対策が影響を及ぼす範囲内でシミュレーションを行うために、事前準備をする。以下のシミュレーションは、コピーされたテーブル上でI/O量を加減算することにより行われる。
管理サーバ50は、現在の経路上に位置する各要素から、移動予定のI/O量をそれぞれ減算する(S55)。移動予定のI/O量とは、大元のデバイスファイル13によって発生している現在のI/O量である。次に、管理サーバ50は、減算したI/O量を、新経路上に位置する各要素にそれぞれ加算する(S56)。
管理サーバ50は、現在の経路上に存在するボトルネックが解消するか否かを判定する(S57)。ボトルネックが解消すると判断した場合(S57:YES)、管理サーバ50は、新たにI/O量が加算される各要素に新たなボトルネックが発生したか否かを判定する(S58)。
新経路上の要素に新たなボトルネックが発生しない場合(S58:NO)、管理サーバ50は、この移動先候補LDEV23を「LDEV変更」対策に使用するLDEVとして決定する(S59)。
一方、現在のI/O量を移動先候補LDEV23に移し替えても、現在発生しているボトルネックが解消しない場合(S57:NO)、他の移動先候補LDEV23について検討する必要がある。また、I/O量を移動させることにより新たなボトルネックが発生した場合(S58:YES)も、他の移動先候補LDEV23について検討する必要がある。
管理サーバ50は、S51で抽出された全ての移動先候補LDEV23について、シミュレート済であるか否かを判定する(S60)。未検討の移動先候補LDEV23が残っている場合(S60:NO)、管理サーバ50は、検討対象の移動先候補LDEV23を切り替えて(S61)、S53に戻る。
このようにして、管理サーバ50は、リストアップされた移動先候補LDEV23について、シミュレーションを繰り返す。現在発生中のボトルネックが解消され、かつ、新たなボトルネックが発生しないと判断された場合、管理サーバ50は、その移動先候補LDEV23を選択する。
リストアップされた全ての移動先候補LDEV23についてシミュレーションを完了した場合でも、適切な移動先候補LDEV23を検出できないときは(S60:YES)、このLDEV変更シミュレーションを終了し、図13に示す処理に戻る。この場合、管理サーバ50は、別の対策についてシミュレーションを行うことになる。
次に、図15は、「ホスト変更」対策のシミュレーション処理を示すフローチャートである。このシミュレーション処理は、図14の処理と基本構造は同一である。主な相違点は、シミュレーション対象が「デバイスファイル」となっている点等である。
管理サーバ50は、移動先候補ホスト(移動先候補のデバイスファイル)を全て検出する(S71)。管理サーバ50は、ボトルネックの発生原因となっている現在のデバイスファイル13の代わりに、使用可能な別のデバイスファイル13を全て抽出する。例えば、どのアプリケーションプログラム11からも使用されていないデバイスファイル13等が検出される。
管理サーバ50は、リストアップされた移動先候補ホストのうち、リストの先頭に位置する第1の移動先候補ホストを選択する(S72)。管理サーバ50は、経路情報T6を参照することにより、移動先候補ホストと目標LDEV23とを結ぶ新たな経路を検索する(S73)。目標LDEV23とは、ボトルネック原因のI/Oを発生させている現在のデバイスファイル13(大元のデバイスファイル13)が現在利用しているLDEV23を示す。
管理サーバ50は、シミュレーション用のテーブルを用意する(S74)。ここで、図9に示すように、「ホスト変更」対策の影響は、デバイスファイル13,スイッチポート31,ストレージポート21,パリティグループ22及びLDEV23に及ぶ。従って、管理サーバ50は、ホスト性能情報T1,スイッチ性能情報T2,ストレージポート性能情報T3,パリティグループ性能情報T4,LDEV性能情報T5のそれぞれについてコピーを生成し、シミュレーションの準備を整える。
以下、前記同様に、シミュレーション用の各テーブル上でI/O量を加減算することにより、シミュレーションを実行する。まず、管理サーバ50は、現在の経路上に位置する各要素から、移動予定のI/O量(大元のデバイスファイル13が発生させている単位時間当たりのI/O量)をそれぞれ減算する(S75)。次に、管理サーバ50は、S73で検索された新経路上に位置する各要素について、移動予定のI/O量をそれぞれ加算する(S76)。
そして、管理サーバ50は、現在発生しているボトルネックが解消するか否かを判定する(S77)。現在のボトルネックが解消すると判断した場合(S77:YES)、管理サーバ50は、新経路上に位置する各要素に、新たなボトルネックが発生するか否かを判定する(S78)。新経路上の各要素に新たなボトルネックが発生しないと判定した場合(S78:NO)、管理サーバ50は、この移動先候補ホストを適切なホストとして選択する(S79)。
これに対し、ホスト(デバイスファイル13)を変更しても現在のボトルネックが解消されない場合(S77:NO)は、別の移動先候補ホストについてシミュレーションを行う必要がある。また、ホストを変更すると、別の新たなボトルネックを生じる場合(S78:YES)も、別の移動先候補ホストについてシミュレーションを行う必要がある。
そこで、管理サーバ50は、全ての移動先候補ホストについてシミュレート済みであるか否かを判定する(S80)。未検討の移動先候補ホストが存在する場合(S80:NO)、管理サーバ50は、シミュレーション対象のホストを切り替えて(S81)、S73に戻り、上述の処理を繰り返す。全ての移動先候補ホストについてシミュレートした結果、適切なホストが検出されなかった場合(S80:YES)、管理サーバ50は、図13に示す処理に戻る。
図16は、「パリティグループ変更」対策のシミュレーション処理を示すフローチャートである。図中では、パリティグループを「PG」と略記する。本実施例では、「パリティグループ変更」の優先度を最も低く設定している。従って、「LDEV変更」対策や「ホスト変更」対策によってボトルネック解消法が発見されなかった場合に、「パリティグループ変更」対策の有効性が検討される。
「パリティグループ変更」対策のシミュレーション処理は、図14に示す「LDEV変更」対策のシミュレーション処理と基本構造は同一である。相違点は、シミュレーション対象が「LDEV23」から「パリティグループ22」に変更されている点にある。
まず、管理サーバ50は、移動先候補のパリティグループ22を全て検出し(S91)、第1の移動先候補パリティグループ22を選択する(S92)。管理サーバ50は、ボトルネック発生原因となったI/Oを発生させている大元のデバイスファイル13と移動先候補パリティグループ22との間の新経路を検出する(S93)。
管理サーバ50は、情報T2〜T5をそれぞれコピーすることにより、シミュレーション用のテーブルを作成する(S94)。管理サーバ50は、前記各処理と同様に、現在の経路上に位置する各要素の最新のI/O量から、移動予定のI/O量をそれぞれ減算する(S95)。そして、管理サーバ50は、新経路上に位置する各要素の最新のI/O量に、移動予定のI/O量をそれぞれ加算する(S96)。
大元のデバイスファイル13に関連するI/O量を移動させた後、管理サーバ50は、現在発生しているボトルネックが解消されたか否かを判定する(S97)。続いて、管理サーバ50は、新経路上の各要素に新たなボトルネックが発生したか否かを判定する(S98)。
現在のボトルネックが解消され(S97:YES)、かつ、新たなボトルネックが発生しない場合(S98:NO)、管理サーバ50は、この移動先候補パリティグループ22を、移動先として適切なパリティグループ22であると判断し、選択する(S99)。
現在のボトルネックが解消されない場合(S97:NO)または新たなボトルネックが発生する場合(S98:YES)のいずれかの場合、管理サーバ50は、未検討の移動先候補パリティグループ22を全て検討するまで、S93〜S98の処理を繰り返す(S100,S101)。
図17は、シミュレーション用テーブルを用いたシミュレーション方法の一部を示す説明図である。図17では、「LDEV変更」対策のシミュレーション処理を例に挙げて説明する。図7も適宜参照しながら説明する。
図17(a)は、大元のデバイスファイル13に関連するI/O量を減算した様子を示している。ここでは、デバイスファイル(/dev/dsk/xxx)がボトルネック要因のI/Oを発生させているものとする。図7に示すように、この大元のデバイスファイル(/dev/dsk/xxx)は、時刻10:10において、LDEV(0:10)に対し、1秒間あたり6000バイトのI/Oを発生させている。
図17(a)に示すように、LDEV(0:10)の変更を検討するに際し、管理サーバ50は、大元のデバイスファイルが発生させているI/O量(6000バイト/秒)を、移動元LDEV(0:10)から減算する。従って、移動元LDEV(0:10)のI/O量は、「0」となる。
移動先候補LDEVをLDEV(0:20)とする。図17(b)に示すように、管理サーバ50は、移動予定のI/O量(6000バイト/秒)を、移動先候補LDEV(0:20)の最新のI/O量(1000バイト/秒)に加算する。従って、移動先候補LDEV(0:20)の予想I/O量は、7000バイト/秒となる。この予想I/O量が、移動先候補LDEV(0:20)に設定されている閾値を超えない場合は、LDEV(0:10)からLDEV(0:20)への変更が許容される。予想I/O量がLDEV(0:20)の閾値を超える場合は、このLDEV変更は許可されない。
本実施例は上述のように構成されるので、以下の効果を奏する。本実施例では、ストレージシステムを構成する各要素の性能状態を監視してボトルネックを検出し、このボトルネックを解消するための対策を発見できる構成とした。従って、ストレージシステム全体の状況を考慮して適切な対策を立案することができる。
本実施例では、情報処理経路上の両端に位置する各要素(デバイスファイル13,LDEV23,パリティグループ22)を他の要素に変更させることにより、ボトルネックを解消する構成とした。即ち、情報処理経路上の中間でボトルネックが発生した場合でも、経路の中間部分の構成を直接変更するのではなく、経路の両端の構成を変更することにより、ボトルネックを解消する構成とした。従って、比較的簡単な操作で、ボトルネックを解消可能である。
本実施例では、ストレージシステムの構成変更を行う前に、ボトルネック(ボトルネックの可能性)を検出し、このボトルネックを解消するための対策をシミュレートする構成とした。従って、ディスク増設やストレージ装置のリプレース等を実際に行う前に、このような構成変更がボトルネック解消に及ぼす効果を事前に評価可能である。即ち、新規増設予定のディスクやストレージ装置に関する新たな要素(デバイスファイル、LDEV、ストレージポート、スイッチポート、パリティグループ等)を、シミュレーション用の各テーブルに仮想的に登録することで、実際の増設やリプレース等を行わずに、性能改善効果を評価可能である。
なお、本発明は、上述した実施の形態に限定されない。当業者であれば、本発明の範囲内で、種々の追加や変更等を行うことができる。例えば、各実施例を適宜組み合わせることができる。
例えば、ストレージシステムを構成する個別の要素をそれぞれ監視するのではなく、各要素を種類別に分類してグループ化し、各グループ単位で監視する構成でもよい。即ち、サーバ内の各要素やストレージ装置内の各要素についてそれぞれ個別に監視するのではなく、例えば、サーバ全体の性能状態、スイッチ群(ファブリック)全体の性能状態、ストレージ装置全体の性能状態を、サマリーデータとしてそれぞれ検出することができる。例えば、サーバのサマリーデータ(サーバ全体の単位時間当たりのI/O量)は、各デバイスファイルのI/O量の総和として求めることができる。このように、グループ単位で管理することにより、ストレージシステム全体の状況をより大きな視点で速やかに把握することができる。
本発明の実施形態の概念を示す説明図である。 ストレージシステムの全体構成を示すブロック図である。 管理サーバの構成を示すブロック図である。 ストレージ装置の構成を示すブロック図である。 (a)はホスト性能情報の構成を、(b)はスイッチ性能情報の構成をそれぞれ示す説明図である。 (a)はストレージポート性能情報の構成を、(b)はパリティグループ性能情報の構成をそれぞれ示す説明図である。 LDEV性能情報の構成を示す説明図である。 経路情報の構成を示す説明図である。 対策情報の構成を示す説明図である。 (a)はホスト閾値情報の構成を、(b)はスイッチ閾値情報の構成を、(c)はストレージポート閾値情報の構成をそれぞれ示す説明図である。 (a)はパリティグループ閾値情報の構成を、(b)はLDEV閾値情報の構成をそれぞれ示す説明図である。 ボトルネック検出処理を示すフローチャートである。 解析処理を示すフローチャートである。 LDEV変更対策のシミュレーション処理を示すフローチャートである。 ホスト変更対策のシミュレーション処理を示すフローチャートである。 パリティグループ変更対策のシミュレーション処理を示すフローチャートである。 テーブル操作によってシミュレーションを行う様子を部分的に示す説明図である。
符号の説明
N1〜N10…要素、10…アプリケーションサーバ、11…アプリケーションプログラム、12…ファイルシステム、13…デバイスファイル、14…通信ポート、15…ホスト情報収集部、20…ストレージ装置、21…ストレージポート、22…パリティグループ、23…LDEV(論理ボリューム)、30…スイッチ、31…スイッチポート、40…監視サーバ、41…スイッチ情報収集部、42…ストレージ情報収集部、50…管理サーバ、51…ボトルネック検出部、52…検討部、52A…データ量算出部、52B…シミュレーション対象設定部、52C…シミュレーション部、53…対策提示部、54…性能情報データベース、60…クライアント端末、100…ディスクドライブ、110…チャネルアダプタ、120…ディスクアダプタ、130…キャッシュメモリ、140…共有メモリ、150…スイッチ部、160…サービスプロセッサ、CN…通信ネットワーク、T1…ホスト性能情報、T2…スイッチ性能情報、T3…ストレージポート性能情報、T4…パリティグループ性能情報、T5…LDEV性能情報、T6…経路情報、T7…対策情報、T8…閾値情報

Claims (8)

  1. 複数の論理ボリュームを有するストレージ装置と、このストレージ装置に接続され、前記各論理ボリュームにアクセスするためのアクセス処理部を有するホストコンピュータと、前記ストレージ装置及び前記ホストコンピュータにそれぞれ接続された管理用コンピュータと、を備えたストレージシステムにおいて、
    前記ホストコンピュータから前記ストレージ装置までの通信経路上に存在する各要素の性能に関する性能情報をそれぞれ収集する性能情報収集部と、
    前記収集された前記各要素の性能情報に基づいて、性能改善上の障害を有する障害要素を検出する障害要素検出部と、
    前記検出された障害要素の障害内容に基づいて対策を検討し、前記障害に有効な対策を選択する検討部と、
    を備え、
    前記検討部により検討される対策は、前記障害要素に関連する前記論理ボリューム及び前記アクセス処理部の少なくともいずれか一方を、他の論理ボリュームまたは他のアクセス処理部に変更させるものであるストレージシステム。
  2. 前記検討部により選択された対策をユーザに提示する提示部を備えた請求項1に記載のストレージシステム。
  3. 前記検討部は、予め用意された複数の対策の全部または一部について前記障害に対する有効性を評価することにより、前記障害に有効な対策を選択する請求項1に記載のストレージシステム。
  4. それぞれ異なる優先度を有する複数の対策を予め記憶する記憶部を設け、
    前記検討部は、前記複数の対策のうち優先度の高い対策から順番に、前記障害に対する有効性を評価し、前記障害に有効な対策を発見した場合は、この対策を選択する請求項1に記載のストレージシステム。
  5. それぞれ異なる優先度を有する複数の対策のそれぞれについて、その対策により影響を受ける要素の範囲を予め関連付けておき、
    前記検討部は、前記複数の対策のうち優先度の高い対策から順番に、その対策に予め関連付けられた前記要素の範囲内で前記障害に対する有効性を評価し、前記障害に有効な対策を発見した場合は、この対策を選択する請求項1に記載のストレージシステム。
  6. 前記通信経路上に存在する各要素には、前記論理ボリュームと、前記アクセス処理部と、前記ストレージ装置と前記ホストコンピュータとの間のデータを中継する中継装置とが含まれている請求項1に記載のストレージシステム。
  7. 複数の論理ボリュームを有するストレージ装置と、このストレージ装置に接続され、前記各論理ボリュームにアクセスするためのアクセス処理部を有するホストコンピュータと、前記ストレージ装置及び前記ホストコンピュータにそれぞれ接続された管理用コンピュータと、を備えたストレージシステムの障害を解消するための方法であって、
    前記ホストコンピュータから前記ストレージ装置までの通信経路上に存在する各要素の性能に関する性能情報をそれぞれ収集するステップと、
    前記収集された前記各要素の性能情報に基づいて、性能改善上の障害を有する障害要素を検出するステップと、
    前記検出された障害要素の障害内容に基づいて、前記障害要素に関連する前記論理ボリューム及び前記アクセス処理部の少なくともいずれか一方を他の論理ボリュームまたは他のアクセス処理部に変更させる対策を選択するステップと、
    前記選択された対策をユーザに提示するステップと、
    を含むストレージシステムの障害解消方法。
  8. データを格納する複数のデータ格納先要素と、これら各データ格納先要素に格納されるデータにアクセスする複数のデータ利用元要素と、前記各データ格納先要素と前記各データ利用元要素との間に設けられる少なくとも一つ以上の中継要素と、前記各データ利用元要素から前記中継要素を介して前記各データ格納先要素に至る経路とを含む情報処理システムであって、
    前記各要素の性能に関する情報をそれぞれ収集する性能情報収集部と、
    前記収集された性能に関する情報に基づいて、性能改善上の障害を有する障害要素を検出する障害要素検出部と、
    前記検出された障害要素の障害内容を検討し、前記各データ利用元要素及び前記各データ格納先要素のうち前記障害要素に関連するデータ利用元要素またはデータ格納先要素の少なくともいずれか一方を他のデータ利用元要素または他のデータ格納先要素に変更させる対策を少なくとも一つ以上シミュレートすることにより、前記障害に有効な対策を選択する検討部と、
    前記選択された対策を提示する提示部と、
    を備えた情報処理システム。
JP2004125622A 2004-04-21 2004-04-21 ストレージシステム及びストレージシステムの障害解消方法 Expired - Fee Related JP4514501B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004125622A JP4514501B2 (ja) 2004-04-21 2004-04-21 ストレージシステム及びストレージシステムの障害解消方法
US10/912,410 US7702962B2 (en) 2004-04-21 2004-08-04 Storage system and a method for dissolving fault of a storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004125622A JP4514501B2 (ja) 2004-04-21 2004-04-21 ストレージシステム及びストレージシステムの障害解消方法

Publications (2)

Publication Number Publication Date
JP2005309748A true JP2005309748A (ja) 2005-11-04
JP4514501B2 JP4514501B2 (ja) 2010-07-28

Family

ID=35376617

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004125622A Expired - Fee Related JP4514501B2 (ja) 2004-04-21 2004-04-21 ストレージシステム及びストレージシステムの障害解消方法

Country Status (2)

Country Link
US (1) US7702962B2 (ja)
JP (1) JP4514501B2 (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007164476A (ja) * 2005-12-14 2007-06-28 Hitachi Ltd ストレージ装置及びその制御方法並びにプログラム
JP2007233783A (ja) * 2006-03-02 2007-09-13 Hitachi Ltd ストレージ管理方法およびストレージ管理サーバ
JP2007234006A (ja) * 2006-02-27 2007-09-13 Internatl Business Mach Corp <Ibm> パフォーマンスの監視を動的に調整する装置、システム及び方法
JP2009015826A (ja) * 2007-05-29 2009-01-22 Hewlett-Packard Development Co Lp San再構成の期間中のデバイスクリティカリティを求める方法及びシステム
WO2009028185A1 (ja) * 2007-08-28 2009-03-05 Panasonic Corporation ネットワーク制御装置、方法、及びプログラム
JP2009528585A (ja) * 2006-02-27 2009-08-06 インターナショナル・ビジネス・マシーンズ・コーポレーション パフォーマンス監視のためにストレージ・エリア・ネットワーク・コンポーネントを動的に判断するための装置、システム及び方法
JP2009276969A (ja) * 2008-05-14 2009-11-26 Hitachi Ltd ストレージシステム及び管理装置を用いたストレージシステムの管理方法
JP2009294810A (ja) * 2008-06-04 2009-12-17 Hitachi Ltd ストレージシステムおよびその管理方法
JP2010515121A (ja) * 2006-12-21 2010-05-06 アコリ ネットワークス,インコーポレイテッド アプリケーションシステムのストレージリソースを識別する方法およびシステム
US7730259B2 (en) 2006-12-28 2010-06-01 Hitachi, Ltd. Method, computer and system for managing a storage subsystem configuration
JP2010166702A (ja) * 2009-01-15 2010-07-29 Toshiba Corp 電源設備の電力供給リスク評価システム
WO2010119479A1 (en) 2009-04-14 2010-10-21 Hitachi, Ltd. Storage system and control method thereof as well as program
JP2011053934A (ja) * 2009-09-02 2011-03-17 Nec Corp ストレージシステム及びストレージシステムの評価方法
JP2015184707A (ja) * 2014-03-20 2015-10-22 日本電気株式会社 情報処理システム、情報処理装置、情報処理方法、及び、プログラム

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7752488B2 (en) * 2006-01-06 2010-07-06 International Business Machines Corporation Method to adjust error thresholds in a data storage and retrieval system
JP4841982B2 (ja) * 2006-03-20 2011-12-21 富士通株式会社 性能情報収集方法、装置、及びプログラム
JP5123641B2 (ja) * 2007-10-31 2013-01-23 株式会社日立製作所 性能履歴の管理方法および性能履歴の管理システム
US8225291B2 (en) * 2008-01-04 2012-07-17 International Business Machines Corporation Automated detection of application performance bottlenecks
US8756310B2 (en) * 2011-03-09 2014-06-17 International Business Machines Corporation Comprehensive bottleneck detection in a multi-tier enterprise storage system
US8819226B2 (en) * 2011-10-26 2014-08-26 International Business Machines Corporation Server cluster monitoring
US9077752B2 (en) 2011-12-23 2015-07-07 Cirrus Data Solutions, Inc. Systems, apparatus, and methods for identifying stored data that may be accessed by a host entity and providing data management services
US8255538B1 (en) * 2011-12-23 2012-08-28 Cirrus Data Solutions, Inc. Systems and methods for intercepting data relating to storage volume access
US9495113B2 (en) 2011-12-23 2016-11-15 Cirrus Data Solutions, Inc. Systems, devices, apparatus, and methods for identifying stored data by a device located in a path between virtual Fibre channel switches and performing a data management service
US9262351B2 (en) 2014-03-27 2016-02-16 International Business Machines Corporation Inter-adapter cooperation for multipath input/output systems
US20170222908A1 (en) * 2016-01-29 2017-08-03 Hewlett Packard Enterprise Development Lp Determining candidates for root-cause of bottlenecks in a storage network
US20230137940A1 (en) * 2021-10-29 2023-05-04 Sanmina Corporation Dis-aggregated switching and protocol configurable input/output module

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08309814A (ja) * 1995-05-18 1996-11-26 Mitsubishi Heavy Ind Ltd 射出成形装置
JP2002373103A (ja) * 2001-06-14 2002-12-26 Hitachi Ltd 計算機システム
JP2003152721A (ja) * 2001-11-13 2003-05-23 Hitachi Ltd ネットワークシステム障害分析支援方法およびその方式
JP2003256367A (ja) * 2002-03-06 2003-09-12 Seiko Epson Corp 電子機器のエラーに関する情報提供システムおよび電気機器のエラー実績を管理するサーバ
JP2003296039A (ja) * 2002-04-02 2003-10-17 Hitachi Ltd クラスタ構成記憶システム及び制御方法
JP2003296154A (ja) * 2002-04-05 2003-10-17 Hitachi Ltd ボリューム統合管理方法および統合管理システム
JP2003316522A (ja) * 2002-04-26 2003-11-07 Hitachi Ltd 計算機システムおよび計算機システムの制御方法
JP2004013215A (ja) * 2002-06-03 2004-01-15 Hitachi Ltd ストレージシステム、ストレージサブシステム、および、それらを含む情報処理システム

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0265574B1 (en) * 1986-10-30 1992-04-29 International Business Machines Corporation Daisy chain bus access configuration
US5960181A (en) * 1995-12-22 1999-09-28 Ncr Corporation Computer performance modeling system and method
JPH10320126A (ja) 1997-03-14 1998-12-04 Fujitsu Ltd ボリューム割当てシステムおよびボリューム割当てプログラムを記録した媒体
JP3726484B2 (ja) * 1998-04-10 2005-12-14 株式会社日立製作所 記憶サブシステム
US6658504B1 (en) * 2000-05-16 2003-12-02 Eurologic Systems Storage apparatus
JP2001337790A (ja) * 2000-05-24 2001-12-07 Hitachi Ltd 記憶システム及びその階層管理制御方法
US6697367B1 (en) * 2000-06-12 2004-02-24 Emc Corporation Multihop system calls
DE10196341T1 (de) 2000-06-12 2003-04-30 Emc Corp Hopkinton Querverweis auf verwandte Anmeldungen
US6625747B1 (en) * 2000-06-30 2003-09-23 Dell Products L.P. Computer storage system and failover method
US6546531B1 (en) * 2000-10-06 2003-04-08 Sun Microsystems, Inc. Automatic delay element insertion system for addressing holdtime problems
US6854052B2 (en) * 2001-04-18 2005-02-08 International Business Machines Corporation Method to validate system configuration
US6874100B2 (en) * 2001-07-12 2005-03-29 Digi-Data Corporation Raid system with multiple controllers and proof against any single point of failure
FR2832276B1 (fr) * 2001-11-12 2005-02-25 Inst Nat Rech Inf Automat Dispositif et procede d'analyse reseau a prediction autonome
JP2003216348A (ja) * 2001-11-14 2003-07-31 Hitachi Ltd 記憶装置の管理方法および管理装置
US7111084B2 (en) * 2001-12-28 2006-09-19 Hewlett-Packard Development Company, L.P. Data storage network with host transparent failover controlled by host bus adapter
US7139676B2 (en) * 2002-01-18 2006-11-21 Agilent Technologies, Inc Revising a test suite using diagnostic efficacy evaluation
US7082390B2 (en) * 2002-04-30 2006-07-25 Lsi Logic Corporation Advanced storage controller
US6912635B2 (en) * 2002-05-08 2005-06-28 Hewlett-Packard Development Company, L.P. Distributing workload evenly across storage media in a storage array
US7194445B2 (en) * 2002-09-20 2007-03-20 Lenovo (Singapore) Pte. Ltd. Adaptive problem determination and recovery in a computer system
US7356452B1 (en) * 2002-09-27 2008-04-08 Emc Corporation System and method for simulating performance of one or more data storage systems
US7149919B2 (en) * 2003-05-15 2006-12-12 Hewlett-Packard Development Company, L.P. Disaster recovery system with cascaded resynchronization
US6968401B2 (en) * 2003-06-26 2005-11-22 International Business Machines Corporation Method, system, and program for maintaining and swapping paths in an MPIO environment

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08309814A (ja) * 1995-05-18 1996-11-26 Mitsubishi Heavy Ind Ltd 射出成形装置
JP2002373103A (ja) * 2001-06-14 2002-12-26 Hitachi Ltd 計算機システム
JP2003152721A (ja) * 2001-11-13 2003-05-23 Hitachi Ltd ネットワークシステム障害分析支援方法およびその方式
JP2003256367A (ja) * 2002-03-06 2003-09-12 Seiko Epson Corp 電子機器のエラーに関する情報提供システムおよび電気機器のエラー実績を管理するサーバ
JP2003296039A (ja) * 2002-04-02 2003-10-17 Hitachi Ltd クラスタ構成記憶システム及び制御方法
JP2003296154A (ja) * 2002-04-05 2003-10-17 Hitachi Ltd ボリューム統合管理方法および統合管理システム
JP2003316522A (ja) * 2002-04-26 2003-11-07 Hitachi Ltd 計算機システムおよび計算機システムの制御方法
JP2004013215A (ja) * 2002-06-03 2004-01-15 Hitachi Ltd ストレージシステム、ストレージサブシステム、および、それらを含む情報処理システム

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4671353B2 (ja) * 2005-12-14 2011-04-13 株式会社日立製作所 ストレージ装置及びその制御方法
JP2007164476A (ja) * 2005-12-14 2007-06-28 Hitachi Ltd ストレージ装置及びその制御方法並びにプログラム
JP2007234006A (ja) * 2006-02-27 2007-09-13 Internatl Business Mach Corp <Ibm> パフォーマンスの監視を動的に調整する装置、システム及び方法
JP2009528585A (ja) * 2006-02-27 2009-08-06 インターナショナル・ビジネス・マシーンズ・コーポレーション パフォーマンス監視のためにストレージ・エリア・ネットワーク・コンポーネントを動的に判断するための装置、システム及び方法
JP2007233783A (ja) * 2006-03-02 2007-09-13 Hitachi Ltd ストレージ管理方法およびストレージ管理サーバ
US8200817B2 (en) 2006-03-02 2012-06-12 Hitachi, Ltd. Storage management method and server
US8041813B2 (en) 2006-03-02 2011-10-18 Hitachi, Ltd. Storage management method and server
JP2010515121A (ja) * 2006-12-21 2010-05-06 アコリ ネットワークス,インコーポレイテッド アプリケーションシステムのストレージリソースを識別する方法およびシステム
US7730259B2 (en) 2006-12-28 2010-06-01 Hitachi, Ltd. Method, computer and system for managing a storage subsystem configuration
JP2009015826A (ja) * 2007-05-29 2009-01-22 Hewlett-Packard Development Co Lp San再構成の期間中のデバイスクリティカリティを求める方法及びシステム
JP4740979B2 (ja) * 2007-05-29 2011-08-03 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. San再構成の期間中のデバイスクリティカリティを求める方法及びシステム
WO2009028185A1 (ja) * 2007-08-28 2009-03-05 Panasonic Corporation ネットワーク制御装置、方法、及びプログラム
US7720000B2 (en) 2007-08-28 2010-05-18 Panasonic Corporation Network control apparatus, method, and program
JP2009276969A (ja) * 2008-05-14 2009-11-26 Hitachi Ltd ストレージシステム及び管理装置を用いたストレージシステムの管理方法
JP4701267B2 (ja) * 2008-06-04 2011-06-15 株式会社日立製作所 ストレージシステムおよびその管理方法
JP2009294810A (ja) * 2008-06-04 2009-12-17 Hitachi Ltd ストレージシステムおよびその管理方法
US8683025B2 (en) 2008-06-04 2014-03-25 Hitachi, Ltd. Method for managing storage system
JP2010166702A (ja) * 2009-01-15 2010-07-29 Toshiba Corp 電源設備の電力供給リスク評価システム
WO2010119479A1 (en) 2009-04-14 2010-10-21 Hitachi, Ltd. Storage system and control method thereof as well as program
US8347031B2 (en) 2009-04-14 2013-01-01 Hitachi, Ltd. Storage system and control method for managing the input and output of data in a network to avoid congestion
US8694725B2 (en) 2009-04-14 2014-04-08 Hitachi, Ltd. Storage system and control method thereof as well as program
JP2011053934A (ja) * 2009-09-02 2011-03-17 Nec Corp ストレージシステム及びストレージシステムの評価方法
JP2015184707A (ja) * 2014-03-20 2015-10-22 日本電気株式会社 情報処理システム、情報処理装置、情報処理方法、及び、プログラム

Also Published As

Publication number Publication date
JP4514501B2 (ja) 2010-07-28
US7702962B2 (en) 2010-04-20
US20050262386A1 (en) 2005-11-24

Similar Documents

Publication Publication Date Title
JP4514501B2 (ja) ストレージシステム及びストレージシステムの障害解消方法
US8694749B2 (en) Control method of device in storage system for virtualization
US7694073B2 (en) Computer system and a method of replication
US7467241B2 (en) Storage control method and storage control system
JP4462969B2 (ja) フェイルオーバクラスタシステム及びフェイルオーバ方法
US7469289B2 (en) Storage system having virtualized resource
US7921325B2 (en) Node management device and method
JP4786248B2 (ja) ストレージシステムの構成管理装置及び構成管理方法
JP4790372B2 (ja) ストレージのアクセス負荷を分散する計算機システム及びその制御方法
WO2017162179A1 (zh) 用于存储系统的负载再均衡方法及装置
US7953927B2 (en) Allocating clusters to storage partitions in a storage system
US20070043919A1 (en) Information processing method and system
JP4609848B2 (ja) 負荷分散コンピュータシステム、経路設定プログラム及びその方法
US20090271541A1 (en) Information processing system and access method
JP2005326935A (ja) 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法
JP2003208267A (ja) クラスタ型ディスク制御装置および負荷分散方法
JP2007156815A (ja) データマイグレーション方法及びシステム
JP2008299387A (ja) コンピュータシステムに存在するリソースの性能を監視する装置及び方法
US7886186B2 (en) Storage system and management method for the same
JP2005165852A (ja) ストレージシステム、ストレージ制御装置、ストレージシステムの制御方法
JP2005209055A (ja) ストレージの負荷分散方法
JP2022124054A (ja) ストレージシステム、ストレージ装置及びストレージ装置管理方法

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20070215

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100511

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100511

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees