JP4357433B2 - ストレージシステム - Google Patents

ストレージシステム Download PDF

Info

Publication number
JP4357433B2
JP4357433B2 JP2005037845A JP2005037845A JP4357433B2 JP 4357433 B2 JP4357433 B2 JP 4357433B2 JP 2005037845 A JP2005037845 A JP 2005037845A JP 2005037845 A JP2005037845 A JP 2005037845A JP 4357433 B2 JP4357433 B2 JP 4357433B2
Authority
JP
Japan
Prior art keywords
failure
storage
host computer
management unit
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005037845A
Other languages
English (en)
Other versions
JP2006227718A (ja
Inventor
信一 加藤
英弘 長屋
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to JP2005037845A priority Critical patent/JP4357433B2/ja
Publication of JP2006227718A publication Critical patent/JP2006227718A/ja
Application granted granted Critical
Publication of JP4357433B2 publication Critical patent/JP4357433B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0781Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Description

本発明は、ホスト計算機とストレージ装置が接続されたストレージシステムに関し、特に、ストレージ装置側の障害によるホスト計算機側の障害処理に適用して有効な技術に関するものである。

従来、ホスト計算機やストレージ装置などの複数の装置からなるストレージシステムにおいて、ストレージ装置側で障害が発生したときに、ホスト計算機ではドライバによるソフトウェア検出の障害が発生し、ホスト計算機とストレージ装置の複数の装置で障害が検出されていた。

また、ストレージ装置側での障害の情報を、ストレージ装置内のWEBサーバなどの機能により、ホスト計算機側で確認するシステムがあった(例えば、特許文献1参照)。

また、ホスト計算機からファイルサーバを介してストレージ装置にアクセスする場合に、ファイルサーバの障害をストレージ装置側から保守センタに通報するシステムがあった(例えば、特許文献2参照)。
特開2004−234555号公報 特開2003−99291号公報

しかしながら、従来のホスト計算機やストレージ装置などの複数の装置からなるストレージシステムでは、ストレージ装置の障害であってもホスト計算機のソフトウェア検出の障害が発生するため以下の問題がある。

(1)ホスト計算機で検出可能なのはドライバによるコマンドタイムアウトなどのソフトウェアによる検出のため、ストレージ装置のデバイス内部での障害であっても不良指摘部品はデバイスにつながるケーブルや接続部品を指摘するしかなく、2次、3次的な障害かの区別はできない。

(2)保守センタなどには、ホスト計算機やストレージ装置などの複数の装置の障害情報が送られるため、保守センタ員が複数装置の情報からどの装置の部品を交換すべきかを判断しなければならないので、交換指示するまでに時間がかかる。

(3)現地保守員はホスト計算機やストレージ装置などの複数の装置のサービスプロセッサなどの管理端末に表示される障害情報を常に確認しなければならないので、障害部品の交換に要する時間がかかり、また、顧客への障害状況の連絡を短時間で行なえない。

また、特許文献1、2記載のシステムも、現地保守員や保守センタのセンタ員は複数の装置で発生した障害内容から原因を特定して交換すべき部品を決めなければならないため、保守が大変になるという問題がある。

そこで、本発明の目的は、障害情報を一元管理し、ホスト計算機内部で発生した障害が、2次、3次的な障害であるかが判断でき、保守交換に最低限必要な部品指摘情報を示すことができるストレージシステムを提供することにある。

本発明によるストレージシステムは、ホスト計算機とホスト計算機に記憶領域を提供するストレージ装置を備えたストレージシステムであって、ホスト計算機は、ホスト計算機の障害を管理する障害管理部と、ホスト計算機の保守・管理およびホスト計算機の障害管理部による障害管理を行うサービスプロセッサと、ホスト計算機を制御しストレージ装置との通信を行う処理ノードを有し、ストレージ装置は、ストレージ装置の障害を管理する障害管理部と、ストレージ装置の保守・管理およびストレージ装置の障害管理部による障害管理を行うサービスプロセッサを有し、ホスト計算機の障害管理部とストレージ装置の障害管理部とを障害報告用のインターフェースを用いて接続し、ストレージ装置に障害が発生した際、障害報告用のインターフェースを介してストレージ装置の障害管理部からホスト計算機の障害管理部へ障害情報を報告し、ホスト計算機の障害管理部は、ストレージ装置からの障害情報に基づいて、ホスト計算機内で発生したソフトウェア検出の障害情報を削除し、ホスト計算機のサービスプロセッサによりストレージシステム内の障害情報を一元管理するものである。

また、本発明によるストレージシステムは、ホスト計算機とホスト計算機に記憶領域を提供するストレージ装置を備えたストレージシステムであって、ホスト計算機は、ホスト計算機の障害を管理する障害管理部と、ホスト計算機の保守・管理およびホスト計算機の障害管理部による障害管理を行うサービスプロセッサと、ホスト計算機を制御しストレージ装置との通信を行う処理ノードを有し、ストレージ装置は、ストレージ装置の障害を管理する障害管理部と、ストレージ装置の保守・管理およびストレージ装置の障害管理部による障害管理を行うサービスプロセッサを有し、ホスト計算機の処理ノードとストレージ装置の障害管理部とを障害報告用のインターフェースを用いて接続し、ストレージ装置に障害が発生した際、障害情報を障害報告用のインターフェースを介してストレージ装置の障害管理部からホスト計算機の処理ノードへ報告し、ホスト計算機の障害管理部は、処理ノードに報告されたストレージ装置からの障害情報に基づいて、ホスト計算機内で発生したソフトウェア検出の障害情報を削除し、ホスト計算機のサービスプロセッサによりストレージシステム内の障害情報を一元管理するものである。

また、本発明によるストレージシステムは、ホスト計算機とホスト計算機に接続されるファイルサーバとファイルサーバに記憶領域を提供するストレージ装置とを備えたストレージシステムであって、ホスト計算機は、ホスト計算機の障害を管理する障害管理部と、ホスト計算機の保守・管理およびホスト計算機の障害管理部による障害管理を行うサービスプロセッサと、ホスト計算機を制御しストレージ装置との通信を行う処理ノードを有し、ファイルサーバは、ファイルサーバの障害を管理する障害管理部と、ファイルサーバの保守・管理およびファイルサーバの障害管理部による障害管理を行うサービスプロセッサと、ファイルサーバを制御しストレージ装置との通信を行う処理ノードを有し、ストレージ装置は、ストレージ装置の障害を管理する障害管理部と、ストレージ装置の保守・管理およびストレージ装置の障害管理部による障害管理を行うサービスプロセッサを有し、ホスト計算機の障害管理部とファイルサーバの障害管理部とストレージ装置の障害管理部とを障害報告用のインターフェースを用いて接続し、ストレージ装置に障害が発生した際、障害情報を障害報告用のインターフェースを介してストレージ装置の障害管理部からファイルサーバの障害管理部へ報告し、その障害情報を障害報告用のインターフェースを介してファイルサーバの障害管理部からホスト計算機の障害管理部へ報告し、ホスト計算機の障害管理部は、ファイルサーバからの障害情報に基づいて、ホスト計算機内で発生したソフトウェア検出の障害情報を削除し、ホスト計算機のサービスプロセッサによりストレージシステム内の障害情報を一元管理するものである。

本発明によれば、ストレージ装置内部の障害情報をホスト計算機のサービスプロセッサで一元管理されるので、保守員や保守センタのセンタ員は複数の装置の障害情報を確認する必要が無くなるので、保守運用にかかる時間を短縮することができる。

また、不要な不良指摘部品情報を無くすことが可能なので、必要最低限の部品交換で済ますことができる。

以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの
説明は省略する。

(実施の形態1)
<ストレージシステムの構成>
図1により、本発明の実施の形態1に係るストレージシステムの構成について説明する。図1は本発明の実施の形態1に係るストレージシステムの構成を示す構成図である。

図1において、ストレージシステム1は、複数のストレージ装置10とホスト計算機300から構成され、ストレージ装置10は、ディスク制御装置100とディスク装置200から構成されている。

ディスク制御装置100は、チャネルアダプタ101、ディスクアダプタ102、キャッシュメモリ103、共有メモリ104から構成され、ディスク制御装置100にはサービスプロセッサ400が接続されている。

チャネルアダプタ101は、ホスト計算機(上位装置)300との間で通信を行うための通信インターフェースであるホストインターフェースを備え、ホスト計算機300との間でデータ入出力コマンド等を授受する。

ディスクアダプタ102は、データを記憶する複数の物理記憶デバイス201と通信可能に接続され、ディスク装置200の制御を行う。

キャッシュメモリ103は、ホスト計算機300とディスク装置200との間で送受信されるデータを一時的に格納する。

共有メモリ104は、チャネルアダプタ101およびディスクアダプタ102によって通信される制御情報などを格納する。

サービスプロセッサ400は、ストレージ装置10を保守・管理するために用いられるコンピュータである。サービスプロセッサ400を操作することにより、例えば、障害情報などを確認することができる。

ディスク装置200は、複数の物理記憶デバイス201を備えている。これによりホスト計算機300に対して大容量の記憶領域を提供することができる。また、ディスク装置200は、例えば、複数の物理記憶デバイス201によりRAID(Redundant Arrays of Inexpensive Disks)を構成している。

ホスト計算機300には、サービスプロセッサ310が備えられている。

サービスプロセッサ310は、ホスト計算機300を保守・管理するために用いられるコンピュータである。サービスプロセッサ310を操作することにより、例えば、障害情報などを確認することができる。

また、ストレージ装置10のサービスプロセッサ400とホスト計算機300のサービスプロセッサ310は、障害報告用のインターフェース410により接続されている。このインターフェース410は特別な仕様に限定しておらず、例えばLAN(Local Area Network)などの汎用のインターフェースで構わない。

ストレージ装置10で検出した障害情報については、このインターフェース410を通じてホスト計算機300側に伝えて、ホスト計算機300で障害情報を集約して、保守交換に最低限必要な交換指示情報を示すことができるようになっている。

<ストレージシステムの障害検出処理手順>
次に、図2により本発明の実施の形態1に係るストレージシステムの障害検出処理手順について説明する。図2は本発明の実施の形態1に係るストレージシステムの障害検出処理手順を説明するための説明図である。

図2において、ストレージ装置10のサービスプロセッサ400内には、ストレージ装置10の障害を管理する障害管理部401が備えられ、ホスト計算機300のサービスプロセッサ310内には、ホスト計算機300の障害を管理する障害管理部311が備えられている。

また、ストレージ装置10は、説明のため、サービスプロセッサ400、チャネルアダプタ101内におけるホスト計算機300との接続部となるホストインターフェース110、チャネルアダプタ101内のホストインターフェース110以外のストレージ装置10内の全ての構成を含めた内部120の構成で示している。

また、ホスト計算機300は、ホスト計算機300内の処理を行う処理ノード320が備えられており、処理ノード320は、プロセッサ321、メモリコントローラ322、メモリ323、I/Oインターフェース324から構成されている。

プロセッサ321により、メモリコントローラ322、メモリ323、I/Oインターフェース324が制御され、ストレージ装置10との間のデータの制御や障害時の処理が行われている。

まず、S101でホスト計算機300のプロセッサi321からI/Oインターフェースd324を介してストレージa10に対してコマンドを発行する。

S102でストレージ装置a10の内部120に障害が発生し、コマンドを処理できない回復不可能な内部エラーを検出する。このため、ホスト計算機300からのコマンドは処理できず、ホスト計算機300へのコマンドに対する返答は行われない状態となる。

S102での障害の発生の後、S103でストレージ装置a10の内部120で検出したエラーをサービスプロセッサ400内の障害管理部g401へ報告する。

S104で障害管理部g401は障害情報の報告を受け、障害情報から不良指摘部品を解析して、サービスプロセッサ400上の障害指摘一覧に表示する。

S105で障害管理部g401は新たに設けた障害報告用のインターフェース410を通じて、ホスト計算機300のサービスプロセッサ310内の障害管理部h311へ障害情報を通知する。通知内容は、例えば、障害発生時刻、障害発生内容、指摘部品、分類の4つの情報である。

S106で障害管理部h311は障害情報の報告を受け、障害情報にある不良指摘部品情報の内部エラーをサービスプロセッサ310上の障害指摘一覧に追加する。

一方、ホスト計算機300内のプロセッサi321はストレージ装置a10に対してコマンドを発行していたが、S103〜S106の動作の有無に関係なく、プロセッサi321内のS107で一定時間のタイムアウトを検出する。

S108でプロセッサi321はストレージ装置a10へのアクセスでコマンドタイムアウトが発生したことをサービスプロセッサ310内の障害管理部h311へ報告する。

S109で障害管理部h311はプロセッサi321からの障害情報の報告を受け、障害情報から不良指摘部品を解析して、サービスプロセッサ310上の障害指摘一覧に表示する。

S110で障害管理部h311はS109で登録した障害の対象となるストレージ装置a10にて内部障害が発生している情報があるかどうかを確認し、このケースでは存在しているので、登録した障害情報から指摘部品情報、この例ではI/Oインターフェース部品d324とI/Oケーブルeを削除する。

<ホスト計算機のサービスプロセッサ内にある障害管理部の処理>
次に、図3により、本発明の実施の形態1に係るストレージシステムのホスト計算機のサービスプロセッサ内にある障害管理部の処理について説明する。図3は本発明の実施の形態1に係るストレージシステムのホスト計算機のサービスプロセッサ内にある障害管理部の処理を示すフローチャートである。

ホスト計算機300のサービスプロセッサ310内にある障害管理部h311の動作としては、図3に示すように、まず、S201で障害情報が到着したか否かを判断する。

S201で障害情報が到着していないと判断されれば、障害情報が到着するまでS201を繰り返す。

S201で障害情報が到着したと判断されれば、S202で障害指摘一覧に指摘部品情報を登録する。

S203でI/O系障害か否かを判断し、S203でI/O系障害でないと判断されれば、到着した障害情報の処理を終了する。

S203でI/O系障害であると判断されれば、S204で障害検出箇所がホスト計算機300かI/Oデバイスかを判断する。

S204で障害検出箇所がI/Oデバイスであると判断されれば、S205で障害発生したストレージ装置10につながるソフトウェアエラー検出の障害が有るか否かを判断する。

S205で障害発生したストレージ装置につながるソフトウェアエラー検出の障害が有ると判断されれば、S206で該当のソフトウェアエラー検出の指摘部品情報を削除し、到着した障害情報の処理を終了する。

S205で障害発生したストレージ装置につながるソフトウェアエラー検出の障害が無いと判断されれば、到着した障害情報の処理を終了する。

また、S204で障害検出箇所がホスト計算機300であると判断されれば、S207でハード/ソフトウェアエラー検出のどちらを検出したかを判断する。

S207でハードウェアエラーであると判断されれば、到着した障害情報の処理を終了し、S207でソフトウェアエラーであると判断されれば、S208で障害発生したI/OにつながるI/Oデバイスの内部障害が有るか否かを判断する。

S208で障害発生したI/OにつながるI/Oデバイスの内部障害が無いと判断されれば、到着した障害情報の処理を終了し、S208で障害発生したI/OにつながるI/Oデバイスの内部障害が有ると判断されれば、S209でS202の処理で登録した指摘部品情報を削除して、到着した障害情報の処理を終了する。

以上の処理をホスト計算機300のサービスプロセッサ310内にある障害管理部311で行うことにより、ホスト計算機300内でのソフトウェアエラーを、ストレージ装置10からの障害情報に基づいて削除することができ、不要な不良指摘部品情報を無くし、保守交換に最低限必要な交換指示情報を示すことが可能となる。

次に、図3に示した障害管理部の処理について、ホスト計算機300とストレージ装置10からの障害検出の通知のタイミングによる具体例について説明する。

まず、ホスト計算機300でのコマンドタイムアウト報告よりも、早く通知したときのストレージ装置10の内部エラーの処理手順としては、以下の(1)〜(5)に示す処理手順となる。

(1)S201の障害到着待ち状態でストレージ装置10から障害通知が到着し、S202へ移る。

(2)S202で障害指摘一覧に障害情報を登録しS203へ移る。登録内容は障害発生時刻、障害発生内容、指摘部品(装置名を含む)、分類の4つの情報である。

(3)I/O系障害かどうかの判断は指摘部品情報にストレージ装置10であることが判別できるのでS204へ移る。

(4)障害検出箇所についても、指摘部品情報にストレージ装置10であることが判別できるのでS205へ移る。

(5)S205で障害情報一覧にソフトウェア検出でストレージ装置10へのコマンドタイムアウトなどのエラーがあるかどうかを確認する。このケースでは無いので処理終了しS201へ移る。

また、ストレージ装置10の内部エラー報告よりも、遅く通知したときのホスト計算機300でのコマンドタイムアウトの処理手順としては、以下の(6)〜(12)に示す処理手順となる。

(6)S201の障害到着待ち状態でストレージ装置10から障害通知が到着しS202へ移る。

(7)S202で障害指摘一覧に障害情報を登録しS203へ移る。登録内容は障害発生時刻、障害発生内容、指摘部品(装置名を含む)、分類の4つの情報である。

(8)I/O系障害かどうかの判断は指摘部品情報にホスト計算機300内のI/Oインターフェース324であることが判別できるのでS204へ移る。

(9)障害検出箇所についても、指摘部品情報にホスト計算機300であることが判別できるのでS207へ移る。

(10)ハードウェア検出かソフトウェア検出かの判別は分類情報にソフトウェア検出であることが判別できるのでS208へ移る。

(11)S208で障害情報一覧にコマンドタイムアウトを検出しているI/Oデバイスの内部障害があるかどうかを確認する。このケースでは内部障害があるのでS209へ移る。

(12)S209で障害情報一覧に登録した内容から部品指摘情報のみを削除する。例として、コマンドタイムアウトを検出したときに、対象となるI/OデバイスにつながるI/Oインターフェース部品xとI/Oインターフェースケーブルであるならば、その2点を削除して処理終了しS201へ移る。

また、ホスト計算機300でのコマンドタイムアウト報告よりも、遅く通知したときのストレージ装置10の内部エラーの処理手順としては、以下の(13)〜(17)に示す処理手順となる。

(13)S201の障害到着待ち状態でストレージ装置10から障害通知が到着しS202へ移る。

(14)S202で障害指摘一覧に障害情報を登録しS203へ。登録内容は障害発生時刻、障害発生内容、指摘部品(装置名を含む)、分類の4つの情報である。

(15)I/O系障害かどうかの判断は指摘部品情報にストレージ装置10であることが判別できるのでS204へ移る。

(16)障害検出箇所についても、指摘部品情報にストレージ装置10であることが判別できるのでS205へ移る。

(17)S205で障害情報一覧にソフトウェア検出でストレージ装置10へのコマンドタイムアウトなどのエラーがあるかどうかを確認する。このケースでは障害情報一覧を検索して、ストレージ装置10につながるI/Oインターフェース324の部品指摘が存在するので削除する。例として、コマンドタイムアウトを検出したときに、対象となるI/OデバイスにつながるI/Oインターフェース部品xとI/Oインターフェースケーブルであるならば、その2点を削除して処理終了しS201へ移る。

また、ストレージ装置10の内部エラー報告よりも、早く通知したときのホスト計算機300でのコマンドタイムアウトの処理手順としては、以下の(18)〜(23)に示す処理手順となる。

(18)S201の障害到着待ち状態でストレージ装置10から障害通知が到着しS202へ移る。

(19)S202で障害指摘一覧に障害情報を登録しS203へ。登録内容は障害発生時刻、障害発生内容、指摘部品(装置名を含む)、分類の4つの情報である。

(20)I/O系障害かどうかの判断は指摘部品情報にホスト計算機300内のI/Oインターフェースであることが判別できるのでS204へ移る。

(21)障害検出箇所についても、指摘部品情報にホスト計算機300であることが判別できるのでS207へ移る。

(22)ハードウェア検出かソフトウェア検出かの判別は分類情報にソフトウェア検出であることが判別できるのでS208へ移る。

(23)S208で障害情報一覧にコマンドタイムアウトを検出しているI/Oデバイスの内部障害があるかどうかを確認する。このケースでは無いので処理終了しS201へ移る。

<ストレージシステムのサービスプロセッサ間の接続情報>
次に、図4により本発明の実施の形態1に係るストレージシステムのサービスプロセッサ間の接続情報について説明する。図4は実施の形態1に係るストレージシステムのサービスプロセッサ間の接続情報を示す図であり、(a)はホスト計算機300のサービスプロセッサ310の登録例、(b)はストレージ装置a10のサービスプロセッサ400の登録例、(c)はストレージ装置b10のサービスプロセッサ400の登録例を示している。

本実施の形態では、ホスト計算機300のサービスプロセッサ310と1つ以上のストレージ装置10のサービスプロセッサ400との間に障害報告用のインターフェース410を設けているが、例えば、LANインターフェース上でのやりとりを行なうためには、図4に示すような、予め相手のIPアドレス等を含めた接続情報を登録しておいて、障害情報のやりとりを行なう必要がある。

図4に示す接続情報の登録例による接続の具体例としては、図4(a)に示すホスト計算機300のサービスプロセッサ310では、図2のS110で登録した障害の対象となるストレージ装置a10にて内部障害が発生している情報があるかどうかを確認するための手段として、本例では、障害発生したときの接続部位がI/Oインターフェースd324と判明しているので、図4(a)に示した登録情報より接続先装置名はストレージ装置aであるので、障害指摘一覧の指摘部位の装置名にストレージ装置aがあるかどうかを検索すればよい。

また、ホスト計算機300内で障害が発生したときに、他の装置への障害通知の必要があるかを判断しなければならず、その判断情報として接続先クラスを設けている。この接続先クラスは、自装置内の障害を通知する必要のある上位の装置が存在しているかどうかを示しており、図4(a)に示す例では「下位」のみしか無いので、障害通知する必要がない。

また、図4(b)および図4(c)に示すストレージ装置a10およびストレージ装置b10のサービスプロセッサ400では、図2のS105で、ホスト計算機300のサービスプロセッサ310内の障害管理部h311へ障害情報を通知しているが、通知先は接続先クラス情報を見て送り先を決める。

本例では、接続先クラスに上位のホスト計算機aがあるので、障害発生の度にIPアドレス情報を用いてホスト計算機に障害情報を通知する。

なお、例えば、上位の接続先クラスが複数存在する場合には、発生した障害内容が接続部位の動作に影響のある上位がどれかをストレージ装置10のサービスプロセッサ400内の障害管理部g401で判断して、影響のある上位の装置にのみ障害情報を通知し、接続部位の動作に影響があるかないかの判断ができないときは全ての上位の装置に障害情報を通知するようにしている。

以上のように本実施の形態では、ストレージ装置10内部の障害情報をホスト計算機300のサービスプロセッサ310で一元管理されるので、保守員や保守センタのセンタ員は複数の装置の障害情報を確認する必要が無くなるので、保守運用にかかる時間を短縮することが可能である。また、不要な不良指摘部品情報を無くすことが可能なので、必要最低限の部品交換で済ますことが可能である。

(実施の形態2)
実施の形態2は、実施の形態1において、ストレージ装置10のサービスプロセッサ400とホスト計算機300のサービスプロセッサ310との障害報告用のインターフェース410による接続を、ストレージ装置10のサービスプロセッサ400とホスト計算機300の処理ノード320のI/Oインターフェース324との障害報告用のインターフェース410による接続にし、ストレージ装置10の障害管理部401からの障害情報をホスト計算機300の処理ノード320内のメモリ323に書き込むようにしたものである。

実施の形態2のストレージシステム1の構成は、ストレージ装置10のサービスプロセッサ400とホスト計算機300の処理ノード320のI/Oインターフェース324を障害報告用のインターフェース410により接続する以外は、実施の形態1と同様の構成である。

<ストレージシステムの障害検出処理手順>
次に、図5により本発明の実施の形態2に係るストレージシステムの障害検出処理手順について説明する。図5は本発明の実施の形態2に係るストレージシステムの障害検出処理手順を説明するための説明図である。

図5において、ストレージ装置10のサービスプロセッサ400内の障害管理部401は、障害報告用のインターフェース410を介して、ホスト計算機300の処理ノード320内のI/Oインターフェース324に接続され、ストレージ装置10のサービスプロセッサ400内の障害管理部401とホスト計算機300の処理ノード320が通信可能な状態となっている。

まず、S301でホスト計算機300からストレージ装置a10に対してコマンドを発行する。

S302でストレージ装置a10の内部120に障害が発生し、コマンドを処理できない回復不可能な内部エラーを検出する。このため、ホスト計算機300からのコマンドは処理できず、ホスト計算機300へのコマンドに対する返答は行われない状態となる。

S302での障害の発生の後、S303でストレージa装置10の内部120で検出したエラーをサービスプロセッサ400内の障害管理部g401へ報告する。

S304で障害管理部g401は障害情報の報告を受け、障害情報から不良指摘部品を解析して、サービスプロセッサ400上の障害指摘一覧に表示する。

S305で障害管理部g401は新たに設けた障害報告用のインターフェース410を通じて、ホスト計算機300の処理ノード320内のメモリ323へ障害情報を書き込む。

S306で処理ノード320のプロセッサi321はメモリ323に書き込まれた情報を常にポーリングして書き込まれたことを知るか、書き込み直後のプロセッサi321への割込みを契機に、メモリ323から障害情報を読み出して、サービスプロセッサ310内の障害管理部h311へ障害情報を通知する。通知内容は障害発生時刻、障害発生内容、指摘部品、分類の4つの情報である。

S307で障害管理部h311は障害情報の報告を受け、障害情報にある不良指摘部品情報の内部エラーをサービスプロセッサ310上の障害指摘一覧に追加する。

一方、ホスト計算機300内のプロセッサi321はストレージ装置a10に対してコマンドを発行していたが、S303〜S307の動作の有無に関係なく、S308で一定時間のタイムアウトを検出する。

S309でプロセッサi321はストレージ装置a10へのアクセスでコマンドタイムアウトが発生したことをサービスプロセッサ310内の障害管理部h311へ報告する。

S310で障害管理部h311はプロセッサi321からの障害情報の報告を受け、障害情報から不良指摘部品を解析して、サービスプロセッサ310上の障害指摘一覧に表示する。

S311で障害管理部h311はS310で登録した障害の対象となるストレージ装置a10にて内部障害が発生している情報があるかどうかを確認し、このケースでは存在しているので、登録した障害情報から指摘部品情報、この例ではI/Oインターフェース部品d324とI/Oケーブルeを削除する。

以上のように本実施の形態では、ストレージ装置10内部の障害情報をホスト計算機300のサービスプロセッサ310で一元管理されるので、保守員や保守センタのセンタ員は複数の装置の障害情報を確認する必要が無くなるので、保守運用にかかる時間を短縮することが可能である。また、不要な不良指摘部品情報を無くすことが可能なので、必要最低限の部品交換で済ますことが可能である。また、ホスト計算機300のサービスプロセッサ310に障害通知用のインターフェース410を接続する必要がなく、処理ノード320が運用のためにつなげているLANなどのインターフェースを通じて障害情報をやりとりを行うことが可能である。

(実施の形態3)
実施の形態3は、実施の形態1において、ホスト計算機300がストレージ装置10に直接接続されるのではなく、ファイルサーバを介して接続されるようにしたものである。

実施の形態3のストレージシステム1の構成は、ストレージ装置10とホスト計算機300の間にファイルサーバを設け、ファイルサーバのサービスプロセッサと、ストレージ装置10のサービスプロセッサ400およびホスト計算機300のサービスプロセッサ310を障害報告用のインターフェース410により接続する以外は、実施の形態1と同様の構成である。

<ストレージシステムの障害検出処理手順>
次に、図6により本発明の実施の形態3に係るストレージシステムの障害検出処理手順について説明する。図6は本発明の実施の形態3に係るストレージシステムの障害検出処理手順を説明するための説明図である。

図6において、ファイルサーバ500のサービスプロセッサ510内には、ファイルサーバ500の障害を管理する障害管理部511が備えられている。

また、ファイルサーバ500は、ファイルサーバ500内の処理を行う処理ノード520が備えられており、処理ノード520は、プロセッサ521、メモリコントローラ522、メモリ523、I/Oインターフェース524から構成されている。

プロセッサ521により、メモリコントローラ522、メモリ523、I/Oインターフェース524が制御され、ホスト計算機300およびストレージ装置10との間のデータの制御や障害時の処理が行われている。

また、ホスト計算機300の処理ノード320内のI/Oインターフェース324とファイルサーバ500の処理ノード520内のI/Oインターフェース524が接続され、ファイルサーバの処理ノード520内のI/Oインターフェース524にストレージ装置10が接続され、ホスト計算機300はファイルサーバ500に対してコマンドを発行することにより、ファイルサーバ500を介してストレージ装置10を利用するようになっている。

まず、S401でホスト計算機300のプロセッサi321からI/Oインターフェースd324を介してファイルサーバ500に対してコマンドを発行する。コマンドはFibreケーブルなどを通じてファイルサーバ500内のメモリ523に書き込まれる。

S402でファイルサーバ500内のプロセッサk521はメモリ523からコマンドを読み出してI/Oインターフェースd524を介してストレージ装置a10にコマンドを発行する。

S403でストレージ装置a10の内部120に障害が発生し、コマンドを処理できない回復不可能な内部エラーを検出する。このため、ファイルサーバ500からのコマンドは処理できず、ファイルサーバ500へのコマンドに対する返答は行われない状態となる。

S403での障害の発生の後、S404でストレージ装置a10の内部120で検出したエラーをサービスプロセッサ400内の障害管理部g401へ報告する。障害管理部g401は障害情報の報告を受け、障害情報から不良指摘部品を解析して、サービスプロセッサ400上の障害指摘一覧に表示する。

S405で障害管理部g401は新たに設けた障害報告用のインターフェース410を通じて、ファイルサーバ500のサービスプロセッサ510内の障害管理部m511へ障害情報を通知する。障害管理部m511は障害情報の報告を受け、障害情報にある不良指摘部品情報をサービスプロセッサ510上の障害指摘一覧に表示する。

S406で障害管理部m511は新たに設けたインターフェース410を通じて、ホスト計算機300のサービスプロセッサ310内の障害管理部h311へ通知する。障害管理部h311は障害情報の報告を受け、障害情報にある不良指摘部品情報をサービスプロセッサ310上の障害指摘一覧に表示する。

一方、ホスト計算機300内のプロセッサi321はファイルサーバに対してコマンドを発行していたが、S402〜S406の動作の有無に関係なく、S407で一定時間のタイムアウトを検出する。

S408でプロセッサi321はファイルサーバ500へのアクセスでコマンドタイムアウトが発生したことをサービスプロセッサ310内の障害管理部h311へ報告する。障害管理部h311は障害情報の報告を受け、障害情報から不良指摘部品を解析して、サービスプロセッサ310上の障害指摘一覧に表示する。障害管理部h311は登録した障害の対象となるファイルサーバ500にて障害が発生している情報があるかどうかを確認し、存在している場合は登録した障害情報から指摘部品情報を削除する。

また、ファイルサーバ500内のプロセッサk521はストレージ装置10に対してコマンドを発行していたが、S402〜S408の動作の有無に関係なく、S409で一定時間のタイムアウトを検出する。

S410でプロセッサk521はストレージ装置a10へのアクセスでコマンドタイムアウトが発生したことをサービスプロセッサ510内の障害管理部m511へ報告する。障害管理部m511は障害情報の報告を受け、障害情報から不良指摘部品を解析して障害指摘一覧に表示する。障害管理部m511は登録した障害の対象となるストレージ装置a10にて内部障害が発生している情報があるかどうかを確認し、存在している場合は登録した障害情報から指摘部品情報を削除する。

S411で障害管理部m511は障害報告用のインターフェース410を通じて、ホスト計算機300のサービスプロセッサ310内の障害管理部h311へ障害情報を通知する。障害管理部h311は障害情報の報告を受け、障害情報にある不良指摘部品情報の内部エラーをサービスプロセッサ310上の障害指摘一覧に追加する。障害管理部h311は登録した障害の対象となるファイルサーバ500およびストレージ装置a10にて障害が発生している情報があるかどうかを確認し、存在している場合は登録した障害情報から指摘部品情報を削除する。

以上のように、本実施の形態では、ホスト計算機300、ファイルサーバ500、ストレージ装置10のサービスプロセッサ間を障害報告用のインターフェースで接続し、ホスト計算機300で障害情報を集約することにより、保守交換に最低限必要な交換指示情報を示すことが可能となる。

以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。

本発明の実施の形態1に係るストレージシステムの構成を示す構成図である。 本発明の実施の形態1に係るストレージシステムの障害検出処理手順を説明するための説明図である。 本発明の実施の形態1に係るストレージシステムのホスト計算機のサービスプロセッサ内にある障害管理部の処理を示すフローチャートである。 (a)〜(c)は実施の形態1に係るストレージシステムのサービスプロセッサ間の接続情報を示す図である。 本発明の実施の形態2に係るストレージシステムの障害検出処理手順を説明するための説明図である。 本発明の実施の形態3に係るストレージシステムの障害検出処理手順を説明するための説明図である。

符号の説明

1…ストレージシステム、10…ストレージ装置、100…ディスク制御装置、101…チャネルアダプタ、102…ディスクアダプタ、103…キャッシュメモリ、104…共有メモリ、110…ホストインターフェース、120…内部、200…ディスク装置、201…物理記憶デバイス、300…ホスト計算機、310…サービスプロセッサ、311…障害管理部、320…処理ノード、321…プロセッサ、322…メモリコントローラ、323…メモリ、324…I/Oインターフェース、400…サービスプロセッサ、401…障害管理部、410…インターフェース、500…ファイルサーバ、510…サービスプロセッサ、511…障害管理部、520…処理ノード、521…プロセッサ、522…メモリコントローラ、523…メモリ、524…I/Oインターフェース。

Claims (5)

  1. ホスト計算機と前記ホスト計算機に記憶領域を提供するストレージ装置を備えたストレージシステムであって、
    前記ホスト計算機は、前記ホスト計算機の障害を管理する障害管理部と、前記ホスト計算機の保守・管理および前記ホスト計算機の前記障害管理部による障害管理を行うサービスプロセッサと、前記ホスト計算機を制御し前記ストレージ装置との通信を行う処理ノードを有し、前記ホスト計算機と前記ストレージ装置とを接続する入出力用のインターフェースケーブルを介して、前記ストレージ装置の記憶領域にアクセスし、前記アクセスの際に、アクセスコマンドに対するコマンド応答に関するエラーが発生すると、前記ホスト計算機の前記障害管理部により、ソフトウェア検出のエラーとして前記入出力用のインターフェースケーブルおよび前記入出力用のインターフェースケーブルに接続された前記ストレージ装置内の回路の障害情報を格納し、
    前記ストレージ装置は、前記ストレージ装置の障害を管理する障害管理部と、前記ストレージ装置の保守・管理および前記ストレージ装置の前記障害管理部による障害管理を行うサービスプロセッサを有し、
    前記ホスト計算機の前記障害管理部と前記ストレージ装置の前記障害管理部とを障害報告用のインターフェースを用いて接続し、
    前記ストレージ装置に障害が発生した際、前記ストレージ装置の前記障害管理部は、前記障害報告用のインターフェースを介して前記ホスト計算機の前記障害管理部へ障害情報を報告し、
    前記ホスト計算機の前記障害管理部は、前記ストレージ装置への前記アクセスコマンドに対するコマンド応答に関するエラーが発生した後に、前記ストレージ装置からの前記障害情報の報告があったときは、前記ストレージ装置から報告された障害情報に基づいて、前記ストレージ装置から報告された障害情報を格納すると共に、前記ソフトウェア検出のエラーとして格納した前記障害情報から、前記障害が発生した前記ストレージ装置に関連する障害情報を削除し、前記ストレージ装置からの前記障害情報の報告の後に、前記ストレージ装置への前記アクセスコマンドに対するコマンド応答に関するエラーが発生したときは、前記ストレージ装置から報告された障害情報に基づいて、前記ソフトウェア検出のエラーとして格納した前記障害情報から、前記障害が発生した前記ストレージ装置に関連する障害情報を削除し、前記ホスト計算機の前記サービスプロセッサにより前記ストレージシステム内の障害情報を一元管理することを特徴とするストレージシステム。
  2. 請求項1記載のストレージシステムにおいて、
    前記ホスト計算機の前記障害管理部および前記ストレージ装置の前記障害管理部は、それぞれ、前記ホスト計算機と前記ストレージ装置との間の接続関係を示す接続部位、接続先装置名、接続先クラス、および接続先アクセス情報からなる接続情報を有し、
    前記ストレージ装置の前記障害管理部は、前記接続情報に基づいて、前記障害情報を報告する前記ホスト計算機を判断し、
    前記ホスト計算機の前記障害管理部は、前記接続情報に基づいて、前記ホスト計算機内で発生したソフトウェア検出の障害情報の削除対象を判断することを特徴とするストレージシステム。
  3. ホスト計算機と前記ホスト計算機に記憶領域を提供するストレージ装置を備えたストレージシステムであって、
    前記ホスト計算機は、前記ホスト計算機の障害を管理する障害管理部と、前記ホスト計算機の保守・管理および前記ホスト計算機の前記障害管理部による障害管理を行うサービスプロセッサと、前記ホスト計算機を制御し前記ストレージ装置との通信を行う処理ノードを有し、前記ホスト計算機と前記ストレージ装置とを接続する入出力用のインターフェースケーブルを介して、前記ストレージ装置の記憶領域にアクセスし、前記アクセスの際に、アクセスコマンドに対するコマンド応答に関するエラーが発生すると、前記ホスト計算機の前記障害管理部により、ソフトウェア検出のエラーとして前記入出力用のインターフェースケーブルおよび前記入出力用のインターフェースケーブルに接続された前記ストレージ装置内の回路の障害情報を格納し、
    前記ストレージ装置は、前記ストレージ装置の障害を管理する障害管理部と、前記ストレージ装置の保守・管理および前記ストレージ装置の前記障害管理部による障害管理を行うサービスプロセッサを有し、
    前記ホスト計算機の前記処理ノードと前記ストレージ装置の前記障害管理部とを障害報告用のインターフェースを用いて接続し、
    前記ストレージ装置に障害が発生した際、前記ストレージ装置の前記障害管理部は、障害情報を前記障害報告用のインターフェースを介して前記ホスト計算機の前記処理ノードへ報告し、
    前記ホスト計算機の前記障害管理部は、前記ストレージ装置への前記アクセスコマンドに対するコマンド応答に関するエラーが発生した後に、前記ストレージ装置から前記処理ノードへの前記障害情報の報告があったときは、前記処理ノードに報告された前記ストレージ装置からの障害情報に基づいて、前記処理ノードに報告された障害情報を格納すると共に、前記ソフトウェア検出のエラーとして格納した前記障害情報から、前記障害が発生した前記ストレージ装置に関連する障害情報を削除し、前記ストレージ装置から前記処理ノードへの前記障害情報の報告の後に、前記ストレージ装置への前記アクセスコマンドに対するコマンド応答に関するエラーが発生したときは、前記処理ノードに報告された前記ストレージ装置からの障害情報に基づいて、前記ソフトウェア検出のエラーとして格納した前記障害情報から、前記障害が発生した前記ストレージ装置に関連する障害情報を削除し、前記ホスト計算機の前記サービスプロセッサにより前記ストレージシステム内の障害情報を一元管理することを特徴とするストレージシステム。
  4. 請求項3記載のストレージシステムにおいて、
    前記ホスト計算機の前記障害管理部および前記ストレージ装置の前記障害管理部は、それぞれ、前記ホスト計算機と前記ストレージ装置との間の接続関係を示す接続部位、接続先装置名、接続先クラス、および接続先アクセス情報からなる接続情報を有し、
    前記ストレージ装置の前記障害管理部は、前記接続情報に基づいて、前記障害情報を報告する前記ホスト計算機を判断し、
    前記ホスト計算機の前記障害管理部は、前記接続情報に基づいて、前記ホスト計算機内で発生したソフトウェア検出の障害情報の削除対象を判断することを特徴とするストレージシステム。
  5. ホスト計算機と前記ホスト計算機に接続されるファイルサーバと前記ファイルサーバに記憶領域を提供するストレージ装置とを備えたストレージシステムであって、
    前記ホスト計算機は、前記ホスト計算機の障害を管理する障害管理部と、前記ホスト計算機の保守・管理および前記ホスト計算機の前記障害管理部による障害管理を行うサービスプロセッサと、前記ホスト計算機を制御し前記ストレージ装置との通信を行う処理ノードを有し、前記ホスト計算機と前記ファイルサーバとを接続する入出力用のインターフェースケーブルを介して、前記ファイルサーバ経由で前記ストレージ装置の記憶領域にアクセスし、前記アクセスの際に、アクセスコマンドに対するコマンド応答に関するエラーが発生すると、前記ホスト計算機の前記障害管理部により、ソフトウェア検出のエラーとして前記入出力用のインターフェースケーブルおよび前記入出力用のインターフェースケーブルに接続された前記ファイルサーバ内の回路の障害情報を格納し、
    前記ファイルサーバは、前記ファイルサーバの障害を管理する障害管理部と、前記ファイルサーバの保守・管理および前記ファイルサーバの前記障害管理部による障害管理を行うサービスプロセッサと、前記ファイルサーバを制御し前記ストレージ装置との通信を行う処理ノードを有し、
    前記ストレージ装置は、前記ストレージ装置の障害を管理する障害管理部と、前記ストレージ装置の保守・管理および前記ストレージ装置の前記障害管理部による障害管理を行うサービスプロセッサを有し、
    前記ホスト計算機の前記障害管理部と前記ファイルサーバの前記障害管理部と前記ストレージ装置の前記障害管理部とを障害報告用のインターフェースを用いて接続し、
    前記ストレージ装置に障害が発生した際、前記ストレージ装置の前記障害管理部は、障害情報を前記障害報告用のインターフェースを介して前記ファイルサーバの前記障害管理部へ報告し、
    前記ファイルサーバの前記障害管理部は、前記ストレージ装置の前記障害管理部から報告された障害情報を前記障害報告用のインターフェースを介して前記ホスト計算機の前記障害管理部へ報告し、
    前記ホスト計算機の前記障害管理部は、前記ストレージ装置への前記アクセスコマンドに対するコマンド応答に関するエラーが発生した後に、前記ファイルサーバからの前記障害情報の報告があったときは、前記ファイルサーバから報告された障害情報に基づいて、前記ファイルサーバから報告された障害情報を格納すると共に、前記ソフトウェア検出のエラーとして格納した前記障害情報から、前記障害が発生したストレージ装置が接続された前記ファイルサーバに関連する障害情報を削除し、前記ファイルサーバからの前記障害情報の報告の後に、前記ストレージ装置への前記アクセスコマンドに対するコマンド応答に関するエラーが発生したときは、前記ファイルサーバから報告された障害情報に基づいて、前記ソフトウェア検出のエラーとして格納した前記障害情報から、前記障害が発生したストレージ装置が接続された前記ファイルサーバに関連する障害情報を削除し、前記ホスト計算機の前記サービスプロセッサにより前記ストレージシステム内の障害情報を一元管理することを特徴とするストレージシステム。
JP2005037845A 2005-02-15 2005-02-15 ストレージシステム Expired - Fee Related JP4357433B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005037845A JP4357433B2 (ja) 2005-02-15 2005-02-15 ストレージシステム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005037845A JP4357433B2 (ja) 2005-02-15 2005-02-15 ストレージシステム
US11/114,198 US7409605B2 (en) 2005-02-15 2005-04-26 Storage system
EP05256399A EP1691289B1 (en) 2005-02-15 2005-10-14 Remote maintenance of a storage computer system

Publications (2)

Publication Number Publication Date
JP2006227718A JP2006227718A (ja) 2006-08-31
JP4357433B2 true JP4357433B2 (ja) 2009-11-04

Family

ID=36565707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005037845A Expired - Fee Related JP4357433B2 (ja) 2005-02-15 2005-02-15 ストレージシステム

Country Status (3)

Country Link
US (1) US7409605B2 (ja)
EP (1) EP1691289B1 (ja)
JP (1) JP4357433B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7805630B2 (en) * 2006-07-27 2010-09-28 Microsoft Corporation Detection and mitigation of disk failures
JP4882736B2 (ja) * 2006-12-27 2012-02-22 富士通株式会社 情報処理装置,障害処理方法,障害処理プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体
US20090125754A1 (en) * 2007-11-08 2009-05-14 Rashmi Chandra Apparatus, system, and method for improving system reliability by managing switched drive networks

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5090014A (en) * 1988-03-30 1992-02-18 Digital Equipment Corporation Identifying likely failure points in a digital data processing system
JP2804125B2 (ja) * 1989-11-08 1998-09-24 日立電子サービス株式会社 情報処理システムの障害監視装置と制御方法
US6052797A (en) * 1996-05-28 2000-04-18 Emc Corporation Remotely mirrored data storage system with a count indicative of data consistency
US5790775A (en) * 1995-10-23 1998-08-04 Digital Equipment Corporation Host transparent storage controller failover/failback of SCSI targets and associated units
JP2001337143A (ja) * 2000-05-30 2001-12-07 Nec Corp 論理回路における故障箇所推定システム、及び、故障箇所推定方法、並びに、記録媒体
US6748432B1 (en) 2000-06-16 2004-06-08 Cisco Technology, Inc. System and method for suppressing side-effect alarms in heterogenoeus integrated wide area data and telecommunication networks
US6701464B2 (en) * 2001-03-01 2004-03-02 International Business Machines Corporation Method and system for reporting error logs within a logical partition environment
US20020124214A1 (en) * 2001-03-01 2002-09-05 International Business Machines Corporation Method and system for eliminating duplicate reported errors in a logically partitioned multiprocessing system
US6823482B2 (en) * 2001-03-08 2004-11-23 International Business Machines Corporation System and method for reporting platform errors in partitioned systems
US6944800B2 (en) * 2001-05-11 2005-09-13 Dell Products L.P. Dynamic display of personal computer support information
US6842870B2 (en) * 2001-09-20 2005-01-11 International Business Machines Corporation Method and apparatus for filtering error logs in a logically partitioned data processing system
JP4796251B2 (ja) 2001-09-21 2011-10-19 株式会社日立製作所 ネットワークストレージシステム及びその制御方法
US7203930B1 (en) * 2001-12-31 2007-04-10 Bellsouth Intellectual Property Corp. Graphical interface system monitor providing error notification message with modifiable indication of severity
JP3983138B2 (ja) * 2002-08-29 2007-09-26 富士通株式会社 障害情報収集プログラムおよび障害情報収集装置
JP4175083B2 (ja) 2002-10-29 2008-11-05 株式会社日立製作所 記憶装置の管理用計算機、およびプログラム
JP2004234555A (ja) 2003-01-31 2004-08-19 Hitachi Ltd ストレージシステムの制御方法、ストレージシステム、及びプログラム
US7103808B2 (en) * 2003-04-10 2006-09-05 International Business Machines Corporation Apparatus for reporting and isolating errors below a host bridge
US7139940B2 (en) * 2003-04-10 2006-11-21 International Business Machines Corporation Method and apparatus for reporting global errors on heterogeneous partitioned systems
US7213176B2 (en) * 2003-12-10 2007-05-01 Electronic Data Systems Corporation Adaptive log file scanning utility
US20060112219A1 (en) * 2004-11-19 2006-05-25 Gaurav Chawla Functional partitioning method for providing modular data storage systems
US7418541B2 (en) * 2005-02-10 2008-08-26 International Business Machines Corporation Method for indirect access to a support interface for memory-mapped resources to reduce system connectivity from out-of-band support processor
CA2642145C (en) * 2006-02-14 2013-09-24 Yottayotta, Inc. Systems and methods for obtaining ultra-high data availability and geographic disaster tolerance

Also Published As

Publication number Publication date
JP2006227718A (ja) 2006-08-31
US20060184820A1 (en) 2006-08-17
US7409605B2 (en) 2008-08-05
EP1691289B1 (en) 2011-12-07
EP1691289A1 (en) 2006-08-16

Similar Documents

Publication Publication Date Title
EP2864885B1 (en) System and method for datacenters disaster recovery
US7263593B2 (en) Virtualization controller and data transfer control method
US7886109B2 (en) Storage system coupled to management server and a monitoring method of a stopped device executed by the storage system
US7474623B2 (en) Method of routing I/O adapter error messages in a multi-host environment
US7664909B2 (en) Method and apparatus for a shared I/O serial ATA controller
US7979613B2 (en) Performance of a storage system
JP4775846B2 (ja) 物理リンクの割当てを制御するコンピュータシステム及び方法
US6543001B2 (en) Method and apparatus for maintaining data coherency
US7043665B2 (en) Method, system, and program for handling a failover to a remote storage location
US6571354B1 (en) Method and apparatus for storage unit replacement according to array priority
US7027053B2 (en) Graphical user interface for indicating device failover
US7480780B2 (en) Highly available external storage system
JP4514501B2 (ja) ストレージシステム及びストレージシステムの障害解消方法
EP1814035B1 (en) Storage controller and data management method
JP4576923B2 (ja) ストレージシステムの記憶容量管理方法
US7284099B2 (en) Detection of out of memory and graceful shutdown
US7725776B2 (en) Method for displaying pair state of copy pairs
US8458398B2 (en) Computer-readable medium storing data management program, computer-readable medium storing storage diagnosis program, and multinode storage system
JP4776307B2 (ja) ストレージシステム、データ転送方法及びプログラム
JP4387116B2 (ja) ストレージシステムの制御方法、及びストレージシステム
US7469358B2 (en) External storage and data recovery method for external storage as well as program
US7188201B2 (en) Storage system
JP4857818B2 (ja) ストレージ管理方法およびストレージ管理サーバ
US6910098B2 (en) Method and apparatus for maintaining data coherency
DE60224369T2 (de) Speichersteuerungssystem und Verfahren dazu

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090310

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090707

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090804

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120814

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120814

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130814

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees