JP2001249856A - ストレージ・エリア・ネットワーク(san)内でのエラー処理方法及びデータ処理システム - Google Patents
ストレージ・エリア・ネットワーク(san)内でのエラー処理方法及びデータ処理システムInfo
- Publication number
- JP2001249856A JP2001249856A JP2000397033A JP2000397033A JP2001249856A JP 2001249856 A JP2001249856 A JP 2001249856A JP 2000397033 A JP2000397033 A JP 2000397033A JP 2000397033 A JP2000397033 A JP 2000397033A JP 2001249856 A JP2001249856 A JP 2001249856A
- Authority
- JP
- Japan
- Prior art keywords
- san
- error
- cam
- information
- processing system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0781—Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0727—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/02—Standardisation; Integration
- H04L41/022—Multivendor or multi-standard integration
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0604—Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
- H04L41/0609—Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on severity or priority
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/064—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/065—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Debugging And Monitoring (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Computer And Data Communications (AREA)
- Maintenance And Management Of Digital Transmission (AREA)
- Small-Scale Networks (AREA)
Abstract
N)で問題判別及び障害分離を行うための方法及びシス
テムを提供。 【解決手段】 ストレージ・エリア・ネットワーク(S
AN)内でのエラーを処理する方法は、コンピュータ実
行ステップとしてSANトポロジ・マップを生成するス
テップと、SAN問題判別情報テーブル(SPDIT)
を生成するステップと、SANトポロジ・マップ及びS
PDITを用いてSAN診断テーブル(SDT)を生成
するステップとを有する。
Description
処理システム、特にコンピュータ・ネットワーク管理の
ための方法及び装置に関する。
(SAN)は、複数のホスト・コンピュータが複数のス
トレージ周辺装置を共用すること、特にファイバ・チャ
ンネル(FC)ネットワーク・スイッチを介してストレ
ージ周辺装置を共用することを可能とする「オープン・
システム」ストレージ・アーキテクチャである。FCス
イッチ、ホスト・システム、及びストレージ周辺装置
は、異なるベンダによって製造されたものであってもよ
く、また異なるオペレーティング環境を有するものであ
ってもよい。
又は仕様が求められている。マルチ・ベンダ・システ
ム、ネットワーク・スイッチ、及び周辺装置からなる複
雑な構成によって、既存の二点間ストレージ構成よりも
SAN環境下で問題判別を実行することが困難である。
そのため、SAN環境で障害が生ずることで、システム
の動作不能時間が増加するとともにシステムをメンテナ
ンスするための費用も増加するであろう。
障害が生じているシステム及び/又は構成要素を識別す
る障害分離アルゴリズムを取り込む「オープン・システ
ム」、リアルタイム、端末間、エラー検出アーキテクチ
ャを定義する方法及び装置を持つことは有利であろう。
ットワーク(SAN)で問題判別及び障害分離を行うた
めの方法及びシステムを提供する。マルチ・ベンダ・ホ
スト・システム、FCスイッチ、及びストレージ周辺装
置からなる複雑な構成は、通信アーキテクチャ(CA)
を介してSANに接続される。通信アーキテクチャ要素
(CAE)は、ネットワーク・サービス・プロトコルを
介してホスト・コンピュータ上の通信アーキテクチャ管
理プログラム(CAM)によって首尾よく記録されたネ
ットワーク接続装置である。CAMは、SAN用の問題
判別(PD)機能を有し、SANのPDF情報テーブル
(SPDIT)を保守する。CAは、SPDITに格納
された情報の伝達を行うことが可能なすべてのネットワ
ーク接続要素を有する。CAMは、SANトポロジ・マ
ップを利用し、またSPDITはSAN診断テーブル
(SDT)の生成に使用される。特定の装置において障
害を持つ構成要素がエラーを生じ、該エラーによって同
一ネットワーク接続パス上にある装置にもエラーが生ず
る可能性がある。エラー・パケット又はエラー・メッセ
ージをCAMが受信するので、エラーはSDTに格納さ
れ、各エラーをSDT内の他のエラーと時間的かつ空間
的に比較することによって各エラーの分析が行われる。
もしCAREがエラーを生成する候補であると判断され
るならば、もし可能ならばCAFを交換するように報告
される。
タ処理システムの構成を示す模式図である。コンピュー
タ100は、システム・ユニット110と、ビデオテー
ブル示端末102と、キーボード104と、フロッピー
・ドライブ及び他の種類の固定記憶媒体及び取り外し可
能記憶媒体を有するものであってもよいストレージ装置
109と、マウス106とを備える。また、コンピュー
タ100は、さらに別の入力装置を備えることも可能で
ある。コンピュータ100は、任意の適当なコンピュー
タ、例えばIBM(International Business Machines
Corporation (Armonk,New York所在))の製品であるA
dvanced Interactive Executive (AIX)・オペレー
ティング・システムで稼働する同社のRISC/600
0システムを用いて実現することができる。また、図示
したコンピュータ100はサーバ型のコンピュータであ
り、本発明の他の実施形態を他のデータ処理システム、
例えばワークステーション、ネットワーク・コンピュー
タ、ウェブ・ベース・テレビジョン・セット−トップ・
ボックス、インターネット機器等で実現してもよい。コ
ンピュータ100は、該コンピュータ100で動作する
コンピュータ読み取り可能媒体上にあるシステム・ソフ
トウェアによって実行可能なグラフィカル・ユーザ・イ
ンタフェースも含むものであってもよい。
すものであって、本発明のアーキテクチャ的限界を示す
ものではない。
素の典型的な構成を説明するためのブロック図である。
データ処理システム200は、多様なバス構造及びプロ
トコルを使用する。図に示した例ではPCIバス、IS
Aバス、及び6XXバスが用いられているが、他のバス
・アーキテクチャ及びプロトコルを使用してもよい。
202及びL2キャッシュ203を有し、これらは6X
Xバス205に接続されている。システム200は、複
数のプロセッサ・カードを有するものであってもよい。
プロセッサ・カード206は、プロセッサ207及びL
2キャッシュ208を有する。
10をサポートするもので、該システム・プレーナ21
0は、6XXブリッジ211と、メモリ・カード213
をサポートするメモリ・コントローラ212とを有す
る。メモリ・カード213は、複数のデュアル・インラ
イン・メモリ・モジュール(DIMM)215及び21
6から構成されるローカル・メモリ214を有する。
222を介してPCIブリッジ220及び221に接続
する。PCIブリッジ220及び221は、種々のI/
O構成要素及びインタフェースをサポートする固有のI
/O(NIO)プレーナ223上に包含される。PCI
ブリッジ221は、ネットワーク・アダプタ224及び
いくつかのカード・スロット225を通る外部データ・
ストリームのための接続がPCIバス227を介して提
供される。また、PCIブリッジ220は、PCIバス
228を介して多様なI/O装置と接続する。ハード・
ディスク229は、PCIバス218と接続するSCS
Iホスト・アダプタ230と接続してもよい。グラフィ
ック・アダプタ231もまた図示したように直接又は間
接的にPCIバス228に接続してもよい。
8を介してPCIブリッジ220と接続する。ISAブ
リッジ232はISAバス234を介したNIOコント
ローラ233との相互接続機能、例えばシリアル接続2
35及び236を提供する。フロッピー(登録商標)・
ドライブ接続237は取り外し可能なストレージを提供
する。キーボード接続238及びマウス接続239によ
ってデータ処理システム200がユーザから入力データ
を受け取ることが可能となる。不揮発性RAM(NVR
AM)240は、システム破壊又はシステムエラー、例
えば電力供給上の問題に対してある種のデータが消えな
いように保存しておく不揮発性メモリを提供する。シス
テム・ファームウェア241もまたISAバス234と
接続されており、初期BIOSを制御する。サービス・
プロセッサ244は、ISAバス234と接続されてお
り、システム診断又はシステム・サービスを行うための
機能を提供する。
出し、情報をオペレーティング・システムに渡す。エラ
ーのもとがエラーを検出した時点で合理的確実性で知ら
れていても、あるいは知られていなくてもよい。オペレ
ーティング・システムは、ただエラーをログファイルに
書いてもよく、さもなければ報告されたエラーを処理し
てもよい。
テム・インプリメンテーションに応じて変わることを理
解するであろう。例えば、システムはより多くのプロセ
ッサを有するものであってもよく、また他の周辺機器を
図2に示したハードウェアに加えて、あるいは交換して
使用してもよい。図示した例は本発明に関してアーキテ
クチャの限界を意味するものではない。
の好ましい実施の形態にもとづいて実現されたSAN問
題判別方法論に参加するデータ処理システムのための通
信アーキテクチャを示す。ネットワーク300は、一組
のコンピュータ、スイッチ、及びストレージ装置を有す
るもので、ストレージ装置は通信アーキテクチャに参加
するか、又は参加しなくてもよい。
細に説明されるSAN問題判別情報テーブル(SPDI
T)に定義された情報のいずれか、又はすべてを伝達す
ることが可能なSAN接続要素のすべてを含む。
CA要素(CAE)と呼ばれる。CAに参加していない
要素はいずれもCA不参加者(CAN)と呼ばれる。こ
れらの要素は識別される。なぜなら、それらの要素はS
ANトポロジに参加しており、それによってシステムの
問題判別(PD)機能にも参加している。WindowsNT
(商標)サーバ302、メインフレーム・コンピュータ
304、Unix(商標)サーバ306、Linux(商標)サ
ーバ308は、CAに参加するコンピュータであり、し
たがってこれらはCAEである。WindowsNT(商標)サ
ーバ302、メインフレーム・コンピュータ304、Un
ix(商標)サーバ306、Linux(商標)サーバ308
は、様々なクライアントをサポートするホスト・コンピ
ュータでもあり、ストレージ装置へのアクセスを要求し
てもよい。コンピュータ302〜306の各々は、ホス
ト・バス・アタッチ(HBA)を有するもので、該HB
AはFCホスト用のネットワーク・アダプタの一種であ
る。FCスイッチ311〜313はCAEであり、スト
レージ装置のいくつかもCAEである。この例では、共
有RAID(独立したディスクの重複アレイ)321〜
323及び共有テープ324がCAEであり、一方共有
テープ325はCANである。
バンド内通信リンク341〜352及び/又はすべてが
SAN要素共有である通信リンク331〜334上のバ
ンド外TCP/IP通信ネットワークを介するFCスイ
ッチング・ファブリックを介して通信することができ
る。ここで指摘しておくべきことは、図3に示した通信
リンクは単一の物理的接続を共有する論理接続であって
もよいことである。あるいは、複数の物理的通信リンク
によって装置が接続されてもよい。
によって使用されたプロトコルは、SNMP/MIB
(シンプル・ネットワーク・マネジメント・プロトコル
/マネージメント・インフォメーション・ベース、モニ
タされている特定の装置を記述するSNMP構造)及び
もととなった固有FCの両方となるように定義される。
これら2つのプロトコルを使用することで、装置/ホス
ト特異的及びSAN特異的情報の両方を収集することが
可能となり、次いで端末間問題判別に使用される。
ムの端末間PD機能が存在する特定のCAEである。S
PDITはCAMに存在し、CAEごとにCAMによっ
て自動的に登録される(固有FC及び/又はSNMPサ
ービスを介して)。CAEは、首尾よく登録する要素で
あり、またCANはCAMによって登録できない要素で
はあるがSANトポロジ発見プロセスを介して存在する
ことが知られている。このことについては後でより詳細
に説明する。CAMは、端末間問題判別に関係する任意
のFC拡張リンク・サービス(ELS)をサポートす
る。
M、及びセカンダリ又はイナクティブCAMとして分類
することができる。CAMは、SPDIT及び登録情報
を複製する大いに利用可能な要素である。例えば、セカ
ンダリCAM及びプライマリCAMは、もしプライマリ
CAMがハートビート信号に応答しないことによって失
敗したように思われるならば、重複する方法で実行され
ているセカンダリCAMがプライマリCAMのデューテ
ィを想定するように、ハートビート信号を共有してもよ
い。CAMに対する問題判別インタフェースは、SAN
PDアプリケーション・プログラミング・インタフェ
ース(SAN PD API)から構成される。SAN
PD APIは、CAMと、CAM情報又はステータ
スを読むことが可能な任意の他のオペレーティング環境
との間の通信インタフェースを定義する。
実施の形態にもとづくSAN問題判別情報テーブル(S
PDIT)を示すテーブルである。SPDITは、すべ
ての周知のプロダクト/要素とCA上で伝達可能な情報
種類とで構成されている。SPDITのフォーマット
は、CAに含まれる装置の数、サポートされるプロダク
トの種類、装置に関連した情報、その他にかなり依存し
ていると思われる。例えば、SPDITは、図3に示す
各々の装置に関する情報を含むであろう。
を含むものであってもよい。すなわち、ベンダ属性40
1、プロダクト識別子402、情報の種類403、及び
記述属性404である。SPDIT400の各レコード
は、それらのレコード項目に関するデータを含む。ベン
ダ属性401は、CA上の特定装置製造者を含む。プロ
ダクト識別子402は、特定の装置を識別するためのベ
ンダによって割り当てられた情報、例えば型の種類、型
番号、プロダクト通し番号等である。
トされた通信リンクの種類、装置によってサポートされ
たエラー条件又はエラー定義のフォーマット等に関連し
たデータを含む。記述属性404は、プロダクトによっ
て予想されるべきエラー情報の種類に関する情報を提供
する。例えば、もし記述属性レコードが、プロダクトは
ELS登録リンク発生事象レコード(RLIR)互換性
であることのテーブル示のみを含むならば、CAM関連
プロセスはプロダクトのバンド外MIBを受け取ること
は期待できないであろう。
器、ホスト、及びスイッチによって状態/エラー条件を
示すことに使われる情報のすべてを含むであろう。これ
は、固有FCリンク及び拡張リンクエラー定義、さらに
MIB定義を含むと思われる。これらの定義は、フィー
ルド置換可能ユニット(FRU)構成要素情報を含むこ
とができ、MIBに位置するか、又はエラー報告プロト
コルに組み込まれることができ、また障害構成要素が分
離される細分性の決定に使用可能である。
の端末機能が存在する特有のCAであり、SPDITが
含まれる。CAM初期化プロセスは、バンド内SAN及
びバンド外ネットワークの両方に接続したすべてのFC
ノードの発見及び登録を含む。CAM初期化プロセス
は、FCバンド内及びCAバンド外(SNMPを経由)
発見/登録プロセスを使用する。このプロセスは、SA
Nのトポロジ・マップ(TM)を提供する。このトポロ
ジ・マップ(TM)は、要素の種類(ホスト、周辺機
器、スイッチ)、明示接続/パス、及びそれらの関連ベ
ンダの知識、さらにSPDIT情報を伴って要素が接続
した登録及び非登録SANのすべてを含む。
Nのための簡略化ネットワーク・トポロジが図示されて
いる。FCスイッチ501は、該FCスイッチ501と
CAE521〜523の各々との接続点を与えるポート
511〜513を有するもので、該ポート511〜51
3はCAE A、CAE B、及びCAE Cとラベル
されている。CAの見地からすれば、FCスイッチポー
ト511〜513はCAEである。なぜなら、これらの
ポート511〜513は障害を生じたり、又はエラーを
生じたりすることが可能であり、エラーのもとと適当に
診断された後は取り替えることができる。
ネットワーク・トポロジのマップを提供するテーブルで
ある。トポロジ・マップ(TM)は2次元のテーブルと
してテーブルされており、左側の欄と上側の欄との両方
に、図5のFCスイッチ501のようなスイッチに接続
されたSAN要素、CAE及びCAN装置の両方が含ま
れている。診断セルは、対応の要素及びそれが接続され
たスイッチ・ポートに関するSPDIT/種類情報のす
べてを含む。他のセルは要素間の方向パスが含まれる。
例えば、テーブルはポート3とポート1との間のパスを
用いてCAEAとCAE Cとの間の方向パスを示して
いる。多重パスは可能である。トポロジ及び登録発見プ
ロセスは周期的に繰り返されることでTMが正しいこと
を確実にする。CAMもまた、PFのために使用可能な
拡張リンク・サービスを提供する任意のSAN要素によ
って登録する。
ルを示すものである。SANのTMは、第1エラー・デ
ータ収集(FEDC)及びリアルタイム診断分析(RD
A)のために使用されるSAN診断テーブル(SDT)
を生成するために使われる。図7に示されるSDTは、
各スイッチ/ファブリック要素のための追加の行が含ま
れること以外は、図6に示すTMと同様である。
トが含まれるそれ自身の行/列に対応するCAEによっ
て報告されたエラーを保持するために使われる。一つの
パス、すなわちSDTセルの中の各点は、別のSAN接
続要素をテーブルす。各セルは、特定のプロダクト動作
が知られ、かつ適当な診断決定が下されるように、TM
に収集された情報を含む。例えば、もしバンド外SCS
I装置のエラーがバンド内ホスト・バス・アタッチ(H
BA)FCリンクのエラーを伴うならば、ストレージ装
置はHBAに対してリンクエラーを生じている可能性が
高いかどうか等の診断問い合わせが存在してもよい。
DTを用いるRDAのユーティリティを例証するもので
ある。行1は、バンド内FCリンクがタイムアウトであ
ることをCAE Aが報告したことを示している。行3
は、CAE C上のバンド外ハードウェア・コントロー
ラエラーを示す。これら2つのエラーは関連している。
なぜなら、エラー情報に関連したタイムスタンプによっ
て示されるように、これらは同一タイム・フレーム内で
起こるためである。行5はバンド内FCリンクエラーが
生じたことを示すが、記憶されたタイムスタンプという
条件のもとで、行5は前の2つとは無関係である。した
がって、テーブルは2つの異なる問題を示している。す
なわち、第1の問題は、CAE Cにおける制御装置の
ハードウェア障害に関係しており、第2の問題はFCス
イッチのCAE 2におけるFCリンク障害である。
ム診断分析で使用される重みを図示している。RDAア
ルゴリズムは、FEDC事象が起こるたびに、SDTの
エラー報告要素を走査して適当な応答を割り出す。RD
Aは、障害構成要素を分離するために重み判断分析を使
用する。2つの広範囲のカテゴリーがH=最も高い重
み、M=中間の重み、L=最も低い重みによって例証さ
れる。
ダイナミックであり、SANトポロジの複雑性及びそれ
に接続した要素の性質に合わせて帰られるであろう。
環境に適用される強弱間の重みスケールを簡単に例証す
るものである。もしSANがその対応したホスト及び周
辺機器でほんのわずかな16ポート・スイッチまで成長
するならば、単一のドライブエラー又はHBAタイムア
ウトエラーによるエラーを報告することができる可能な
ノード数を増やすことができる。グローバルな端末間R
DA診断機能無しで、障害構成要素を分離するタスクは
行き当たりばったりになる。マルチ・ベンダSANで
は、多数の断続的な、回復可能な装置エラー(すなわち
ソフトのエラー)がホストによって気づかれなくなるこ
とは一般的である。結局、装置は回復不能エラー(すな
わちハード・エラー)に遭遇する可能性があり、それは
システムクラッシュをもたらす。本発明によって提供さ
れるバンド内及びバンド外機構は、回復可能なエラーが
生ずるとただちにそれを検出して報告するであろう。
説明する。これらの図は、本発明の好ましい実施の形態
にもとづく単一障害SAN要素のSAN端末間障害分離
を行うリアルタイム診断アルゴリズム(RDA)のプロ
セスを説明するためのフローチャートである。TDA
は、障害を分離するために2つのダイナミックな機構を
使用する。
診の可能性が時間次元で最小となるように該時間次元に
おいてSDTの障害分離検索を制限するために使用され
る。
で最小となるように、また周知のシステムとサブシステ
ムとの関連が綿密に調べられるように、該データ構造は
SDTの空間ドメインにおける障害分離検索を制限する
ために使用される。SCPはRDAの間、SDTから要
素をコピーする。
もとが分離されるまで、時間、場所、及び重大度につい
て、受け取った障害情報のすべてを関連づけることであ
る。このプロセスは、単一の報告された障害、又は一連
の報告された障害の後に終了する。
離用の一般的なRDAを以下に説明する。CAMが該C
Aにあるすべての接続パスをSDTに初期化する時に、
プロセスが開始する(ステップ801)。SDTは、す
べての接続されたパス、すなわちパスA−−>B、B−
−>C、その他によって初期化される。接続可能とすべ
きそれらのパスだけが入力される。これらのパスはトポ
ロジ・マッピング、例えば図5及び図6に示したTMと
同様のTMによって確立される。SANは、接続可能と
すべきでないある特定の接続から外すために、完全には
接続しない可能性がある。例えば、あるホストは特定の
ストレージ装置に対するデータの格納及び検索を制限さ
れるかもしれない。システム管理者は、メインフレーム
がNTデータを破損又は破壊する能力を持たないよう
に、NTホストがデータを特定の装置に格納することを
可能とすることができよう。
CPを初期化することで継続する(ステップ802)。
TCWは、時間ウィンドウであり、また時間の値、通常
は秒ないし分のオーダーで要求する。SCPは、SDT
から選択されたパスのすべてのセットを含んでいる。こ
れらのパスは、周知のホストとストレージ装置との間、
ホストとホストの間、ストレージ装置とストレージ装置
との間の関係を反映するもので、該関係はトポロジ・マ
ッピングによって確立される。再びここで指摘しておく
べきことは、セカンダリCAMはプライマリCAMに格
納されているデータ構造及び値を保全することである。
(ステップ803)、RDAを用いてエラーを処理する
(ステップ804)。RDAプロセスが終了したかどう
かについての判断を行い(ステップ805)、もし終了
していなければ、プロセスはステップ803に戻ってさ
らにエラーを受け取り、かつ処理する。もし終了してい
れば、SAN端末間障害分離のための初期化プロセスが
完了する。
例えば図9のステップ804をさらに詳細に説明するフ
ローチャートである。プロセスは、新しいエラーを受け
取ることによって開始し(ステップ810)、エラー、
エラーが生じた時間、及びエラーの重大度(高、中、
低)を報告する構成要素を示すためにSDTが更新され
る(ステップ811)。エラーが重大度の高いものであ
るかどうかについて判断を行う(ステップ812)。も
し重大度が高ければ、このエラーはメンテナンスを必要
とする障害であると直ちに報告される(ステップ81
3)。続いて、報告されたエラーが交換すべき特定の部
品に関連するかどうかについて判断するために、SPD
ITが問い合わせされる(ステップ814)。もし関連
していなければ、高重大度のエラーの処理が完了する。
もし関連していれば、障害構成要素の交換が指示され
(ステップ815)、高重大度のエラーの処理が完了す
る。
該エラーが中又は低度の重大度からなるエラーであるか
どうかについて判断される(ステップ816)。もしそ
うであるならば、低/中重大度エラーが処理され(ステ
ップ817)、さらに該エラー処理が完了する。
重大度エラーでもなければ、エラーの重大度は誤りとし
て判断され、該エラーが無視される(ステップ81
8)。
この図では、図10のステップ817のように、新たな
低/中重大度エラーの処理を行う方法をより詳細に説明
するためのフローチャートが示されている。SCPは報
告されたエラーによって影響を受けるパスを判断するの
に用いられる。これらのパスにおいて要素のSDTセル
の各々は、新しいエラーを報告している要素を含むもの
で、前のエラー発生に対して順番に問い合わせられる
(ステップ820)。そして、前のエラーの発生が現在
のエラーと空間的に関係しているかどうかについて判断
される(ステップ821)。そして、問い合わせは前の
エラーが現在のエラーと空間と同様に時間的に関係して
いるかどうかについて判断するためにTCWを使用する
(ステップ822)。もし、前のエラーが時間的かつ空
間的に関係しているならば、エラーはSCPに格納され
る(ステップ823)。問い合わせが終了すると、SC
Pは、時間的制約のなかで生じたSDRの適当なパス上
でのすべてのエラーのマッピングが含まれる。
タ構造が組織化され、かつ使用される方法は、システム
・インプリメンテーションに応じて変化するものであっ
てもよい。例えば、SDTからの要素は、SCPにコピ
ーされ、データは空間又は時間に関連していないと判断
させるので、要素をSCPからデリートすることができ
る。
離するためにエラー相関関係/重大度の評価をしなけれ
ばならない。ここで図12を参照する。この図では、低
/中重大度のエラーに対応づけられた障害構成要素につ
いていくつかの可能なケースを説明するフローチャート
が示されている。
成した現在の要素からすべてのエラーが生ずるかどうか
について判断することから開始する(ステップ83
0)。もしそうならば、2つ以上のエラーがSCPに存
在するかどうかについての判断が行われる(ステップ8
31)。もしそうでなければ、現在のエラーの処理が完
了する。もしそうであるならば、現在の要素はメンテナ
ンスを必要とすることが示される(ステップ832)。
次にSPDITは、報告されたエラーが交換すべき特定
の部品と対応づけられているかどうかについて判断する
ために問い合わせられる(ステップ833)。もしそう
であるならば、障害構成要素の交換が指示され(ステッ
プ834)、新たに受信され、低/中重度大エラーが処
理される。
るならば、すべての(2つの以上の)エラーが単一のパ
スに含まれるかどうかについて判断がなされる(ステッ
プ835)。この場合、パス内の任意の要素が報告され
たエラーの根本原因であるかもしれず、また装置ハード
ウェア関連のエラーはリンク又はタイムアウト関連のエ
ラーに優先される。エラーに装置ハードウェアエラーが
含まれるかどうかについて判断がなされる(ステップ8
36)。もし装置ハードウェアが見いだされるならば、
ステップ832〜834と同様にして、関連した要素が
メンテナンスを必要とすることが示される。そして、S
PDITは報告されたエラーが交換すべき特定の部品に
関連づけられているかどうかについて判断するように問
い合わされる。もしそうであるならば、障害構成要素の
交換が指示される。
ア・エラーが含まれていなければ、リンク又はタイムア
ウト・エラーのみが報告されている。この状況によっ
て、リンクの性能の劣化と最終的な障害が導かれる。こ
のような場合、アルゴリズムは最初にエラーを報告して
いる要素を探す(ステップ837)。すなわち、最初の
エラーの優先度が高く、また他のものは最初の発生と関
係があると考えられる。複数のエラーが連鎖的に生じて
いる要素がひとたび見つかると、上記したステップ83
2〜834と同様に、関連した要素がメンテナンスを必
要とすることが示される。そして、SPDITは報告さ
れたエラーが交換すべき特定の部品に関連づけられてい
るかどうかについて判断するように問い合わされる。も
しそうであるならば、障害構成要素の交換が指示され
る。
れていなければ、2つ以上のエラーが多数のパスに生じ
ている。多数のエラーが生じている複数のパス上に任意
の共通の要素が存在するかどうかを判断する(ステップ
838)。もし存在するならば、この場合はそれらのパ
ス上の共通要素分離と(ステップ839)、エラー相関
/重大度の評価の実行とが必要となる。
ANファブリック要素のいずれか一方であることが可能
である。SAN終端又はファブリック要素が唯一の共通
要素であるかどうかの判断が行われる(ステップ84
0)。もしそうであるならば、ステップ832〜834
と同様に、この共通要素の障害があるものとして示さ
れ、メンテナンスが必要とされる。そして、SPDIT
は報告されたエラーが交換すべき特定の部品に関連づけ
られているかどうかについて判断するように問い合わさ
れる。もしそうであるならば、障害構成要素の交換が指
示される。
リック要素が唯一の共通要素でなければ、SAN終端及
びSANファブリック要素の両方が共通要素である。こ
の状況は、今やステップ835での判断の結果に等し
く、プロセスはさらに処理を行うためにステップ836
に分岐する。
エラーがあり、またこれらのエラーに共通の要素が存在
しないならば、多数のエラーの各々に対して別々にリア
ルタイム診断アルゴリズム(RDA)が実行される(ス
テップ841)。このことは希ではなるが、実現可能な
シンリオがTCWに一つ以上のエラーが受信され、該エ
ラーが別々に障害構成要素が生じる場合に起こりうる。
この点で、あたかも各エラーが新しく受信されたエラー
であるかのうように各エラーを処理するために、エラー
・プロセスはステップ804に戻る。
説明に鑑みて明らかである。SAN診断テーブルはSA
Nトポロジ、固有のファイバ・チャンネル・サービス、
及びベンダ特定情報を用いて生成される。本発明は、S
AN問題判別のためにFC固有バンド内及びホスト/装
置特異的バンド外状況/エラー・データ収集の両方をサ
ポートする。そして、リアルタイム診断アルゴリズムは
SAN診断テーブルをトラバースして、障害SAN構成
要素を分離する。この方法論は有利である。なぜなら、
この方法論は管理端末に対する固有のアクセス又は装置
診断が障害構成要素を分離する上で必要とされないよう
にホストのオペレーティング環境に実装することが可能
である。さらに、この方法論は、プラットフォームに対
して独立しており、またSAN問題判別のためにFC固
有バンド内及びホスト/装置特異的バンド外状況/エラ
ー・データ収集の両方をサポートする。
全に機能しているデータ処理システムというかたちで本
発明を説明した一方で、当業者が本発明のプロセスがコ
ンピュータが読み取り可能な媒体の形態及び種々の形態
で分配可能であること、また本発明は分配を実行するた
めに実際に使用される信号保持媒体の特定の種類に関わ
りなく等しく適用されることである。コンピュータが読
み取り可能な媒体の例として、フロッピー・ディスク、
ハード・ディスク・ドライブ、RAM、及びCD−RO
M等の記録可能型媒体、デジタル及びアナログ通信リン
ク等の転送型媒体が挙げられる。
及び説明を目的として行ったが、記述された形態で本発
明を網羅及び限定することを意図したものではない。当
業者は本発明の多くの改良例及び変形例を容易に想到す
ることができよう。また、本発明の原理、実質的な用途
を最良のかたちで説明するために、また、発明の詳細な
説明では、特定の使用形態に適するように様々な修飾が
施された様々な実施の形態を当業者が理解可能となるよ
うに、実施の形態が選択されて記述されている。
の事項を開示する。 (1)ストレージ・エリア・ネットワーク(SAN)内
でのエラーを処理する方法であって、コンピュータ実行
ステップとして、SANトポロジ・マップを生成するス
テップと、SAN問題判別情報テーブル(SPDIT)
を生成するステップと、前記SANトポロジ・マップ及
びSPDITを用いてSAN診断テーブル(SDT)を
生成するステップと、を有することを特徴とするエラー
処理方法。 (2)前記SANトポロジ・マップはSANトポロジ・
テーブルを有し、該SANトポロジ・テーブルの各々の
行が通信アーキテクチャ要素(CAE)に対して一意的
にマッピングされ、また前記SANトポロジ・テーブル
の各々の列がCAEに対して一意的にマッピングされて
おり、CAEはネットワーク・サービス・プロトコルを
介して通信アーキテクチャ管理プログラム(CAM)に
よって首尾よく登録されたネットワーク接続装置であ
り、CAMは前記SANのための問題判別(PD)機能
を有し、またSANのPD情報テーブル(SPDIT)
を保持し、さらに前記通信アーキテクチャ(CA)は前
記SPDITに格納された情報を伝達する能力を有する
すべてのネットワーク接続要素を有することを特徴とす
る上記(1)に記載のエラー処理方法。 (3)前記SPDITは、前記CA上の各プロダクト又
は要素に対応付けられた少なくとも一つのデータ・レコ
ードを有することを特徴とする上記(2)に記載のエラ
ー処理方法。 (4)前記CA上の各プロダクト又は要素に対応付けら
れた少なくとも一つのデータ・レコードは、プロダクト
・ベンダ情報、プロダクト識別子情報、前記プロダクト
又は要素によってサポートされた通信リンクの種類に関
する情報、及び/又は前記プロダクト又は要素によって
報告されるエラー情報の種類に関する情報からなる群か
ら選択される1つ以上のデータ項目をさらに有すること
を特徴とする上記(3)に記載のエラー処理方法。 (5)前記エラー情報の種類は、前記プロダクト又は要
素が拡張リンク・サービス(ELS)登録リンク事象レ
コード(RLIR)をサポートするかどうかを示すこと
を特徴とする上記(4)に記載のエラー処理方法。 (6)前記SDTは、前記CAMによってCAEから受
け取ったエラーと前記SANトポロジ・マップからの情
報とを格納することを特徴とする上記(4)に記載のエ
ラー処理方法。 (7)ストレージ・エリア・ネットワーク(SAN)内
のエラーを処理する方法であって、コンピュータ実行ス
テップとして、通信アーキテクチャ管理プログラム(C
AM)でのエラー・メッセージ受信するステップと、リ
アルタイム診断アルゴリズム(RDA)を用いて前記エ
ラー・メッセージを処理するステップとを有し、前記C
AMは前記SANのため問題判別(PD)機能を有し、
該CAMは前記SANのPD情報テーブル(SPDI
T)を保持し、さらに前記CAMによって管理された通
信アーキテクチャ(CA)は前記SPDITに格納され
た情報を伝達する能力を有するすべてのネットワーク接
続要素を有することを特徴とするエラー処理方法。 (8)前記CAをサポートするネットワークは、バンド
内ファイバ・チャンネル通信リンクとバンド外通信リン
クとを有することを特徴とする上記(7)に記載のエラ
ー処理方法。 (9)前記SANは、前記ネットワークに接続した複数
のストレージ装置と、前記ネットワークに接続した複数
のホスト・コンピュータとをさらに有し、前記複数のホ
スト・コンピュータの少なくとも一つはCAMを有する
ことを特徴とする上記(7)に記載のエラー処理方法。 (10)SANトポロジ・マップを生成するステップ
と、前記SANトポロジ・マップ及び前記SPDITを
用いてSAN診断テーブル(SDT)を生成するステッ
プとを、さらに有することを特徴とする上記(7)に記
載のエラー処理方法。 (11)すでに前記CAMによって受信され、かつ前記
SDTに格納された時間的に関連したエラー・メッセー
ジを検索する一方で、時間的制約障害分離判別に対する
時間的相関ウィンドウ(TCW)の値を用いて前記受信
エラー・メッセージを分析するステップと、すでに前記
CAMによって受信され、かつ前記SDTに格納された
空間的に関連したエラー・メッセージを検索する一方
で、空間的制約障害分離判別に対する空間的相関パス・
データ構造(SCP)を用いて前記受信エラー・メッセ
ージを分析するステップと、をさらに有することを特徴
とする上記(10)に記載のエラー処理方法。 (12)前記受信エラー・メッセージによって示された
エラーの種類に応じた重大度重みを用いて前記受信エラ
ー・メッセージを分析するステップを、さらに有するこ
とを特徴とする上記(11)に記載のエラー方法。 (13)ストレージ・エリア・ネットワーク(SAN)
においてエラー情報を伝達するためのデータ処理システ
ムであって、バンド内ファイバ通信リンクとバンド外通
信リンクとを有し、かつ通信アーキテクチャ(CA)を
サポートするネットワークと、前記ネットワークに接続
した複数のストレージ装置と、前記ネットワークに接続
した複数のホスト・コンピュータとを有し、さらに、前
記複数のホスト・コンピュータの少なくとも一つは、問
題判別(PD)機能を持つ通信アーキテクチャ管理プロ
グラム(CAM)を融資、CAMはSANのPD情報テ
ーブル(SPDIT)を保持し、また前記CAは前記S
PDITに格納された情報を伝達する能力を有するすべ
てのネットワーク接続要素を有することを特徴とするデ
ータ処理システム。 (14)複数のCAMをさらに有し、前記CAはプライ
マリCAMと1つ以上のセカンダリCAMとを有し、ま
たセカンダリCAMはにプライマリCAMに対して重複
的に動作することを特徴とする上記(13)に記載のデ
ータ処理システム。 (15)前記CAは、一つ以上のCA要素(CAE)と
一つ以上のCAノン・パーティシパント(CAN)とを
さらに有し、CAEはネットワーク・サービス・プロト
コルを介してCAMによって首尾よく登録されたネット
ワーク接続装置であり、CANはSANトポロジ発見プ
ロセスを介して存在することがまだ知られていないCA
Mによって登録されていないネットワーク接続装置であ
ることを特徴とする上記(13)に記載のデータ処理シ
ステム。 (16)前記バンド内ファイバ・チャンネル通信リンク
及びバンド外通信リンクは、単一の物理的通信リンクに
よって提供されることを特徴とする上記(13)に記載
のデータ処理システム。 (17)ストレージ・エリア・ネットワーク(SAN)
内のエラーを処理するためのデータ処理システムであっ
て、SANトポロジ・マップを生成するための第1の生
成手段と、SAN問題判別情報テーブル(SPDIT)
を生成するための第2の生成手段と、前記SANトポロ
ジ・マップ及び前記SPDITを用い手SAN診断テー
ブル(SDT)を生成するための第3の生成手段とを、
有することを特徴とするデータ処理システム。 (18)前記SANトポロジ・マップはSANトポロジ
・テーブルを有し、該SANトポロジ・テーブルの各々
の行が通信アーキテクチャ要素(CAE)に対して一意
的にマッピングされ、また前記SANトポロジ・テーブ
ルの各々の列がCAEに対して一意的にマッピングされ
ており、CAEはネットワーク・サービス・プロトコル
を介して通信アーキテクチャ管理プログラム(CAM)
によって首尾よく登録されたネットワーク接続装置であ
り、CAMは前記SANのための問題判別(PD)機能
を有し、またSANのPD情報テーブル(SPDIT)
を保持し、さらに前記通信アーキテクチャ(CA)は前
記SPDITに格納された情報を伝達する能力を有する
すべてのネットワーク接続要素を有することを特徴とす
る上記(17)に記載のデータ処理システム。 (19)前記SPDITは、前記CA上の各プロダクト
又は要素に対応付けられた少なくとも一つのデータ・レ
コードを有することを特徴とする上記(18)に記載の
データ処理システム。 (20)前記CA上の各プロダクト又は要素に対応付け
られた少なくとも一つのデータ・レコードは、プロダク
ト・ベンダ情報、プロダクト識別子情報、前記プロダク
ト又は要素によってサポートされた通信リンクの種類に
関する情報、及び/又は前記プロダクト又は要素によっ
て報告されるエラー情報の種類に関する情報からなる群
から選択される1つ以上のデータ項目をさらに有するこ
とを特徴とする上記(19)に記載のデータ処理システ
ム。 (21)前記エラー情報の種類は、前記プロダクト又は
要素が拡張リンク・サービス(ELS)登録リンク事象
レコード(RLIR)をサポートするかどうかを示すこ
とを特徴とする上記(20)に記載のデータ処理システ
ム。 (22)前記SDTは、前記CAMによってCAEから
受け取ったエラーと前記SANトポロジ・マップからの
情報とを格納することを特徴とする上記(20)に記載
のデータ処理システム。 (23)ストレージ・エリア・ネットワーク(SAN)
内のエラーを処理するデータ処理システムであって、コ
ンピュータ実行ステップとして、通信アーキテクチャ管
理プログラム(CAM)でのエラー・メッセージ受信す
る受信手段と、リアルタイム診断アルゴリズム(RD
A)を用いて前記エラー・メッセージを処理する処理手
段とを有し、前記CAMは前記SANのため問題判別
(PD)機能を有し、該CAMは前記SANのPD情報
テーブル(SPDIT)を保持し、さらに前記CAMに
よって管理された通信アーキテクチャ(CA)は前記S
PDITに格納された情報を伝達する能力を有するすべ
てのネットワーク接続要素を有することを特徴とするデ
ータ処理システム。 (24)前記CAをサポートするネットワークは、バン
ド内ファイバ・チャンネル通信リンクとバンド外通信リ
ンクとを有することを特徴とする上記(23)に記載の
データ処理システム。 (25)前記SANは、前記ネットワークに接続した複
数のストレージ装置と、前記ネットワークに接続した複
数のホスト・コンピュータとをさらに有し、前記複数の
ホスト・コンピュータの少なくとも一つはCAMを有す
ることを特徴とする上記(23)に記載のデータ処理シ
ステム。 (26)SANトポロジ・マップを生成する第1の生成
手段と、前記SANトポロジ・マップ及び前記SPDI
Tを用いてSAN診断テーブル(SDT)を生成する第
2の生成手段とを、さらに有することを特徴とする上記
(23)に記載のデータ処理システム。 (27)すでに前記CAMによって受信され、かつ前記
SDTに格納された時間的に関連したエラー・メッセー
ジを検索する一方で、時間的制約障害分離判別に対する
時間的相関ウィンドウ(TCW)の値を用いて前記受信
エラー・メッセージを分析する第1の分析手段と、すで
に前記CAMによって受信され、かつ前記SDTに格納
された空間的に関連したエラー・メッセージを検索する
一方で、空間的制約障害分離判別に対する空間的相関パ
ス・データ構造(SCP)を用いて前記受信エラー・メ
ッセージを分析する第2の分析手段と、をさらに有する
ことを特徴とする上記(26)に記載のデータ処理シス
テム。 (28)前記受信エラー・メッセージによって示された
エラーの種類に応じた重大度重みを用いて前記受信エラ
ー・メッセージを分析する第3の分析手段を、さらに有
することを特徴とする上記(27)に記載のデータ処理
システム。 (29)ストレージ・エリア・ネットワーク(SAN)
においてエラー情報を伝達するためのデータ処理システ
ムで使用されるコンピュータ読み取り可能媒体のコンピ
ュータ・プログラム・プロダクトであって、SANトポ
ロジ・マップを生成する第1の命令と、SAN問題判別
情報テーブル(SPDIT)を生成する第2の命令と、
前記SANトポロジ・マップ及びSPDITを用いてS
AN診断テーブル(SDT)を生成する第3の命令と、
を有することを特徴とするコンピュータ・プログラム・
プロダクト。 (30)ストレージ・エリア・ネットワーク(SAN)
においてエラー情報を伝達するためのデータ処理システ
ムで使用されるコンピュータ読み取り可能媒体のコンピ
ュータ・プログラム・プロダクトであって、通信アーキ
テクチャ管理プログラム(CAM)でのエラー・メッセ
ージ受信する第1の命令と、リアルタイム診断アルゴリ
ズム(RDA)を用いて前記エラー・メッセージを処理
する第2の命令とを有し、前記CAMは前記SANのた
め問題判別(PD)機能を有し、該CAMは前記SAN
のPD情報テーブル(SPDIT)を保持し、さらに前
記CAMによって管理された通信アーキテクチャ(C
A)は前記SPDITに格納された情報を伝達する能力
を有するすべてのネットワーク接続要素を有することを
特徴とするコンピュータ・プログラム・プロダクト。
的構成を説明するための模式図である。
ムの内部構成要素の一例を説明するためのブロック図で
ある。
されたSAN問題判別方法論に関係するデータ処理シス
テムの通信アーキテクチャを説明するための模式図であ
る。
問題判別情報テーブル(SPDIT)を説明するための
表である。
説明するためのブロック図である。
提供する表である。
ある。
使用される重みを説明するための表である。
障害SAN要素のSAN端末間障害分離用リアルタイム
診断アルゴリズムのプロセスを説明するためのフローチ
ャートである。
一障害SAN要素のSAN端末間障害分離用リアルタイ
ム診断アルゴリズムのプロセスを説明するためのフロー
チャートである。
一障害SAN要素のSAN端末間障害分離用リアルタイ
ム診断アルゴリズムのプロセスを説明するためのフロー
チャートである。
一障害SAN要素のSAN端末間障害分離用リアルタイ
ム診断アルゴリズムのプロセスを説明するためのフロー
チャートである。
モジュール(DIMM) 220,221 PCIブリッジ 222 システム・バス 223 I/O(NIO)プレーナ 224 ネットワーク・アダプタ 225,226 カード・スロット 227,228 PCIバス 229 ハード・ディスク 230 SCSIホスト・アダプタ 231 グラフィック・アダプタ 232 ISAブリッジ 233 NIOコントローラ 234 ISAバス233 235,236 シリアル接続 237 フロッピー・ドライブ接続 238 キーボード接続 239 マウス接続 240 不揮発性RAM(NVRAM) 241 システム・ファームウェア 244 サービス・プロセッサ 300 ネットワーク 302 WindowsNT(登録商標)サーバ 304 メインフレーム・コンピュータ 306 Unix(登録商標)サーバ 308 Linux(登録商標)サーバ 311,312,213 FCスイッチ 321,322,323 共有RAID 324 共有テープ 325 共有テープ 331,332,333,334 通信リンク 341,342,343,344,345,346,3
47,358,349,350,351 バンド内
通信リンク 400 SPDIT 401 ベンダ属性 402 プロダクト識別子 403 情報の種類 404 記述属性 501 FCスイッチ 511,512,513 FCスイッチポート 521,522,523 CAE
Claims (30)
- 【請求項1】ストレージ・エリア・ネットワーク(SA
N)内でのエラーを処理する方法であって、コンピュー
タ実行ステップとして、 SANトポロジ・マップを生成するステップと、 SAN問題判別情報テーブル(SPDIT)を生成する
ステップと、 前記SANトポロジ・マップ及びSPDITを用いてS
AN診断テーブル(SDT)を生成するステップと、 を有することを特徴とするエラー処理方法。 - 【請求項2】前記SANトポロジ・マップはSANトポ
ロジ・テーブルを有し、該SANトポロジ・テーブルの
各々の行が通信アーキテクチャ要素(CAE)に対して
一意的にマッピングされ、また前記SANトポロジ・テ
ーブルの各々の列がCAEに対して一意的にマッピング
されており、CAEはネットワーク・サービス・プロト
コルを介して通信アーキテクチャ管理プログラム(CA
M)によって首尾よく登録されたネットワーク接続装置
であり、CAMは前記SANのための問題判別(PD)
機能を有し、またSANのPD情報テーブル(SPDI
T)を保持し、さらに前記通信アーキテクチャ(CA)
は前記SPDITに格納された情報を伝達する能力を有
するすべてのネットワーク接続要素を有することを特徴
とする請求項1に記載のエラー処理方法。 - 【請求項3】前記SPDITは、前記CA上の各プロダ
クト又は要素に対応付けられた少なくとも一つのデータ
・レコードを有することを特徴とする請求項2に記載の
エラー処理方法。 - 【請求項4】前記CA上の各プロダクト又は要素に対応
付けられた少なくとも一つのデータ・レコードは、プロ
ダクト・ベンダ情報、プロダクト識別子情報、前記プロ
ダクト又は要素によってサポートされた通信リンクの種
類に関する情報、及び/又は前記プロダクト又は要素に
よって報告されるエラー情報の種類に関する情報からな
る群から選択される1つ以上のデータ項目をさらに有す
ることを特徴とする請求項3に記載のエラー処理方法。 - 【請求項5】前記エラー情報の種類は、前記プロダクト
又は要素が拡張リンク・サービス(ELS)登録リンク
事象レコード(RLIR)をサポートするかどうかを示
すことを特徴とする請求項4に記載のエラー処理方法。 - 【請求項6】前記SDTは、前記CAMによってCAE
から受け取ったエラーと前記SANトポロジ・マップか
らの情報とを格納することを特徴とする請求項4に記載
のエラー処理方法。 - 【請求項7】ストレージ・エリア・ネットワーク(SA
N)内のエラーを処理する方法であって、コンピュータ
実行ステップとして、 通信アーキテクチャ管理プログラム(CAM)でのエラ
ー・メッセージ受信するステップと、 リアルタイム診断アルゴリズム(RDA)を用いて前記
エラー・メッセージを処理するステップとを有し、 前記CAMは前記SANのため問題判別(PD)機能を
有し、該CAMは前記SANのPD情報テーブル(SP
DIT)を保持し、さらに前記CAMによって管理され
た通信アーキテクチャ(CA)は前記SPDITに格納
された情報を伝達する能力を有するすべてのネットワー
ク接続要素を有することを特徴とするエラー処理方法。 - 【請求項8】前記CAをサポートするネットワークは、
バンド内ファイバ・チャンネル通信リンクとバンド外通
信リンクとを有することを特徴とする請求項7に記載の
エラー処理方法。 - 【請求項9】前記SANは、前記ネットワークに接続し
た複数のストレージ装置と、 前記ネットワークに接続した複数のホスト・コンピュー
タとをさらに有し、 前記複数のホスト・コンピュータの少なくとも一つはC
AMを有することを特徴とする請求項7に記載のエラー
処理方法。 - 【請求項10】SANトポロジ・マップを生成するステ
ップと、 前記SANトポロジ・マップ及び前記SPDITを用い
てSAN診断テーブル(SDT)を生成するステップと
を、さらに有することを特徴とする請求項7に記載のエ
ラー処理方法。 - 【請求項11】すでに前記CAMによって受信され、か
つ前記SDTに格納された時間的に関連したエラー・メ
ッセージを検索する一方で、時間的制約障害分離判別に
対する時間的相関ウィンドウ(TCW)の値を用いて前
記受信エラー・メッセージを分析するステップと、 すでに前記CAMによって受信され、かつ前記SDTに
格納された空間的に関連したエラー・メッセージを検索
する一方で、空間的制約障害分離判別に対する空間的相
関パス・データ構造(SCP)を用いて前記受信エラー
・メッセージを分析するステップと、 をさらに有することを特徴とする請求項10に記載のエ
ラー処理方法。 - 【請求項12】前記受信エラー・メッセージによって示
されたエラーの種類に応じた重大度重みを用いて前記受
信エラー・メッセージを分析するステップを、さらに有
することを特徴とする請求項11に記載のエラー方法。 - 【請求項13】ストレージ・エリア・ネットワーク(S
AN)においてエラー情報を伝達するためのデータ処理
システムであって、 バンド内ファイバ通信リンクとバンド外通信リンクとを
有し、かつ通信アーキテクチャ(CA)をサポートする
ネットワークと、 前記ネットワークに接続した複数のストレージ装置と、 前記ネットワークに接続した複数のホスト・コンピュー
タとを有し、さらに、 前記複数のホスト・コンピュータの少なくとも一つは、
問題判別(PD)機能を持つ通信アーキテクチャ管理プ
ログラム(CAM)を融資、CAMはSANのPD情報
テーブル(SPDIT)を保持し、また前記CAは前記
SPDITに格納された情報を伝達する能力を有するす
べてのネットワーク接続要素を有することを特徴とする
データ処理システム。 - 【請求項14】複数のCAMをさらに有し、前記CAは
プライマリCAMと1つ以上のセカンダリCAMとを有
し、またセカンダリCAMはにプライマリCAMに対し
て重複的に動作することを特徴とする請求項13に記載
のデータ処理システム。 - 【請求項15】前記CAは、一つ以上のCA要素(CA
E)と一つ以上のCAノン・パーティシパント(CA
N)とをさらに有し、CAEはネットワーク・サービス
・プロトコルを介してCAMによって首尾よく登録され
たネットワーク接続装置であり、CANはSANトポロ
ジ発見プロセスを介して存在することがまだ知られてい
ないCAMによって登録されていないネットワーク接続
装置であることを特徴とする請求項13に記載のデータ
処理システム。 - 【請求項16】前記バンド内ファイバ・チャンネル通信
リンク及びバンド外通信リンクは、単一の物理的通信リ
ンクによって提供されることを特徴とする請求項13に
記載のデータ処理システム。 - 【請求項17】ストレージ・エリア・ネットワーク(S
AN)内のエラーを処理するためのデータ処理システム
であって、 SANトポロジ・マップを生成するための第1の生成手
段と、 SAN問題判別情報テーブル(SPDIT)を生成する
ための第2の生成手段と、 前記SANトポロジ・マップ及び前記SPDITを用い
手SAN診断テーブル(SDT)を生成するための第3
の生成手段とを、 有することを特徴とするデータ処理システム。 - 【請求項18】前記SANトポロジ・マップはSANト
ポロジ・テーブルを有し、該SANトポロジ・テーブル
の各々の行が通信アーキテクチャ要素(CAE)に対し
て一意的にマッピングされ、また前記SANトポロジ・
テーブルの各々の列がCAEに対して一意的にマッピン
グされており、CAEはネットワーク・サービス・プロ
トコルを介して通信アーキテクチャ管理プログラム(C
AM)によって首尾よく登録されたネットワーク接続装
置であり、CAMは前記SANのための問題判別(P
D)機能を有し、またSANのPD情報テーブル(SP
DIT)を保持し、さらに前記通信アーキテクチャ(C
A)は前記SPDITに格納された情報を伝達する能力
を有するすべてのネットワーク接続要素を有することを
特徴とする請求項17に記載のデータ処理システム。 - 【請求項19】前記SPDITは、前記CA上の各プロ
ダクト又は要素に対応付けられた少なくとも一つのデー
タ・レコードを有することを特徴とする請求項18に記
載のデータ処理システム。 - 【請求項20】前記CA上の各プロダクト又は要素に対
応付けられた少なくとも一つのデータ・レコードは、プ
ロダクト・ベンダ情報、プロダクト識別子情報、前記プ
ロダクト又は要素によってサポートされた通信リンクの
種類に関する情報、及び/又は前記プロダクト又は要素
によって報告されるエラー情報の種類に関する情報から
なる群から選択される1つ以上のデータ項目をさらに有
することを特徴とする請求項19に記載のデータ処理シ
ステム。 - 【請求項21】前記エラー情報の種類は、前記プロダク
ト又は要素が拡張リンク・サービス(ELS)登録リン
ク事象レコード(RLIR)をサポートするかどうかを
示すことを特徴とする請求項20に記載のデータ処理シ
ステム。 - 【請求項22】前記SDTは、前記CAMによってCA
Eから受け取ったエラーと前記SANトポロジ・マップ
からの情報とを格納することを特徴とする請求項20に
記載のデータ処理システム。 - 【請求項23】ストレージ・エリア・ネットワーク(S
AN)内のエラーを処理するデータ処理システムであっ
て、コンピュータ実行ステップとして、 通信アーキテクチャ管理プログラム(CAM)でのエラ
ー・メッセージ受信する受信手段と、 リアルタイム診断アルゴリズム(RDA)を用いて前記
エラー・メッセージを処理する処理手段とを有し、 前記CAMは前記SANのため問題判別(PD)機能を
有し、該CAMは前記SANのPD情報テーブル(SP
DIT)を保持し、さらに前記CAMによって管理され
た通信アーキテクチャ(CA)は前記SPDITに格納
された情報を伝達する能力を有するすべてのネットワー
ク接続要素を有することを特徴とするデータ処理システ
ム。 - 【請求項24】前記CAをサポートするネットワーク
は、バンド内ファイバ・チャンネル通信リンクとバンド
外通信リンクとを有することを特徴とする請求項23に
記載のデータ処理システム。 - 【請求項25】前記SANは、前記ネットワークに接続
した複数のストレージ装置と、 前記ネットワークに接続した複数のホスト・コンピュー
タとをさらに有し、 前記複数のホスト・コンピュータの少なくとも一つはC
AMを有することを特徴とする請求項23に記載のデー
タ処理システム。 - 【請求項26】SANトポロジ・マップを生成する第1
の生成手段と、 前記SANトポロジ・マップ及び前記SPDITを用い
てSAN診断テーブル(SDT)を生成する第2の生成
手段とを、さらに有することを特徴とする請求項23に
記載のデータ処理システム。 - 【請求項27】すでに前記CAMによって受信され、か
つ前記SDTに格納された時間的に関連したエラー・メ
ッセージを検索する一方で、時間的制約障害分離判別に
対する時間的相関ウィンドウ(TCW)の値を用いて前
記受信エラー・メッセージを分析する第1の分析手段
と、 すでに前記CAMによって受信され、かつ前記SDTに
格納された空間的に関連したエラー・メッセージを検索
する一方で、空間的制約障害分離判別に対する空間的相
関パス・データ構造(SCP)を用いて前記受信エラー
・メッセージを分析する第2の分析手段と、 をさらに有することを特徴とする請求項26に記載のデ
ータ処理システム。 - 【請求項28】前記受信エラー・メッセージによって示
されたエラーの種類に応じた重大度重みを用いて前記受
信エラー・メッセージを分析する第3の分析手段を、さ
らに有することを特徴とする請求項27に記載のデータ
処理システム。 - 【請求項29】ストレージ・エリア・ネットワーク(S
AN)においてエラー情報を伝達するためのデータ処理
システムで使用されるコンピュータ読み取り可能媒体の
コンピュータ・プログラム・プロダクトであって、 SANトポロジ・マップを生成する第1の命令と、 SAN問題判別情報テーブル(SPDIT)を生成する
第2の命令と、 前記SANトポロジ・マップ及びSPDITを用いてS
AN診断テーブル(SDT)を生成する第3の命令と、 を有することを特徴とするコンピュータ・プログラム・
プロダクト。 - 【請求項30】ストレージ・エリア・ネットワーク(S
AN)においてエラー情報を伝達するためのデータ処理
システムで使用されるコンピュータ読み取り可能媒体の
コンピュータ・プログラム・プロダクトであって、 通信アーキテクチャ管理プログラム(CAM)でのエラ
ー・メッセージ受信する第1の命令と、 リアルタイム診断アルゴリズム(RDA)を用いて前記
エラー・メッセージを処理する第2の命令とを有し、 前記CAMは前記SANのため問題判別(PD)機能を
有し、該CAMは前記SANのPD情報テーブル(SP
DIT)を保持し、さらに前記CAMによって管理され
た通信アーキテクチャ(CA)は前記SPDITに格納
された情報を伝達する能力を有するすべてのネットワー
ク接続要素を有することを特徴とするコンピュータ・プ
ログラム・プロダクト。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/478306 | 2000-01-06 | ||
US09/478,306 US6636981B1 (en) | 2000-01-06 | 2000-01-06 | Method and system for end-to-end problem determination and fault isolation for storage area networks |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001249856A true JP2001249856A (ja) | 2001-09-14 |
JP3752150B2 JP3752150B2 (ja) | 2006-03-08 |
Family
ID=23899377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000397033A Expired - Fee Related JP3752150B2 (ja) | 2000-01-06 | 2000-12-27 | ストレージ・エリア・ネットワーク(san)内でのエラー処理方法及びデータ処理システム |
Country Status (5)
Country | Link |
---|---|
US (1) | US6636981B1 (ja) |
EP (1) | EP1115225B1 (ja) |
JP (1) | JP3752150B2 (ja) |
AT (1) | ATE409996T1 (ja) |
DE (1) | DE60040382D1 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003099291A (ja) * | 2001-09-21 | 2003-04-04 | Hitachi Ltd | ネットワークストレージシステム及びその制御方法 |
WO2004092964A1 (ja) * | 2003-04-10 | 2004-10-28 | Fujitsu Limited | 関係管理制御プログラム、装置、及びシステム |
JP2006072717A (ja) * | 2004-09-02 | 2006-03-16 | Hitachi Ltd | ディスクサブシステム |
US7076688B2 (en) | 2003-07-02 | 2006-07-11 | Hiatchi, Ltd. | Failure information management method and management server in a network equipped with a storage device |
US7406622B2 (en) | 2002-10-07 | 2008-07-29 | Hitachi, Ltd. | volume and failure management method on a network having a storage device |
US7428584B2 (en) | 2002-10-07 | 2008-09-23 | Hitachi, Ltd. | Method for managing a network including a storage system |
JP2014137806A (ja) * | 2013-01-18 | 2014-07-28 | Fujitsu Ltd | 故障通知装置、故障通知方法、及び故障通知プログラム |
Families Citing this family (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8281022B1 (en) * | 2000-06-30 | 2012-10-02 | Emc Corporation | Method and apparatus for implementing high-performance, scaleable data processing and storage systems |
US7401139B1 (en) * | 2000-09-07 | 2008-07-15 | International Business Machines Corporation | Storage area network management and configuration method and apparatus via enabling in-band communications |
US20020165952A1 (en) * | 2000-10-20 | 2002-11-07 | Sewell James M. | Systems and methods for remote management of diagnostic devices and data associated therewith |
US7027411B1 (en) * | 2000-10-31 | 2006-04-11 | Hewlett-Packard Development Company, L.P. | Method and system for identifying and processing changes to a network topology |
US20020129230A1 (en) * | 2001-03-08 | 2002-09-12 | Sun Microsystems, Inc. | Method, System, and program for determining system configuration information |
US6766466B1 (en) * | 2001-05-15 | 2004-07-20 | Lsi Logic Corporation | System and method for isolating fibre channel failures in a SAN environment |
US20020191649A1 (en) * | 2001-06-13 | 2002-12-19 | Woodring Sherrie L. | Port mirroring in channel directors and switches |
US20030055932A1 (en) * | 2001-09-19 | 2003-03-20 | Dell Products L.P. | System and method for configuring a storage area network |
US7349961B2 (en) * | 2001-12-07 | 2008-03-25 | Hitachi, Ltd. | Detecting configuration inconsistency in storage networks |
US7509405B2 (en) | 2002-01-30 | 2009-03-24 | Hewlett-Packard Development Company, L.P. | Method and apparatus for inferring topology of a network |
US6973595B2 (en) | 2002-04-05 | 2005-12-06 | International Business Machines Corporation | Distributed fault detection for data storage networks |
US20030212785A1 (en) * | 2002-05-08 | 2003-11-13 | Jibbe Mahmoud K. | System and method for isolating faulty connections in a storage area network |
US7315960B2 (en) * | 2002-05-31 | 2008-01-01 | Hitachi, Ltd. | Storage area network system |
US20030237017A1 (en) * | 2002-06-24 | 2003-12-25 | Jibbe Mahmoud Khaled | Component fault isolation in a storage area network |
US7260628B2 (en) * | 2002-09-06 | 2007-08-21 | Hitachi, Ltd. | Event notification in storage networks |
US7617320B2 (en) * | 2002-10-23 | 2009-11-10 | Netapp, Inc. | Method and system for validating logical end-to-end access paths in storage area networks |
US7961594B2 (en) * | 2002-10-23 | 2011-06-14 | Onaro, Inc. | Methods and systems for history analysis for access paths in networks |
US7546333B2 (en) * | 2002-10-23 | 2009-06-09 | Netapp, Inc. | Methods and systems for predictive change management for access paths in networks |
US6909992B2 (en) * | 2002-11-05 | 2005-06-21 | Sun Microsystems, Inc. | Automatically identifying replacement times for limited lifetime components |
KR100680626B1 (ko) * | 2002-12-20 | 2007-02-09 | 인터내셔널 비지네스 머신즈 코포레이션 | 비신뢰 서버 환경에서 san 관리용 보안 시스템 및 방법 |
JP2004259079A (ja) * | 2003-02-27 | 2004-09-16 | Hitachi Ltd | データ処理システム |
JP4294353B2 (ja) * | 2003-03-28 | 2009-07-08 | 株式会社日立製作所 | ジョブ管理機能を有するストレージ系障害管理方法及び装置 |
US8560671B1 (en) * | 2003-10-23 | 2013-10-15 | Netapp, Inc. | Systems and methods for path-based management of virtual servers in storage network environments |
US7383313B2 (en) * | 2003-11-05 | 2008-06-03 | Hitachi, Ltd. | Apparatus and method of heartbeat mechanism using remote mirroring link for multiple storage system |
US7610372B2 (en) * | 2004-01-27 | 2009-10-27 | Ricoh Company, Ltd. | Method and system for managing vendor and model information in a multi-protocol remote monitoring system |
JP2005258632A (ja) * | 2004-03-10 | 2005-09-22 | Hitachi Ltd | ネットワークストレージ装置の導通確認方法およびホスト計算機 |
US20060129998A1 (en) * | 2004-03-31 | 2006-06-15 | Danilo Florissi | Method and apparatus for analyzing and problem reporting in storage area networks |
WO2005106694A2 (en) * | 2004-04-23 | 2005-11-10 | Onaro | Methods and systems for history analysis and predictive change management for access paths in networks |
JP4495508B2 (ja) * | 2004-04-23 | 2010-07-07 | 株式会社日立製作所 | 計算機システムの構成管理方法および構成管理装置 |
US7404108B2 (en) * | 2004-08-06 | 2008-07-22 | International Business Machines Corporation | Notification method and apparatus in a data processing system |
DE102004041898A1 (de) * | 2004-08-30 | 2006-03-09 | Siemens Ag | Verfahren und Vorrichtung zur Diagnose bei Servicesystemen für technische Anlagen |
US7457871B2 (en) * | 2004-10-07 | 2008-11-25 | International Business Machines Corporation | System, method and program to identify failed components in storage area network |
US7188346B2 (en) | 2004-11-29 | 2007-03-06 | International Business Machines Corporation | Method, system and program product for correlating data between operating environments |
US20060174167A1 (en) * | 2005-01-28 | 2006-08-03 | Hitachi, Ltd. | Self-creating maintenance database |
US7489639B2 (en) * | 2005-03-23 | 2009-02-10 | International Business Machines Corporation | Root-cause analysis of network performance problems |
US20070030415A1 (en) * | 2005-05-16 | 2007-02-08 | Epstein Kenneth A | Back-lit displays with high illumination uniformity |
US20060271677A1 (en) * | 2005-05-24 | 2006-11-30 | Mercier Christina W | Policy based data path management, asset management, and monitoring |
EP2492813A3 (en) * | 2005-09-27 | 2013-01-30 | Onaro | Method And Systems For Validating Accessibility And Currency Of Replicated Data |
US7793138B2 (en) * | 2005-12-21 | 2010-09-07 | Cisco Technology, Inc. | Anomaly detection for storage traffic in a data center |
US7607043B2 (en) * | 2006-01-04 | 2009-10-20 | International Business Machines Corporation | Analysis of mutually exclusive conflicts among redundant devices |
US7395187B2 (en) | 2006-02-06 | 2008-07-01 | International Business Machines Corporation | System and method for recording behavior history for abnormality detection |
JP5068023B2 (ja) * | 2006-03-29 | 2012-11-07 | 株式会社日立製作所 | 計算機システム及び論理パス切替方法 |
FR2901648A1 (fr) * | 2006-05-29 | 2007-11-30 | France Telecom | Diffusion d'images utilisant un canal de retour |
US7720889B1 (en) | 2006-10-31 | 2010-05-18 | Netapp, Inc. | System and method for nearly in-band search indexing |
JP4949804B2 (ja) * | 2006-11-07 | 2012-06-13 | 株式会社日立製作所 | 統合管理計算機と記憶装置管理方法および計算機システム |
US8826032B1 (en) | 2006-12-27 | 2014-09-02 | Netapp, Inc. | Systems and methods for network change discovery and host name resolution in storage network environments |
US8332860B1 (en) | 2006-12-30 | 2012-12-11 | Netapp, Inc. | Systems and methods for path-based tier-aware dynamic capacity management in storage network environments |
US8868495B2 (en) * | 2007-02-21 | 2014-10-21 | Netapp, Inc. | System and method for indexing user data on storage systems |
US9042263B1 (en) | 2007-04-06 | 2015-05-26 | Netapp, Inc. | Systems and methods for comparative load analysis in storage networks |
US8832495B2 (en) | 2007-05-11 | 2014-09-09 | Kip Cr P1 Lp | Method and system for non-intrusive monitoring of library components |
US8204980B1 (en) * | 2007-06-28 | 2012-06-19 | Emc Corporation | Storage array network path impact analysis server for path selection in a host-based I/O multi-path system |
US20090172012A1 (en) * | 2007-12-28 | 2009-07-02 | Chellam Sudhakar V | Methodology to derive enterprise relationships for generating a topology view in a SOA environment |
EP2248003A1 (en) * | 2007-12-31 | 2010-11-10 | Netapp, Inc. | System and method for automatic storage load balancing in virtual server environments |
US20090183030A1 (en) * | 2008-01-14 | 2009-07-16 | Bethke Bob | Episodic cause analysis |
US8180718B2 (en) * | 2008-01-14 | 2012-05-15 | Hewlett-Packard Development Company, L.P. | Engine for performing root cause and effect analysis |
US8447719B2 (en) * | 2008-01-14 | 2013-05-21 | Hewlett-Packard Development Company, L.P. | Compilation of causal rules into continuations |
US7974215B1 (en) | 2008-02-04 | 2011-07-05 | Crossroads Systems, Inc. | System and method of network diagnosis |
US8365019B2 (en) * | 2009-06-16 | 2013-01-29 | International Business Machines Corporation | System and method for incident management enhanced with problem classification for technical support services |
US8181069B2 (en) * | 2009-09-08 | 2012-05-15 | International Business Machines Corporation | Method and system for problem determination using probe collections and problem classification for the technical support services |
US9866633B1 (en) * | 2009-09-25 | 2018-01-09 | Kip Cr P1 Lp | System and method for eliminating performance impact of information collection from media drives |
US8631281B1 (en) | 2009-12-16 | 2014-01-14 | Kip Cr P1 Lp | System and method for archive verification using multiple attempts |
US9015362B2 (en) | 2010-07-16 | 2015-04-21 | International Business Machines Corporation | Monitoring network performance and detecting network faults using round trip transmission times |
US8549361B2 (en) * | 2010-12-21 | 2013-10-01 | Netapp, Inc. | System and method for construction, fault isolation, and recovery of cabling topology in a storage area network |
US9329790B2 (en) * | 2010-12-27 | 2016-05-03 | International Business Machines Corporation | Method and system for managing a storage network to reduce power consumption |
US9256500B2 (en) * | 2013-04-12 | 2016-02-09 | Oracle International Corporation | Physical domain error isolation and recovery in a multi-domain system |
US20160191359A1 (en) * | 2013-08-15 | 2016-06-30 | Hewlett Packard Enterprise Development Lp | Reactive diagnostics in storage area networks |
US9258242B1 (en) | 2013-12-19 | 2016-02-09 | Emc Corporation | Path selection using a service level objective |
RU2013156784A (ru) | 2013-12-20 | 2015-06-27 | ИЭмСи КОРПОРЕЙШН | Способ и устройство выбора маршрута чтения и записи данных |
WO2017078662A1 (en) * | 2015-11-02 | 2017-05-11 | Hewlett Packard Enterprise Development Lp | Storage area network diagnostic data |
US10802932B2 (en) * | 2017-12-04 | 2020-10-13 | Nxp Usa, Inc. | Data processing system having lockstep operation |
US11042320B2 (en) | 2019-02-18 | 2021-06-22 | International Business Machines Corporation | Problem diagnosis in complex SAN environments |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3734051B2 (ja) * | 1995-09-28 | 2006-01-11 | 日立ソフトウエアエンジニアリング株式会社 | ネットワーク管理システム |
US5835720A (en) * | 1996-05-17 | 1998-11-10 | Sun Microsystems, Inc. | IP discovery apparatus and method |
US5832196A (en) * | 1996-06-28 | 1998-11-03 | Mci Communications Corporation | Dynamic restoration process for a telecommunications network |
US5926463A (en) * | 1997-10-06 | 1999-07-20 | 3Com Corporation | Method and apparatus for viewing and managing a configuration of a computer network |
US6256740B1 (en) * | 1998-02-06 | 2001-07-03 | Ncr Corporation | Name service for multinode system segmented into I/O and compute nodes, generating guid at I/O node and exporting guid to compute nodes via interconnect fabric |
US6230281B1 (en) * | 1998-08-26 | 2001-05-08 | Lucent Technologies, Inc. | Geographic redundancy protection method and apparatus for a communications network |
US6108702A (en) * | 1998-12-02 | 2000-08-22 | Micromuse, Inc. | Method and apparatus for determining accurate topology features of a network |
US6243746B1 (en) * | 1998-12-04 | 2001-06-05 | Sun Microsystems, Inc. | Method and implementation for using computer network topology objects |
US6349333B1 (en) * | 1998-12-04 | 2002-02-19 | Sun Microsystems, Inc. | Platform independent alarm service for manipulating managed objects in a distributed network management system |
US6356282B2 (en) * | 1998-12-04 | 2002-03-12 | Sun Microsystems, Inc. | Alarm manager system for distributed network management system |
US6115361A (en) * | 1999-01-06 | 2000-09-05 | Mcdata Corporation | Link incident reporting extended link service for networks |
-
2000
- 2000-01-06 US US09/478,306 patent/US6636981B1/en not_active Expired - Lifetime
- 2000-12-22 EP EP00311661A patent/EP1115225B1/en not_active Expired - Lifetime
- 2000-12-22 DE DE60040382T patent/DE60040382D1/de not_active Expired - Lifetime
- 2000-12-22 AT AT00311661T patent/ATE409996T1/de not_active IP Right Cessation
- 2000-12-27 JP JP2000397033A patent/JP3752150B2/ja not_active Expired - Fee Related
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003099291A (ja) * | 2001-09-21 | 2003-04-04 | Hitachi Ltd | ネットワークストレージシステム及びその制御方法 |
US7937614B2 (en) | 2002-10-07 | 2011-05-03 | Hitachi, Ltd. | Volume and failure management method on a network having a storage device |
US7406622B2 (en) | 2002-10-07 | 2008-07-29 | Hitachi, Ltd. | volume and failure management method on a network having a storage device |
US7409583B2 (en) | 2002-10-07 | 2008-08-05 | Hitachi, Ltd. | Volume and failure management method on a network having a storage device |
US7428584B2 (en) | 2002-10-07 | 2008-09-23 | Hitachi, Ltd. | Method for managing a network including a storage system |
US7669077B2 (en) | 2002-10-07 | 2010-02-23 | Hitachi, Ltd. | Volume and failure management method on a network having a storage device |
US8397102B2 (en) | 2002-10-07 | 2013-03-12 | Hitachi, Ltd. | Volume and failure management method on a network having a storage device |
WO2004092964A1 (ja) * | 2003-04-10 | 2004-10-28 | Fujitsu Limited | 関係管理制御プログラム、装置、及びシステム |
US8380823B2 (en) | 2003-04-10 | 2013-02-19 | Fujitsu Limited | Storage medium storing relation management control program, device, and system |
US7076688B2 (en) | 2003-07-02 | 2006-07-11 | Hiatchi, Ltd. | Failure information management method and management server in a network equipped with a storage device |
JP2006072717A (ja) * | 2004-09-02 | 2006-03-16 | Hitachi Ltd | ディスクサブシステム |
US7702823B2 (en) | 2004-09-02 | 2010-04-20 | Hitachi, Ltd. | Disk subsystem monitoring fault |
JP2014137806A (ja) * | 2013-01-18 | 2014-07-28 | Fujitsu Ltd | 故障通知装置、故障通知方法、及び故障通知プログラム |
Also Published As
Publication number | Publication date |
---|---|
EP1115225B1 (en) | 2008-10-01 |
US6636981B1 (en) | 2003-10-21 |
EP1115225A3 (en) | 2004-11-24 |
DE60040382D1 (de) | 2008-11-13 |
ATE409996T1 (de) | 2008-10-15 |
EP1115225A2 (en) | 2001-07-11 |
JP3752150B2 (ja) | 2006-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3752150B2 (ja) | ストレージ・エリア・ネットワーク(san)内でのエラー処理方法及びデータ処理システム | |
US7340649B2 (en) | System and method for determining fault isolation in an enterprise computing system | |
US6973595B2 (en) | Distributed fault detection for data storage networks | |
US8843789B2 (en) | Storage array network path impact analysis server for path selection in a host-based I/O multi-path system | |
JP4433967B2 (ja) | マルチサイト上の遠隔二重化リンクを経由するハートビート装置、及びその使用方法 | |
US6865157B1 (en) | Fault tolerant shared system resource with communications passthrough providing high availability communications | |
US6594775B1 (en) | Fault handling monitor transparently using multiple technologies for fault handling in a multiple hierarchal/peer domain file server with domain centered, cross domain cooperative fault handling mechanisms | |
US6292905B1 (en) | Method for providing a fault tolerant network using distributed server processes to remap clustered network resources to other servers during server failure | |
US6832341B1 (en) | Fault event management using fault monitoring points | |
US8060650B2 (en) | Diagnosing a path in a storage network | |
US7315963B2 (en) | System and method for detecting errors in a network | |
US8370466B2 (en) | Method and system for providing operator guidance in network and systems management | |
US20030158933A1 (en) | Failover clustering based on input/output processors | |
JP4588500B2 (ja) | ストレージ・エリア・ネットワークにおけるストレージセッション管理システム | |
US20040153710A1 (en) | Multiple hierarichal/peer domain file server with domain based, cross domain cooperative fault handling mechanisms | |
US5761428A (en) | Method and aparatus for providing agent capability independent from a network node | |
CN107870832B (zh) | 基于多维度健康诊断方法的多路径存储设备 | |
US20070174663A1 (en) | Analysis of mutually exclusive conflicts among redundant devices | |
US20140156832A1 (en) | Monitoring the health of distributed systems | |
US7860015B1 (en) | Methods and apparatus for physical and logical SAN fabric analysis | |
US7606986B1 (en) | System and method for resolving SAN fabric partitions | |
US7475076B1 (en) | Method and apparatus for providing remote alert reporting for managed resources | |
JP2003167794A (ja) | Sanのアクセスパスの診断システム | |
US7143316B2 (en) | Fault diagnosis in a network | |
US6675259B2 (en) | Method and apparatus for validating and ranking disk units for switching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20031222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040120 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20040213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040213 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20040419 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20040422 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040430 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20041116 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20041124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050210 Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20050210 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20050210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20050210 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050419 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20051110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20051110 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20051110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051209 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081216 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091216 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091216 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101216 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101216 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111216 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111216 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121216 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121216 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131216 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |