JP3536829B2

JP3536829B2 - Ｆｃ−ａｌシステムのリンク診断方法及び装置

Info

Publication number: JP3536829B2
Application number: JP2001180240A
Authority: JP
Inventors: 雅也末永
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2001-06-14
Filing date: 2001-06-14
Publication date: 2004-06-14
Anticipated expiration: 2021-06-14
Also published as: US7280485B2; JP2002374271A; US20020191537A1

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ファイバーチャネ
ルアービトレイテッドループ（以下ＦＣ−ＡＬと記す）
システムのリンク診断方法及びリンク診断装置に係り、
詳しくは各ノード毎の障害履歴に基づいてループ障害を
発生させる可能性の高いノードを推定し、リンク障害等
のループに係る故障が発生した際に、障害発生の可能性
の高いノード順にループから切り離すことで、障害発生
ノードを短時間で検出できるようにしたＦＣ−ＡＬシス
テムのリンク診断方法及びリンク診断装置に関する。

【０００２】

【従来の技術】コンピュータとストレージ装置等とを接
続するための方式の１つとしてファイバーチャネルが知
られており、ファイバーチャネルの接続形態の１つとし
てＦＣ−ＡＬが知られている。ファイバーチャネルに接
続する各種機器はノード（ノード装置）と呼ばれてい
る。ＦＣ−ＡＬは、ＦＣポートの送信部と受信部を複数
のノードにわたって数珠つなぎに１周させたリング型
（ループ型）の接続形態をとる。このため、ＦＣ−ＡＬ
接続で構成されたシステムでは、いずれかのノードに障
害が発生するとシステム全体の動作が停止してしまうお
それがある。そこで、各ノード毎にポートバイパス回路
を設けて、障害が発生したノードをループから切り離せ
る構成としている。

【０００３】特開平１１−３５３１２６号公報には、障
害発生装置の特定を容易に行い、その特定処理にかかる
時間を短縮可能なディスクアレイ接続システムが記載さ
れている。このディスクアレイ接続システムは、障害が
発生した場合にループをいったん切断し、イニシエータ
とディスクアレイ装置とを１台ずつ順に接続して調査し
ていき、障害発生装置を特定する。障害発生装置を特定
した後にその装置をループから切り離し、他の装置でル
ープを構築する。

【０００４】特開２０００−１７４８４５号公報には、
ＦＣ−ＡＬにおいてループ上に障害を発生させているポ
ートの早期発見／排除を人手介入無しに実現するファイ
バチャネル仲裁型ループにおける障害ポートの検出／排
除システム及び方法が記載されている。この障害ポート
の検出／排除システム及び方法では、２重化されている
もう一方のループを利用して、障害の発生しているポー
トをバイパス／イネーブル制御することにより一方のル
ープに障害を発生させていたポートを排除する。

【０００５】特開２０００−２１５０８６号公報には、
ＦＣ−ＡＬ接続されているシステムで障害が発生した場
合、各種モニターの連携によりハブに接続されている装
置をポート単位に自動バイパスさせ、試験・診断プログ
ラムを実行させて障害情報を収集し、ログ情報とペアー
にして管理するようにした障害情報収集装置が記載され
ている。

【０００６】

【発明が解決しようとする課題】ＦＣ−ＡＬ接続されて
いるシステムでリンク障害が発生した場合、従来は各ノ
ードを順番に切り離していきながらリンク障害が復旧す
るか否かを確認することで、障害を発生させているノー
ドを探索するようにしている。しかしながら、この従来
の方法では、障害発生ポートが検出されるまで各ノード
を順次チェックしていく必要があるため、障害発生ポー
トを早期に検出できないことがある。ループに接続され
るノード数が多い程、障害発生ポートの検出に時間がか
かり、その間通常の入出力処理等ができなくなる。

【０００７】

【発明の目的】本発明はこのような課題を解決するため
なされたもので、ノード毎の障害履歴に基づいてポート
バイパスを行うノードの順番を設定し、設定したノード
順にポートバイパスを行うことで、障害発生ノードを早
期に特定できるようにしたＦＣ−ＡＬシステムのリンク
診断方法及びリンク診断装置を提供することを目的とす
る。

【０００８】

【課題を解決するための手段】前記課題を解決するため
本発明に係るＦＣ−ＡＬシステムのリンク診断方法及び
診断装置は、ノード毎に障害履歴を管理しておき、障害
履歴に基づいてノードの切り離し順序を設定する。過去
の障害履歴を参照して障害発生となる可能性の大きい順
にノードの切り離し順序を設定し、リンク障害が発生し
た際には障害発生となる可能性の大きいノードをループ
から順次切り離していく。これにより、障害ノードを早
期に検出する確立を高くできる。

【０００９】障害履歴には各障害内容別にそれぞれの発
生回数を記録しておき、障害内容別の発生回数にそれぞ
れ重み付け係数をかけてそれらの総和を求め、その総和
を被疑値とし、この被疑値の大きい順にノードの切り離
し順序を設定することで、障害ノードを早期に検出する
確立を高くできる。

【００１０】さらに、障害として検出されたノードの被
疑値が他のノードの被疑値よりも小さい場合は、障害と
して検出されたノードの被疑値が他のノードの被疑値よ
りも大きくなるように各重み付け係数を調整するように
してもよい。これにより、被疑値の算出条件を学習させ
ることができ、被疑ノード予想の的中率を向上させるこ
とができる。

【００１１】また、被疑値が予め設定した診断しきい値
に達した場合は、ノード装置に対して診断用のアクセス
を複数回実行し、障害履歴の採取を加速するようにして
もよい。

【００１２】さらに、被疑値が予め設定した障害しきい
値（診断しきい値よりも大きな値）に達した場合は、該
当するノード装置をポートバイパスしてループから切り
離すようにしてもよい。障害発生となる可能性の高いノ
ード装置をループから切り離すことで、リンク障害の発
生を未然に防止できる。

【００１３】

【発明の実施の形態】以下、本発明の実施の形態を添付
図面に基づいて説明する。

【００１４】図１は本発明に係るリンク診断装置を備え
たＦＣ−ＡＬシステムのブロック構成図である。図１は
ＦＣ−ＡＬシステムの一具体例として２重ループ構成の
ディスクアレイシステムを示している。このＦＣ−ＡＬ
システムは、２つのディスクアダプタ１０，２０と複数
のディスク装置３０，４０，５０と、それらを接続する
２系統のループ１，２とからなる。

【００１５】ディスク装置３０，４０，５０は、ＦＣポ
ートを２つ有するＦＣ−ＡＬ対応のディスク装置であ
り、それぞれのポート（ポートＡ，ポートＢ）からリー
ド／ライトなどのコマンドを処理することができる。各
ディスク装置３０，４０，５０の一方のポート（ポート
Ａ）は一方のループ１に接続される。このループ１には
一方のディスクアダプタ１０が接続される。これによ
り、ディスクアダプタ１０はループ１を介して各ディス
ク装置３０，４０，５０にアクセスできるようにしてい
る。各ディスク装置３０，４０，５０の他方のポート
（ポートＢ）は他方のループ２に接続される。このルー
プ２には他方のディスクアダプタ１０が接続される。こ
れにより、ディスクアダプタ２０はループ２を介して各
ディスク装置３０，４０，５０にアクセスできるように
している。

【００１６】ディスク装置３０，４０，５０は、各ポー
ト毎にバイパス回路３２，３３，４２，４３，５２，５
３を備える。バイパス回路３２，３３，４２，４３，５
２，５３は、ディスクアダプタ１０，２０からループ
１，２を介して供給されるポートバイパス指示やバイパ
ス解除指示に基づいて、ディスク装置３０，４０，５０
をループ１，２から切り離したりディスク装置３０，４
０，５０をループ１，２に接続したりする。通常時、ポ
ートＡ側の各バイパス回路３２，４２，５２はディスク
アダプタ１０が制御し、ポートＢ側の各バイパス回路３
３，４３，５３はディスクアダプタ２０が制御する。ポ
ートＡ側のバイパス回路３２，４２，５２とポートＢ側
のバイパス回路３３，４３，５３とは通信できるように
なっている。これにより、一方のループにリンク異常が
発生した場合でも、他方のループから一方のループ側の
バイパス回路の制御を行えるようにしている。

【００１７】ディスクアダプタ１０，２０は、ＭＰＵ１
１、記憶回路１２、アダプタ間通信制御部１３、ポート
バイパス制御部１４、ＦＣ−ＡＬ制御部１５から構成さ
れているコントローラである。各ディスクアダプタ１
０，２０は冗長構成となっていて、通常はどちらのディ
スクアダプタ１０，２０からでも各ＦＣ−ＡＬディスク
装置３０，４０，５０を制御できる。

【００１８】記憶回路１２は、エラーの回数を種類別に
分類した統計情報と呼ばれる情報などを記憶し、記憶し
た統計情報はＭＰＵ１１から参照できる。統計情報は、
図２に示すように、各ディスク毎／各ポート毎に発生し
たエラー回数をエラーの種類によって分類し、記憶され
ている。記憶回路１２は、不揮発性メモリ又はバッテリ
バックアップされたＲＡＭ等を用いて構成している。な
お、記憶回路１２はハードディスク装置等の補助記憶装
置を用いて構成してもよい。

【００１９】ＦＣ−ＡＬ制御部１５は、ループを介して
各ディスク装置３０，４０，５０にアクセスする。ＦＣ
−ＡＬ制御部１５は、アクセスしたディスク装置からＩ
／Ｏエラー情報が供給された場合、アクセスしたディス
ク装置を特定するディスク識別情報とＩ／Ｏエラーが発
生した旨の情報とをＭＰＵ１１へ供給する。ＭＰＵ１１
は、ディスク識別情報とＩ／Ｏエラーが発生した旨の情
報が供給されると、記憶回路１２内に設けて該当ディス
クのＩ／Ｏエラー発生回数データ格納領域（該当ディス
ク装置のＩ／Ｏエラー発生回数カウンタ）の値を＋１す
る。なお、ＭＰＵ１１は、Ｉ／Ｏエラーが発生した日時
データをディスク装置との対応を付けて記憶回路１２に
格納するようにしてもよい。

【００２０】ＦＣ−ＡＬ制御部１５は、ディスク装置３
０，４０，５０に対して各種のコマンド（Ｉ／Ｏ要求
等）を供給した後、そのコマンドに対するディスク装置
からの応答が予め設定した時間内に得られない場合に
は、ディスク装置を特定するディスク識別情報と転送タ
イムアウトが発生した旨の情報とをＭＰＵ１１へ供給す
る。ＭＰＵ１１は、上記の各情報が供給されると、記憶
回路１２内に設けた該当ディスク装置の転送タイムアウ
ト発生回数データ格納領域（転送タイムアウト発生回数
カウンタ）の値を＋１する。なお、ＭＰＵ１１は、転送
タイムアウトが発生した日時データをディスク装置との
対応を付けて記憶回路１２に格納するようにしてもよ
い。

【００２１】ＦＣ−ＡＬ制御部１５は、ＦＣ−ＡＬルー
プのリンク障害が発生し、後述する診断によってリンク
障害を発生させたディスク装置が特定された場合は、そ
のディスク装置のディスク識別情報とリンク障害が発生
した旨の情報とをＭＰＵ１１へ供給する。ＭＰＵ１１
は、上記の各情報は供給されると、記憶回路１２内に設
けた該当ディスクのリンク障害発生回数データ格納領域
（リンク障害発生回数カウンタ）の値を＋１する。な
お、ＭＰＵ１１は、リンク障害が発生した日時データを
ディスク装置との対応を付けて記憶回路１２に格納する
ようにしてもよい。

【００２２】ＭＰＵ１１は、前述した各カウンタのいず
れかの値を更新した場合は、ループ全体の発生回数を演
算して、ループ全体の発生回数データを更新する。例え
ば、ディスク＃０でＩ／Ｏエラー（Ｉ／Ｏ障害）が発生
し、ディスク＃０のＩ／Ｏエラー（Ｉ／Ｏ障害）発生回
数を＋１した場合には、ループを構成している全てのデ
ィスク装置のＩ／Ｏ障害発生回数の総和を求め、求めた
総和をループのＩ／Ｏ障害発生回数データ格納領域に格
納する。なお、ＭＰＵ１１は、総和を求めずに、Ｉ／Ｏ
障害が検出されるたびにループのＩ／Ｏ障害発生回数を
＋１するようにしてもよい。ＭＰＵ１１は、転送タイム
アウトが検出されるたびに、ループの転送タイムアウト
発生回数の値を＋１する。ＭＰＵ１１は、リンク異常が
検出されるたびに、ループのリンク異常発生回数の値を
＋１する。

【００２３】上記によって図２に示すように、記憶回路
１２内には各ディスク装置毎の障害発生回数が障害項目
別に格納されるとともに、各障害項目別にループ全体の
障害発生回数が格納される。ここで、一方のディスクア
ダプタ１０は、ポートＡ側のループ１を制御しているの
で、一方のディスクアダプタ１０の記憶回路１２にはポ
ートＡ側のループ１での各種障害の発生回数が格納され
る。また、他方のディスクアダプタ２０は、ポートＢ側
のループ２を制御しているので、他方のディスクアダプ
タ２０の記憶回路１２にはポートＢ側のループ２での各
種障害の発生回数が格納される。

【００２４】ＭＰＵ１１は、次に示す式１に基づいて被
疑値Ｘ（ｎ）を計算する。Ｘ（ｎ）＝Ｗ１・Ａ（ｎ）＋Ｗ２・Ｂ（ｎ）＋Ｗ３・Ｃ（ｎ） …… 式１ここで、Ａ（ｎ）は各ディスク装置毎のＩ／Ｏ障害発生
回数、Ｂ（ｎ）は各ディスク装置毎の転送タイムアウト
発生回数、Ｃ（ｎ）は各ディスク装置毎のリンク障害発
生回数、Ｗ１，Ｗ２，Ｗ３は重み付け係数である。

【００２５】そして、ＭＰＵ１１は、各ディスク装置毎
に被疑値Ｘ（ｎ）を求め、被疑値Ｘ（ｎ）の大きい順に
ディスク装置の切り離し順序を設定する。また、ＭＰＵ
１１は、実際にリンク診断を行った結果、被疑ディスク
であると特定されたディスク装置の被疑値Ｘ（ｎ）が、
他のディスク装置の被疑値Ｘ（ｎ）よりも大きな値にな
るように調整する（被疑ディスクと特定されたディスク
の各エラー回数を調べ、一番回数の多いエラーの重みを
増やし、一番エラー回数の少ないエラーの重みを減らす
などする）。これにより、診断をするほど被疑ディスク
を特定しやすくなる。

【００２６】アダプタ間通信制御部１３は、各ディスク
アダプタ１０，２０間での通信を制御する部分であり、
リンクの診断を行うときに逆側のディスクアダプタに各
ディスクのポートバイパス（リンク上からあるＦＣ−Ａ
Ｌディスクを切り離す）を指示したり、診断中に受けた
Ｉ／Ｏを逆側のディスクアダプタへ依頼するときなどに
使用される。

【００２７】ポートバイパス制御部１４は、各ディスク
毎にあるバイパス回路３２，３３，４２，４３，５２，
５３を制御し、特定のポートをバイパスしリンク上から
切り離したり、ポートのバイパスを解除し切り離したデ
ィスクをリンクに参加させたりする制御を行う。

【００２８】本実施の形態では、ＦＣ−ＡＬ制御部１５
によって特許請求の範囲に記載した障害検出手段を構成
している。また、ＭＰＵ１１と記憶回路１２とによって
特許請求の範囲に記載した障害履歴管理手段及びノード
切り離し順序設定手段を構成している。各バイパス回路
３２，３３，４２，４３，５２，５３によって特許請求
の範囲に記載したポートバイパス手段を構成している。
さらに、ＭＰＵ１１、アダプタ間制御部１３、ポートバ
イパス制御部１４及びＦＣ−ＡＬ制御部によって特許請
求の範囲に記載したノード切り離し制御手段を構成して
いる。

【００２９】次に、あるディスク装置が原因となり片系
リンク異常が発生した場合のリンク診断方法を図３及び
図４に示すフローチャートを参照に説明する。

【００３０】各ディスクアダプタ１０，２０は、Ｉ／Ｏ
処理をしながら、定期的にリンクの状態を監視し、リン
ク異常が発生していないかチェックする。リンク異常が
発生していない場合は、監視を続ける（ステップＳ
１）。

【００３１】図５はポートＡ側のループでリンク異常が
発生した状態を示す図である。ポートＡ側のループ１で
リンク異常が発生した場合、このリンク異常はディスク
アダプタ１０のＦＣ−ＡＬ制御部１５によって検出され
る。ＦＣ−ＡＬ制御部１５は、リンク異常を検出したこ
とをＭＰＵ１１へ通知する。

【００３２】ＭＰＵ１１は、リンク異常の検出通知が供
給されると、記憶回路１２に格納されている各ディスク
装置の障害発生履歴を読み出し、前述した式１に基づい
て各ディスク装置の被疑値Ｘ（ｎ）をそれぞれ算出す
る。そして、算出した被疑値Ｘ（ｎ）の大きい順に各デ
ィスク装置の切り離し順序を設定する（ステップＳ
２）。

【００３３】図５に示したようにポートＡ側のループ１
でリンク異常が発生した状態では、ループ１側を制御し
ているディスクアダプタ１０側からポートＡ側のバイパ
ス回路３２，４２，５２を制御することができない。そ
こで、ディスクアダプタ１０のＭＰＵ１１は、被疑値Ｘ
（ｎ）が最大のディスク装置のポートＡ側をポートバイ
パス状態に制御する指令をアダプタ間通信制御部１３を
介してポートＢ側のループを制御するディスクアダプタ
２０へ供給する。

【００３４】ポートＢ側のループを制御するディスクア
ダプタ２０は、上記ポートバイパス状態に制御する指令
を受け取ると、指定されたディスク装置のポートＡ側を
ポートバイパス状態に制御する指令をポートＢ側のルー
プ２へ供給する。この指令は指定されたディスク装置の
ポートＢ側のバイパス回路で受信され、さらに、バイパ
ス回路間の通信によってポートＡ側のバイパス回路へ供
給される。これにより、指定されたディスク装置のポー
トＡ側のバイパス回路によってポートバイパスがなさ
れ、そのディスク装置はループ１から切り離される（ス
テップＳ３）。

【００３５】図６はディスク＃ｎをループから切り離し
たがリンク障害が継続している状態を示す図である。被
疑値Ｘ（ｎ）が最大のディスク装置がディスク＃ｎであ
る場合、このディスク＃ｎがループ１から切り離され
る。

【００３６】ディスクアダプタ１０は、被疑値Ｘ（ｎ）
が最大のディスク装置をループ１から切り離したことに
よってリンクが回復するか否かを監視し（ステップＳ
４）、リンクが回復しない場合には、被疑値Ｘ（ｎ）が
２番目に大きいディスク装置のポートバイパスを行う。
このようにしてディスクアダプタ１０は、リンクが回復
するまで被疑値Ｘ（ｎ）の大きい順にディスク装置の切
り離しを行う（ステップＳ５）。

【００３７】図７はディスク＃ｎ及びディスク＃Ｋを切
り離したことによってリンク障害が回復した状態を示す
図である。

【００３８】ディスク装置をループから切り離したこと
によってリンクが回復した場合、ディスクアダプタ１０
は、確認のためそのディスク装置のバイパスを解除して
そのディスク装置を再度ループに接続させる（ステップ
Ｓ６）。そして、リンクが回復したままであるか再度リ
ンク異常となるか監視する（ステップＳ７）。

【００３９】確認のためのバイパス解除によってリンク
障害が再度発生した場合（リンクが回復しなかった場
合）、ディスクアダプタ１０は、確認のためにバイパス
を解除してループ１に接続したディスク装置が固定リン
ク障害であると判定し、そのディスク装置をループから
切り離すとともに、他のディスク装置のポートバイパス
を解除して他のディスク装置をループ１に接続する（ス
テップＳ８）。

【００４０】図８は確認のためにディスク＃Ｋのバイパ
スを解除し、それによってリンク障害が発生した状態を
示す図である。

【００４１】図９はディスク＃Ｋが固定リンク障害であ
ると判断しそのディスクをループから切り離し、他のデ
ィスク＃ｎをループに接続した状態を示す図である。障
害を発生させていたディスク＃Ｋをループから切り離し
たことによって、ループ１のリンク障害は回復する。

【００４２】なお、ディスクアダプタ１０は、被疑値Ｘ
（ｎ）の大きい順に全てのディスクに対してポートバイ
パスを行ってもリンク障害が回復しない場合には、ディ
スクアダプタ１０に障害が発生しているものと判定する
（ステップＳ９）。

【００４３】また、確認のためのバイパス解除によって
リンク障害が発生しない場合（リンク障害が回復したま
まである場合）、ディスクアダプタ１０のＭＰＵ１１
は、バイパスによってリンクが回復したディスク装置が
間欠リンク障害を発生したものと判定し、そのディスク
装置の障害履歴を更新する（ステップＳ１０）。この場
合は、先にループから切り離したディスク装置をループ
に接続する。

【００４４】そして、ディスクアダプタ１０のＭＰＵ１
１は、間欠リンク障害であると判定されたディスク装置
の被疑値Ｘ（ｎ）が他のディスク装置の被疑値Ｘ（ｎ）
よりも小さい値であった場合、間欠リンク障害であると
判定されたディスク装置の被疑値Ｘ（ｎ）が他のディス
ク装置の被疑値Ｘ（ｎ）よりも大きな値となるように各
重み付け係数を調整する（ステップＳ１１）。具体的に
は、間欠リンク障害であると判定されたディスク装置の
障害項目別の障害発生回数を調べ、一番回数の多い障害
項目の重み付け係数を増やし、一番回数の少ない障害項
目の重み付け係数を小さくする。これにより、被疑ディ
スクの予想の的中率を上げ、次回の診断で故障ディスク
を検出する時間を短縮する。

【００４５】図１０は確認のためのバイパス解除によっ
てリンク障害が発生しない状態を示す図である。

【００４６】図１１は間欠リンク障害と判定されたディ
スク及び他のディスクをループに接続した状態を示す図
である。

【００４７】ディスクアダプタ１０のＭＰＵ１１は、障
害履歴の更新を行うと各ディスク装置の被疑値Ｘ（ｎ）
を算出し、予め設定した診断しきい値を越えているディ
スク装置があるか否かチェックする（ステップＳ１
２）。診断しきい値を越えているディスク装置がない場
合はステップＳ１に戻ってリンク障害の監視を行う。診
断しきい値を越えているディスク装置がある場合は、図
４に示すステップＳ１３以降の処理（診断用のアクセス
処理）を行う。

【００４８】ステップＳ１３では、診断対象となるディ
スク装置以外のディスク装置に対してポートバイパス指
示を発生する。これにより、ポートＡ側のループ１には
診断対象となるディスク装置のみが接続された状態とな
る。

【００４９】図１２は診断対象となるディスク装置のみ
がループに接続された状態を示す図である。

【００５０】次に、ディスクアダプタ１０は、診断対象
となるディスク装置に対して診断用のＩ／Ｏアクセスを
予め設定した回数繰り返し実行し、各種エラー（Ｉ／Ｏ
障害発生，転送タイムアウト発生，リンク障害発生）が
発生しないか監視し、各種エラーが発生した場合は障害
履歴を更新する（ステップＳ１４）。これにより、障害
履歴データの取得を促進することができる。

【００５１】ディスクアダプタ１０は、障害履歴データ
の取得促進によって診断対象であるディスク装置の被疑
値Ｘ（ｎ）が予め設定した障害しきい値に達した場合
（ステップＳ１５）、そのディスク装置を障害装置であ
ると判定してそのディスク装置をループから切り離す
（ステップＳ１６）。

【００５２】そして、ステップＳ１３〜ステップＳ１６
までの処理を全てのディスク装置に対して繰り返す（ス
テップＳ１７）。これにより、障害発生の可能性のある
ディスク装置を早期に検出して、リンク障害が発生する
前にループから切り離すことができ、リンク障害の発生
を未然に防止できる。

【００５３】本実施の形態では、障害項目別の障害発生
回数にそれぞれ重み付け係数を乗じて得た値の総和に基
づいて被疑値Ｘ（ｎ）を求め、この被疑値Ｘ（ｎ）の大
きい順にディスク装置の切り離し順序を設定する例を示
したが、リンク障害の発生回数の多い順にディスク装置
の切り離し順序を設定するようにしてもよい。また、障
害発生日時を記録している場合には、障害発生日時に新
しい順にディスク装置の切り離し順序を設定したり、所
定期間における障害発生回数（障害発生頻度）の高い順
にディスク装置の切り離し順序を設定したりするように
してもよい。

【００５４】また、本実施の形態では２重ループ構成の
ＦＣ−ＡＬシステムを例示したが、ポートバイパス制御
用の信号経路を独立に備える構成の場合は、２重ループ
の構成でなくてもよい。この場合は、ＦＣ−ＬＡ用のル
ープではなくポートバイパス制御用の信号経路を介して
ポートのバイパス／バイパス解除を制御する。

【００５５】

【発明の効果】以上説明したように本発明に係るＦＣ−
ＡＬシステムのリンク診断方法及び診断装置は、ノード
毎に障害履歴を管理しておき、障害履歴に基づいてノー
ドの切り離し順序を設定するようにしたので、リンク障
害が発生した際には障害発生となる可能性の大きいノー
ドをループから順次切り離していくことができ、これに
より障害ノードを早期に検出する確立を高くできる。

【００５６】また、障害履歴には各障害内容別にそれぞ
れの発生回数を記録しておき、障害内容別の発生回数に
それぞれ重み付け係数をかけてそれらの総和を求め、そ
の総和を被疑値とし、この被疑値の大きい順にノードの
切り離し順序を設定することで、障害ノードを早期に検
出する確立を高くできる。

【００５７】さらに、障害として検出されたノードの被
疑値が他のノードの被疑値よりも小さい場合は、障害と
して検出されたノードの被疑値が他のノードの被疑値よ
りも大きくなるように各重み付け係数を調整すること
で、被疑値の算出条件を学習させることができ、被疑ノ
ード予想の的中率を向上させることができる。

【００５８】また、被疑値が予め設定した診断しきい値
に達した場合は、ノード装置に対して診断用のアクセス
を複数回実行することで、障害履歴の採取を加速でき
る。さらに、被疑値が予め設定した障害しきい値（診断
しきい値よりも大きな値）に達した場合は、該当するノ
ード装置をポートバイパスしてループから切り離すこと
で、リンク障害の発生を未然に防止できる。

【図面の簡単な説明】

【図１】本発明に係るリンク診断装置を備えたＦＣ−Ａ
Ｌシステムのブロック構成図である。

【図２】記憶回路に格納された障害データの一具体例を
示す図である。

【図３】本発明に係るリンク診断方法のフローチャート
（その１）である。

【図４】本発明に係るリンク診断方法のフローチャート
（その２）である。

【図５】ポートＡ側のループでリンク異常が発生した状
態を示す図である。

【図６】ディスク＃ｎをループから切り離したがリンク
障害が継続している状態を示す図である。

【図７】ディスク＃ｎ及びディスク＃Ｋを切り離したこ
とによってリンク障害が回復した状態を示す図である。

【図８】確認のためにディスク＃Ｋのバイパスを解除
し、それによってリンク障害が発生した状態を示す図で
ある。

【図９】ディスク＃Ｋが固定リンク障害であると判断し
そのディスクをループから切り離し、他のディスク＃ｎ
をループに接続した状態を示す図である。

【図１０】確認のためのバイパス解除によってリンク障
害が発生しない状態を示す図である。

【図１１】間欠リンク障害と判定されたディスク及び他
のディスクをループに接続した状態を示す図である。

【図１２】診断対象となるディスク装置のみがループに
接続された状態を示す図である。

【符号の説明】

１ポートＡ側のループ２ポートＢ側のループ１０，２０ディスクアダプタ１１ＭＰＵ１２記憶回路１３アダプタ間通信制御部１４ポートバイパス制御部１５ＦＣ−ＡＬ制御部３０，４０，５０ディスク装置３２，３３，４２，４３，５２，５３バイパス回路

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) H04L 12/28 G06F 11/20 310 G06F 13/00 301

Claims

(57)【特許請求の範囲】

【請求項１】ＦＣ−ＡＬ接続された複数のノード装置
毎に障害履歴を管理するステップと、前記障害履歴に基
づいて前記ノード装置の切り離し順序を設定するステッ
プと、リンク障害が発生した際に前記切り離し順序に基
づいて前記ノード装置に対してポートバイパスの指示を
供給することで前記ノード装置をループから切り離すス
テップとを備えたことを特徴とするＦＣ−ＡＬシステム
のリンク診断方法。
【請求項２】前記ノード装置をポートバイパスしたこ
とによって前記リンク障害が回復した際には、そのノー
ド装置のポートバイパスを解除し、その結果リンク障害
が発生した場合にはそのノード装置をループから切り離
すことを特徴とする請求項１記載のＦＣ−ＡＬシステム
のリンク診断方法。
【請求項３】前記障害履歴にはリンク障害の発生回数
が記録され、前記切り離し順序は前記リンク障害の発生
回数の多い順に設定されていることを特徴とする請求項
１記載のＦＣ−ＡＬシステムのリンク診断方法。
【請求項４】前記障害履歴には障害内容別に発生回数
が記録され、前記切り離し順序は前記障害内容別の発生
回数にそれぞれ重み付け係数をかけて計算して得た被疑
値の大きい順に設定されていることを特徴とする請求項
１記載のＦＣ−ＡＬシステムのリンク診断方法。
【請求項５】リンク障害であると判定されたノード装
置の被疑値が他のノード装置の被疑値よりも大きな値に
なるように前記それぞれの重み付け係数を変更すること
を特徴とする請求項４記載のＦＣ−ＡＬシステムのリン
ク診断方法。
【請求項６】前記障害履歴には障害内容別に発生回数
が記録され、前記障害内容別の発生回数にそれぞれ重み
付け係数をかけて計算した被疑値が予め設定した診断し
きい値に達した場合は、前記ノード装置に対して診断用
のアクセスを複数回実行し、診断用のアクセスによって
障害が検出されたときには障害履歴を更新することを特
徴とする請求項１記載のＦＣ−ＡＬシステムのリンク診
断方法。
【請求項７】前記障害履歴には障害内容別に発生回数
が記録され、前記障害内容別の発生回数にそれぞれ重み
付け係数をかけて計算した被疑値が予め設定した障害し
きい値に達した場合は、該当するノード装置をポートバ
イパスしてループから切り離すことを特徴とする請求項
１記載のＦＣ−ＡＬシステムのリンク診断方法。
【請求項８】ＦＣ−ＡＬ接続された複数のノード装置
からなるシステムの障害を検出する障害検出手段と、障
害を発生したノード装置と障害内容とを対応付けて障害
履歴データとして記録する障害履歴管理手段と、前記ノ
ード装置をポートバイパスしてループから切り離すポー
トバイパス手段と、前記障害履歴データに基づいてリン
ク障害が発生した際のノード装置の切り離し順序を設定
するノード切り離し順序設定手段と、リンク障害が検出
された際に前記ノード切り離し順序設定手段によって設
定されたノード装置の切り離し順序に基づいて各ノード
装置の切り離し制御を行うノード切り離し制御手段とを
備えたことを特徴とするＦＣ−ＡＬシステムのリンク診
断装置。
【請求項９】前記ノード切り離し順序設定手段は、前
記障害履歴データに基づいて各ノード装置毎に被疑値を
算出し、算出した被疑値の大きい順にノード装置の切り
離し順序を設定することを特徴とする請求項８記載のＦ
Ｃ−ＡＬシステムのリンク診断装置。
【請求項１０】前記障害履歴データは障害内容別に発
生回数が記録され、前記ノード切り離し順序設定手段
は、前記障害内容別の発生回数にそれぞれ重み付け係数
をかけて各ノード装置毎に被疑値を算出し、算出した被
疑値の大きい順にノード装置の切り離し順序を設定する
ことを特徴とする請求項８記載のＦＣ−ＡＬシステムの
リンク診断装置。
【請求項１１】前記ノード切り離し制御手段は、前記
ポートバイパス手段を介して前記ノード装置をループか
ら切り離したことによって前記リンク障害が回復した際
には、そのノード装置のポートバイパスを解除し、その
結果リンク障害が発生した場合にはそのノード装置がル
ープから切り離すことを特徴とする請求項８記載のＦＣ
−ＡＬシステムのリンク診断装置。
【請求項１２】前記ノード切り離し順序設定手段は、
前記固定リンク障害であると判定されたノード装置の被
疑値が他のノード装置の被疑値よりも大きな値になるよ
うに前記それぞれの重み付け係数を変更することを特徴
とする請求項１０記載のＦＣ−ＡＬシステムのリンク診
断装置。
【請求項１３】ＦＣ−ＡＬ接続されたシステムの障害
を検出する障害検出手段と、障害を発生したノード装置
と障害内容とを対応付けて障害履歴データとして記録す
る障害履歴管理手段と、ノード装置をポートバイパスし
てループから切り離すポートバイパス手段と、前記ノー
ド装置に対して診断用のアクセスを複数回実行して前記
障害履歴データの取得を促進をする診断用アクセス手段
と、前記障害履歴データに基づいてリンク障害が発生し
た際のノード装置の切り離し順序を設定するノード切り
離し順序設定手段と、リンク障害が検出された際に前記
ノード切り離し順序設定手段によって設定されたノード
装置の切り離し順序に基づいて各ノード装置の切り離し
制御を行うノード切り離し制御手段とを備えたことを特
徴とするＦＣ−ＡＬシステムのリンク診断装置。