JP4354492B2 - ディスクドライブ診断装置 - Google Patents
ディスクドライブ診断装置 Download PDFInfo
- Publication number
- JP4354492B2 JP4354492B2 JP2007021354A JP2007021354A JP4354492B2 JP 4354492 B2 JP4354492 B2 JP 4354492B2 JP 2007021354 A JP2007021354 A JP 2007021354A JP 2007021354 A JP2007021354 A JP 2007021354A JP 4354492 B2 JP4354492 B2 JP 4354492B2
- Authority
- JP
- Japan
- Prior art keywords
- disk drive
- diagnosis
- login
- fabric switch
- loop
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2205—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
- G06F11/2221—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test input/output devices or peripheral units
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Description
図8において、各ディスクドライブ16は、デバイスエンクロージャ11に収納され、RAID制御装置10を介して外部とデータのやり取りをする。従来はRAID制御装置10とディスクドライブ16間はFC-AL(Fiber Channel Arbitrated Loop)15で接続され、ディスクドライブ診断はディスクドライブ16をFC-AL15のループに接続する前に、ディスクドライブ16とPBC (Port Bypass Circuit)12 間でループイニシャライズが完了するかテストを行い、正常であればそのディスクドライブ16は問題ないとしてループに接続し、ループイニシャライズが完了しない場合は故障ディスクドライブとしてループから切り離していた。ループイニシャライズは、ディスクドライブ16の2つのポートをループで接続し、ディスクドライブが、自身の装置に書き込み、読み出しが可能か否かを診断するプロセスと、ディスクドライブ16自身が正常であった場合、プロセッサ13によってディスクドライブ16がループイニシャライズ処理を実行可能か否か診断するプロセスからなる。なお、このようなループを作ってディスクドライブの正常性を検査するための構成が、PBC12である。また、同時にRAID制御装置10は、PBC12から各ディスクドライブ16の診断結果をまとめて得る事により、故障ディスクドライブの存在を知ることが出来る。
1.ループイニシャライズ診断を行う
2.ループイニシャライズ診断がOKだった場合、全体ループに接続しないでSESデバイスとディスクドライブだけのループを作成する。
3.SESデバイスがファブリックスイッチに成り代わりFL(Fabric Loop)ポートとなることで、ディスクドライブからのログイン処理を受信し、ログイン診断を行う。
4.ログイン処理の中で以下の異常が検出された場合は、該当ディスクドライブを故障とし全体ループに接続しない。
・FLOGIは発行するが、その後一定時間内にPLOGIを発行しないディスクドライブ
・PLOGIは発行するが、その後一定時間内にRFT_IDを発行しないディスクドライブ
・ファブリックスイッチがFLOGI、PLOGI、RFT_ID(ディレクトリサービスを行うネームサーバへ登録を行うためのコマンド)の応答を返そうとするが、その応答を受け取れないディスクドライブ
5.全ディスクドライブの診断が完了したらSESデバイスはファブリックスイッチの代わりとなるのをやめ、ファブリックスイッチを接続することで、再びループイニシャライズが実行され、通常の接続形態となる。
図1において、ディスクドライブ16は、自身の入出力ポートにループを形成して、自
身の動作が正常化否かを診断するループイニシャライズ診断を行う。ループイニシャライズ診断がNGである場合には、ディスクドライブ16をFC-AL15に接続しないようにする。ループイニシャライズ診断がOKの場合には、FC-AL15に接続する。この時点で、FC-AL15は、ループイニシャライズ診断の結果OKであったディスクドライブ16のみが接続され、ファブリックスイッチ17には接続されていないループを形成する。FC-AL15に接続されたプロセッサ13のSESデバイス14aには、ファブリックスイッチ17のログインサーバ20及びディレクトリサーバ19に代わってログイン診断を行う仮想ログインサーバと仮想ディレクトリサーバが設けられる。仮想ログインサーバと仮想ディレクトリサーバは、FC-AL15に接続されたディスクドライブ16からのログインを受付け、各ディスクドライブが正常にログインできる状態であるか否かを診断する。ログイン診断の結果、正常にログインできないディスクドライブが存在した場合には、そのディスクドライブ16をFC-AL15から切り離す。仮想ログインサーバと仮想ディレクトリサーバのログイン診断が終わったら、FC-AL15には、正常なディスクドライブ16のみが接続されていることになるので、FC-AL15をファブリックスイッチ17に接続して、各ディスクドライブ16にログイン処理を行わせる。
図2(b)において、まず、ステップS10で、ディスクドライブ毎にループイニシャライズ診断を行う(詳細は、図3参照)。ステップS11において、ループイニシャライズ診断結果をディスクドライブ診断結果テーブルに反映する。ディスクドライブ診断結果テーブルは、図2(a)に一例が示されているが、各ディスクドライブの番号に対して、ループイニシャライズ診断とログイン診断の結果が格納されるものである。ステップS12において、ディスクドライブごとにログイン診断を行う(詳細は、図4参照)。ステップS13において、ループイニシャライズ診断結果をディスクドライブ診断結果テーブルに反映する。ステップS14において、ディスクドライブ診断結果テーブルのログイン診断結果がOKなディスクドライブとSESデバイス、及びファブリックスイッチにつながるポートを接続し、ステップS15において、ログイン診断結果をRAID制御装置に通知してディスクドライブ診断処理を終了する。
ステップS17において、ディスクドライブだけのループをつくり、PBCからディスクドライブに対してLIP(Loop Initialization Primitive)を送信する。そして、PBCはディスクドライブからLIPが返ってくるのを待つ。ステップS18において、LIPが返ってきたか否かを判断する。ステップS18の判断で、LIPが返ってきたと判断された場合には、ステップS19において、ループイニシャライズ診断がOKだったとしてループイニシャライズ診断を終了する。ステップS18において、LIPが返って来ないと判断された場合には、ステップS20において、ループイニシャライズ診断結果をNGとして、ループイニシャライズ診断を終了する。
ステップS25において、SESデバイスの仮想ログインサーバ、仮想ディレクトリサーバを動作させ、SESデバイスをFLポートとする。ステップS26において、ループイニシャライズ診断の結果を判断する。ループイニシャライズ診断の結果がNGの場合には、ステップS38に進み、OKの場合には、ステップS27に進む。ステップS27においては、SESデバイスと、ログイン診断を行う1つのディスクドライブだけのループを作る。ステップS28において、SESデバイスがFLポートとなり、ループイニシャライズを開始する。このとき、ディスクドライブにログインするように要求する。ステップS29において、ループイニシャライズが一定時間内に完了したか否かを判断する。この判断がNoの場合には、ステップS38に進む。この判断がYesの場合には、ステップS30において、ループイニシャライズ完了後、一定時間内にFLOGIを受信したか否かを判断する。
この判断がNoの場合には、ステップS38に進む。ステップS38では、ログイン診断がNGだったとして、ログイン診断を終了する。この判断がYesの場合には、ステップS31に進む。ステップS31においては、ディスクドライブにFLOGIに対するACC(ACCept、いわゆるacknowledgement)を送信できたか否かを判断する。ACCが送信できなかった場合には、ステップS37に進む。ACCが送信できた場合には、ステップS32において、ACC送信後、一定時間内にPLOGIを受信したか否かを判断する。この判断がNoの場合には、ステップS37に進む。この判断がYesの場合には、ステップS33において、ディスクドライブにPLOGIに対するACCを送信できたか否かを判断する。この判断がNoの場合には、ステップS37に進む。この判断がYesの場合には、ステップS34において、ACC送信後、一定時間内にRFT_IDを受信したか否かを判断する。この判断がNoの場合には、ステップS37に進む。この判断がYesの場合には、ステップS35において、ディスクドライブにRFT_IDに対するACCを送信できたか否かを判断する。この判断がNoの場合には、ステップS37に進む。ステップS37では、ログイン診断がNGだったとして、ログイン診断を終了する。この判断がYesの場合には、ステップS36において、ログイン診断がOKだったとして、ログイン診断を終了する。
本発明の第2の実施形態では、第1の実施形態のSESデバイスの代わりに、ファブリックスイッチによって確認を行い、結果をRAID制御装置に通知、もしくはPBCに通知しディスクドライブ切り離しを行うものである。
・ループに参加しているが一定時間内にFLOGIを発行しないディスクドライブ
・FLOGIは発行するが、その後一定時間内にPLOGIを発行しないディスクドライブ
・PLOGIは発行するが、その後一定時間内にRFT_IDを発行しないディスクドライブ
・ファブリックスイッチがFLOGI、PLOGI、RFT_IDの応答を返そうとするが、その応答を受け取れないディスクドライブ
図5において、まず、ディスクドライブ16は、自身のポートにループを形成して、ループイニシャライズ診断を行い、OKなら、FC-AL15に接続する。次に、FC-AL15をファブリックスイッチ17に接続する。ディスクドライブ16は、ファブリックスイッチ17のプロセッサ18に設けられる、ログインサーバ20とディレクトリサーバ19に対し、ログインを試みる。ログインサーバ20と、ディレクトリサーバ19は、ディスクドライブが正常にログインできた場合には、そのディスクドライブのログイン診断結果は、OKであるとする。正常にログインできないディスクドライブがあった場合には、そのディスクドライブをNGとする。そして、ログイン処理の結果をRAID制御装置10に報告し、NGのディスクドライブをPBCに通知し、当該ディスクドライブをFC-AL15から切り離させる。
図6(b)において、まず、ステップS40において、ディスクドライブ毎にループイニシャライズ診断を行う(詳細については、図3参照)。ステップS41において、ループイニシャライズ診断がOKであったディスクドライブだけ全体ループ(FC-AL15)に接続する。ステップS42において、PBCとファブリックスイッチが接続されるポートも接続する。ステップS40〜S42は、PBCが実行する。
する(詳細は、図7を参照)。次に、ステップS45において、ログイン診断結果をRAID制御装置に通知し、ステップS46において、ログイン診断テーブルで診断結果がOKとなったディスクドライブだけ、RAID制御装置から見えるようにして、ディスクドライブ診断を終了する。ここで、ステップS43〜S46は、ファブリックスイッチが実行する。
まず、ステップS50において、ループイニシャライズ完了後、一定時間内にFLOGIを受信したか否かを判断する。この判断がNoの場合には、ステップS57に進む。この判断がYesの場合には、ステップS51において、ディスクドライブにFLOGIに対するACCを送信できたか否かを判断する。この判断がNoの場合には、ステップS57に進む。この判断がYesの場合には、ステップS52において、ACC送信後、一定時間内にPLOGIを受信したか否かを判断する。この判断がNoの場合には、ステップS57に進む。この判断がYesの場合には、ステップS53において、ディスクドライブにPLOGIに対するACCを送信できたか否かを判断する。この判断がNoの場合には、ステップS57に進む。この判断がYesの場合には、ステップS54において、ACC送信後、一定時間内にRFT_IDを受信したか否かを判断する。この判断がNoの場合には、ステップS57に進む。この判断がYesの場合には、ステップS55において、ディスクドライブにRFT_IDに対するACCを送信できたか否かを判断する。この判断がNoの場合には、ステップS57に進む。ステップS57では、ログイン診断をNGとしてステップS58に進む。ステップS55の判断がYesの場合には、ステップS56において、ログイン診断がOKとして、ステップS58に進む。ステップS58においては、診断結果をログイン診断結果テーブルに反映して、ディスクドライブ毎のログイン診断を終了する。
11 デバイスエンクロージャ
12 PBC
13、18 プロセッサ
14 SESデバイス
14a SESデバイス、仮想ログインサーバ、仮想ディレクトリサーバ
15 FC-AL
16 ディスクドライブ
17 ファブリックスイッチ
19 ディレクトリサーバ
20 ログインサーバ
Claims (5)
- RAID制御装置と、ディスクドライブを収容するドライブエンクロージャとがファブリックスイッチを介して接続されるRAIDシステムにおけるディスクドライブ診断装置において、
前記ディスクドライブに対するループイニシャライズ診断結果を管理するディスクドライブ診断結果管理テーブルと、
前記ディスクドライブ診断結果管理テーブルに基づいて、診断結果が良好であった各ディスクドライブとループを構成してファブリックスイッチへのログイン処理を仮想的に実行する仮想ログイン処理手段と、
該仮想的なログイン処理の結果をRAID制御装置に通知すると共に、前記ドライブエンクロージャに対し、該仮想的なログイン処理を正常に行えなかったディスクドライブを、RAID制御装置への接続回線から切り離させ、該仮想的なログイン処理を正常に行えたディスクドライブを前記ファブリックスイッチと接続し、接続された各ディスクドライブに正規のログイン処理を行わせる制御手段と、
を備えることを特徴とするディスクドライブ診断装置。 - 請求項1のディスクドライブ診断装置は、デバイスエンクロージャに設けられていることを特徴とする請求項1に記載のディスクドライブ診断装置。
- RAID制御装置と、ディスクドライブを収容するドライブエンクロージャとがファブリックスイッチを介して接続されるRAIDシステムにおける、該ファブリックスイッチに設けられたディスクドライブ診断装置において、
前記ディスクドライブに対するループイニシャライズ診断結果を管理するディスクドライブ診断結果管理テーブルと、
前記ディスクドライブ診断結果管理テーブルに基づいて、診断結果が良好であった各ディスクドライブのファブリックスイッチへのログイン処理を仮想的に実行する仮想ログイン処理手段と、
該仮想的なログイン処理の結果をRAID制御装置に通知すると共に、前記ドライブエンクロージャに対し、該仮想的なログイン処理を正常に行えなかったディスクドライブを、RAID制御装置への接続回線から切り離させ、該仮想的なログイン処理を正常に行えたディスクドライブを前記ファブリックスイッチと接続し、接続された各ディスクドライブに正規のログイン処理を行わせる制御手段と、
を備えることを特徴とするディスクドライブ診断装置。 - 前記仮想的なログイン処理は、ディスクドライブへ、アクセスのためのアドレスの割り振りを行うためのログインサービスと、ディスクドライブのアドレスをディレクトリに登録するためのディレクトリサービスを受けるための処理であることを特徴とする請求項1に記載のディスクドライブ診断装置。
- 前記RAID制御装置への接続回線は、ループを形成することを特徴とする請求項1に記載のディスクドライブ診断装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007021354A JP4354492B2 (ja) | 2007-01-31 | 2007-01-31 | ディスクドライブ診断装置 |
US12/005,352 US8631211B2 (en) | 2007-01-31 | 2007-12-27 | Disk drive diagnosis apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007021354A JP4354492B2 (ja) | 2007-01-31 | 2007-01-31 | ディスクドライブ診断装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008186377A JP2008186377A (ja) | 2008-08-14 |
JP4354492B2 true JP4354492B2 (ja) | 2009-10-28 |
Family
ID=39729350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007021354A Expired - Fee Related JP4354492B2 (ja) | 2007-01-31 | 2007-01-31 | ディスクドライブ診断装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8631211B2 (ja) |
JP (1) | JP4354492B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4893731B2 (ja) * | 2008-12-25 | 2012-03-07 | 富士通株式会社 | 通信制御装置 |
JP5651962B2 (ja) | 2010-02-03 | 2015-01-14 | 富士通株式会社 | Raid装置、異常デバイス検出装置および異常デバイス検出方法 |
JP6487692B2 (ja) | 2014-12-24 | 2019-03-20 | 富士通株式会社 | 情報処理システム及び情報処理システムの制御方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6356944B1 (en) * | 1997-03-31 | 2002-03-12 | Compaq Information Technologies Group, L.P. | System and method for increasing write performance in a fibre channel environment |
JP4294142B2 (ja) | 1999-02-02 | 2009-07-08 | 株式会社日立製作所 | ディスクサブシステム |
US6785742B1 (en) * | 1999-02-24 | 2004-08-31 | Brocade Communications Systems, Inc. | SCSI enclosure services |
US6968463B2 (en) * | 2001-01-17 | 2005-11-22 | Hewlett-Packard Development Company, L.P. | System for controlling access to resources in a storage area network |
JP4607567B2 (ja) * | 2004-01-09 | 2011-01-05 | 株式会社リコー | 証明書転送方法、証明書転送装置、証明書転送システム、プログラム及び記録媒体 |
US8594083B2 (en) * | 2005-04-01 | 2013-11-26 | Cisco Technology, Inc. | iSCSI and fibre channel authentication |
US7793138B2 (en) * | 2005-12-21 | 2010-09-07 | Cisco Technology, Inc. | Anomaly detection for storage traffic in a data center |
US20070280141A1 (en) * | 2006-05-01 | 2007-12-06 | Seagate Technology, Llc | Hardware implementation of loop initialization protocol |
-
2007
- 2007-01-31 JP JP2007021354A patent/JP4354492B2/ja not_active Expired - Fee Related
- 2007-12-27 US US12/005,352 patent/US8631211B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8631211B2 (en) | 2014-01-14 |
US20080215809A1 (en) | 2008-09-04 |
JP2008186377A (ja) | 2008-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7111084B2 (en) | Data storage network with host transparent failover controlled by host bus adapter | |
US6904544B2 (en) | Method, system, program, and data structures for testing a network system including input/output devices | |
US7793145B2 (en) | Method and apparatus for verifying fault tolerant configuration | |
US20060061369A1 (en) | Information handling system integrated cable tester | |
US7571356B2 (en) | Storage control device, and error information management method for storage control device | |
JP4940967B2 (ja) | ストレージシステム、ストレージ装置、ファームウェアの活性交換方法、ファームウェアの活性交換プログラム | |
JP5523468B2 (ja) | 直接接続ストレージ・システムのためのアクティブ−アクティブ・フェイルオーバー | |
US8037368B2 (en) | Controller capable of self-monitoring, redundant storage system having the same, and method thereof | |
US7302615B2 (en) | Method and system for analyzing loop interface failure | |
US7568119B2 (en) | Storage control device and storage control device path switching method | |
JP2014071576A (ja) | ストレージ制御装置,プログラマブル論理回路の復旧処理方法及び制御プログラム | |
US9286178B2 (en) | Controller, storage apparatus, method of testing storage apparatus, and computer-readable storage medium | |
US8015434B2 (en) | Management apparatus, storage system, and storage apparatus management method | |
WO2012176278A1 (ja) | 情報処理装置、仮想マシン制御方法およびプログラム | |
JP4354492B2 (ja) | ディスクドライブ診断装置 | |
US11537550B2 (en) | Server and method of identifying unsupported drives in a server | |
US8607092B2 (en) | Raid device, abnormal device detecting apparatus, and abnormal device detecting method | |
US9747154B2 (en) | Isolating hardware and network failures in a computing environment | |
TWI439856B (zh) | 具故障備援以管理共享資源之方法與多電腦系統 | |
JP2018005376A (ja) | 通信システム,制御装置および制御プログラム | |
US20080010547A1 (en) | Storage system and method for automatic restoration upon loop anomaly | |
KR101174238B1 (ko) | 자체 장애진단 기능을 갖는 자동화기기 및 그 장애진단 방법 | |
JP2007018049A (ja) | 記憶制御システム | |
JP5027311B2 (ja) | 障害が発生している物理記憶装置を検出するストレージシステム | |
JP5651004B2 (ja) | 計算機切替システム、計算機切替プログラム、および計算機切替方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090327 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090728 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090729 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120807 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120807 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130807 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |