JP2008148339A - Storage device - Google Patents

Storage device Download PDF

Info

Publication number
JP2008148339A
JP2008148339A JP2007339189A JP2007339189A JP2008148339A JP 2008148339 A JP2008148339 A JP 2008148339A JP 2007339189 A JP2007339189 A JP 2007339189A JP 2007339189 A JP2007339189 A JP 2007339189A JP 2008148339 A JP2008148339 A JP 2008148339A
Authority
JP
Japan
Prior art keywords
loop
storage device
pbc
failure
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007339189A
Other languages
Japanese (ja)
Other versions
JP4658114B2 (en
Inventor
Koji Nagata
幸司 永田
Kenichi Takamoto
賢一 高本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007339189A priority Critical patent/JP4658114B2/en
Publication of JP2008148339A publication Critical patent/JP2008148339A/en
Application granted granted Critical
Publication of JP4658114B2 publication Critical patent/JP4658114B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To suppress reduction in performance or reliability to a minimum when a fault occurs in a system comprising a loop-like communication means such as FC-AL. <P>SOLUTION: A plurality of controllers 101, 102 and a plurality of drives 111-114 are connected via a plurality of FC loops 161, 171, wherein in addition to PBC 121-126 and PBC 131-136 for individually controlling bypasses to the FC loops 161, 171 of the controllers 101, 102 and the drives 111-114, PBC 141-143 and PBC 151-153 are provided for short-circuiting the FC loops 161, 171 in the middle of the path and the FC loops are bypassed at positions of the PBC 141-143 and the PBC 151-153, so that the FC loops are continuously used by partially disconnecting a fault portion in the FC loop and reduction in performance or reliability in fault occurrence is suppressed to a minimum. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、記憶装置および情報処理技術に関し、特に、複数の構成要素をファイバチャネルループ等のループ状通信手段にて接続した構成の記憶装置および情報処理システム等に適用して有効な技術に関する。   The present invention relates to a storage device and information processing technology, and more particularly to a technology effective when applied to a storage device, an information processing system, and the like having a configuration in which a plurality of components are connected by loop communication means such as a fiber channel loop.

超高速ギガビット・ネットワーク技術の一つとして、ANSI NCITST11(旧ANSI X3 T11)で標準化が進められているファイバチャネルが知られている。   As one of ultra-high speed gigabit network technologies, Fiber Channel, which is being standardized by ANSI NCITST11 (formerly ANSI X3 T11), is known.

このようなファイバチャネル(FC)を利用すれば、複数のハードディスク(ドライブ)を接続し、1つの大きな記憶装置を構築することが可能である。このFCループの接続方式(FIBRE CHANNEL ARBITRATED LOOP(FC‐AL))では、記憶装置のドライブを制御するコントローラと各ドライブをループ状に接続する。各ドライブとFCループとの接続部には、ドライブの交換時や故障時の場合等ドライブをループから切り離すためのポートバイパス回路(PBC)が接続されている。   By using such a fiber channel (FC), it is possible to connect a plurality of hard disks (drives) to construct one large storage device. In this FC loop connection method (FIBRE CHANNEL ARBITRATED LOOP (FC-AL)), the controller for controlling the drive of the storage device and each drive are connected in a loop. A connection portion between each drive and the FC loop is connected to a port bypass circuit (PBC) for disconnecting the drive from the loop, such as when a drive is replaced or failed.

FCループの規格上、ループが1カ所でも切断されると、コントローラとループ上の各ドライブとの通信が不可能になるため、当該FCループを利用して構築された外部記憶装置では、個々のドライブを切り離す場合に、PBCによって接続を繋ぎ変えてループが切れない様にFCループを制御する必要がある。   According to the FC loop standard, if the loop is disconnected even at one location, communication between the controller and each drive on the loop becomes impossible. Therefore, in the external storage device constructed using the FC loop, individual When disconnecting the drive, it is necessary to control the FC loop so that the connection is changed by the PBC and the loop is not broken.

特開平10−285198号公報(特許文献1)に述べられている様に、異常発生時だけでなく、正常時も性能向上のためにPBCを制御して、使用率が低いドライブは、使用する時だけループに接続する事や各ループの負荷分散のためにPBCを制御することも可能である。
特開平10−285198号公報
As described in Japanese Patent Laid-Open No. 10-285198 (Patent Document 1), a drive with a low usage rate is used by controlling the PBC not only when an abnormality occurs but also during normal operation to improve performance. It is also possible to control the PBC to connect to the loop only for the time and to distribute the load of each loop.
Japanese Patent Laid-Open No. 10-285198

FCループを利用して、複数のドライブを接続して構築された1つの記憶装置において、特定のドライブに障害が発生した場合は、PBCによって、障害のドライブをループから切り離すことによって、他のドライブは動作を続けることが可能である。しかし、何らかの理由でループの接続が切れた場合やループの通信を妨害された場合は、ループに接続されている全ドライブが使用不可になる、という技術的課題がある。   In a single storage device constructed by connecting a plurality of drives using an FC loop, if a failure occurs in a specific drive, the PBC decouples the failed drive from the loop to another drive. Can continue to operate. However, there is a technical problem that all the drives connected to the loop become unusable when the connection of the loop is interrupted for some reason or when communication of the loop is interrupted.

上記技術的課題の対策として、複数のドライブをFCループを介して接続することで構成された記憶装置において、FCループを2重に設定し、片方のループで障害が発生した場合、もう一方のループを使用して通信を続けさせる方法が考えられる。   As a countermeasure for the above technical problem, in a storage device configured by connecting multiple drives via an FC loop, if the FC loop is set to be double and a failure occurs in one loop, the other A method of continuing communication using a loop can be considered.

但し、このようなFCループを2重に設定する、という対策を施した場合でも障害の発生したループでは、障害部位がどこかわからない。このため保守員は、障害ループの修復時に当該障害ループに含まれている個々のドライブ等の構成要素を1つ1つ交換して正常に動作するか確認することにより、どこが障害部位だったかを特定する煩雑な作業が必要となる、という別の技術的課題が生じる。   However, even when a countermeasure is taken to set such an FC loop in a double manner, the location of the fault is unknown in the loop where the fault has occurred. For this reason, the maintenance staff can identify the location of the failure by exchanging the individual components such as individual drives included in the failure loop one by one and confirming that they are operating normally. Another technical problem arises that it is necessary to specify complicated work.

また、2重のループのうちの片方のループだけで通信を行うためデータ転送速度等の性能が低下する。さらに、ループを2重に設定している場合でも、ドライブの各ループで共通の部分に障害が発生した場合、2つのループとも通信が不可能になるため、記憶装置全体が動作不可能になる、という技術的課題がある。   Further, since communication is performed using only one of the double loops, performance such as data transfer speed is degraded. Furthermore, even when the loop is set to be double, if a failure occurs in a common part of each loop of the drive, communication with the two loops becomes impossible, and the entire storage device becomes inoperable. There is a technical problem.

本発明の目的は、ループ状通信手段を備えた構成において障害発生時の性能や信頼性の低下を最小限に止めることが可能な記憶装置を提供することにある。   An object of the present invention is to provide a storage device capable of minimizing degradation in performance and reliability when a failure occurs in a configuration including a loop communication means.

本発明の他の目的は、ループ状通信手段を備えた構成において、障害部位の特定、回復作業を迅速、簡便かつ的確に行うことが可能な記憶装置を提供することにある。   Another object of the present invention is to provide a storage device capable of quickly, simply and accurately performing identification and recovery of a faulty part in a configuration including a loop communication means.

本発明の他の目的は、ループ状通信手段を多重に備えた構成において、複数のループ状通信手段に及ぶ多重障害発生時の復旧を確実に行うことが可能な記憶装置を提供することにある。   Another object of the present invention is to provide a storage device capable of reliably performing recovery when a multiple failure occurs across a plurality of loop communication means in a configuration including multiple loop communication means. .

本発明の目的は、ループ状通信手段を備えた構成において障害発生時の性能や信頼性の低下を最小限に止めることが可能な情報処理システムを提供することにある。   An object of the present invention is to provide an information processing system capable of minimizing a decrease in performance and reliability when a failure occurs in a configuration including a loop communication unit.

本発明の他の目的は、ループ状通信手段を備えた構成において、障害部位の特定、回復作業を迅速、簡便かつ的確に行うことが可能な情報処理システムを提供することにある。   Another object of the present invention is to provide an information processing system capable of quickly, simply and accurately performing a failure site identification and recovery operation in a configuration including a loop communication means.

本発明の他の目的は、ループ状通信手段を多重に備えた構成において、複数のループ状通信手段に及ぶ多重障害発生時の復旧を確実に行うことが可能な情報処理システムを提供することにある。   Another object of the present invention is to provide an information processing system capable of reliably recovering from the occurrence of multiple faults extending to a plurality of loop communication means in a configuration having multiple loop communication means. is there.

本発明は、少なくとも一つの単位記憶装置と、前記単位記憶装置を制御する少なくとも一つのコントローラと、前記単位記憶装置および前記コントローラをループ状に接続し、前記コントローラおよび前記単位記憶装置の相互間における情報の授受を行うループ状通信手段とを含む記憶装置において、前記単位記憶装置および前記コントローラの前記ループ状通信手段に対する接続および切り離しを個別に制御する第1のバイパス手段と、前記ループ状通信手段を任意の位置で短絡させ、前記ループ状通信手段の経路の一部を選択的に切り離す第2のバイパス手段と、を含む構成としたものである。   The present invention relates to at least one unit storage device, at least one controller for controlling the unit storage device, the unit storage device and the controller connected in a loop, and between the controller and the unit storage device. In a storage device including a loop communication means for exchanging information, a first bypass means for individually controlling connection and disconnection of the unit storage device and the controller to the loop communication means, and the loop communication means And a second bypass means for selectively disconnecting a part of the path of the loop communication means.

また、本発明は、各々が情報の記憶および処理の少なくとも一方の動作を行う複数の単位構成要素と、複数の前記単位構成要素をループ状に接続し、前記単位構成要素の間における情報の授受が行われるループ状通信手段とを含む情報処理システムにおいて、前記単位構成要素の前記ループ状通信手段に対する接続および切り離しを個別に制御する第1のバイパス手段と、前記ループ状通信手段を任意の位置で短絡させ、前記ループ状通信手段の経路の一部を選択的に切り離す第2のバイパス手段と、を備えたものである。   The present invention also provides a plurality of unit components that each perform at least one of storage and processing of information and a plurality of the unit components connected in a loop to exchange information between the unit components. In the information processing system including the loop-shaped communication unit, the first bypass unit that individually controls connection and disconnection of the unit component to and from the loop-shaped communication unit, and the loop-shaped communication unit at an arbitrary position. And a second bypass means for selectively disconnecting a part of the path of the loop communication means.

より具体的には、複数のドライブとコントローラをFC_AL等のループで接続した構成の記憶装置において、ドライブおよびコントローラとループとの間の切り離しを行うPBC(第1のバイパス手段)の他に、ループの所々に当該ループを短絡させるPBC(第2のバイパス手段)を設置する。   More specifically, in a storage device having a configuration in which a plurality of drives and a controller are connected by a loop such as FC_AL, in addition to the PBC (first bypass means) that separates the drive and the controller from the loop, the loop PBC (second bypass means) for short-circuiting the loop is installed at these locations.

これらのPBCを制御することによって、ループのどこで障害が発生しているか切り分ける。実際には、PBCを制御してループの一部分だけを有効にして、通信が可能か確認する操作を、当該ループの有効部分を変更して反復することにより、障害部位を特定する。ループで使用できる部分がある場合は、そのループを使用して、使用できない部分のみ他方のループに切り替えることによって、性能の低下を最小限にする。   By controlling these PBCs, it is determined where in the loop the failure has occurred. Actually, the PBC is controlled to enable only a part of the loop, and the operation of confirming whether communication is possible is performed by changing the effective part of the loop and repeating the operation to identify the faulty part. If there is a part that can be used in the loop, the loop is used to switch only the unusable part to the other loop, thereby minimizing performance degradation.

また、ループからPBCを制御する命令を発行するのではなく、PBCを制御する専用のバスを設けることにより、2重のループが両方とも通信が不可能になった場合でも、障害部位を切り離すことが可能となり、その他の部分は通信可能状態に復帰できる。   Also, instead of issuing an instruction to control the PBC from the loop, by providing a dedicated bus for controlling the PBC, even if both loops cannot communicate, the faulty part is separated. The other parts can return to the communicable state.

本発明の記憶装置によれば、ループ状通信手段を備えた構成において障害発生時の性能や信頼性の低下を最小限に止めることができる、という効果が得られる。   According to the storage device of the present invention, it is possible to obtain an effect that it is possible to minimize a decrease in performance and reliability when a failure occurs in a configuration including a loop communication unit.

本発明の記憶装置によれば、ループ状通信手段を備えた構成において、障害部位の特定、回復作業を迅速、簡便かつ的確に行うことができる、という効果が得られる。   According to the storage device of the present invention, in the configuration including the loop communication means, it is possible to obtain the effect that the faulty part can be identified and recovered quickly, simply and accurately.

本発明の記憶装置によれば、ループ状通信手段を多重に備えた構成において、複数のループ状通信手段に及ぶ多重障害発生時の復旧を確実に行うことができる、という効果が得られる。   According to the storage device of the present invention, it is possible to reliably perform recovery when a multiple failure occurs across a plurality of loop communication means in a configuration including multiple loop communication means.

本発明の情報処理システムによれば、ループ状通信手段を備えた構成において障害発生時の性能や信頼性の低下を最小限に止めることができる、という効果が得られる。   According to the information processing system of the present invention, it is possible to obtain an effect that it is possible to minimize a decrease in performance and reliability when a failure occurs in a configuration including a loop communication unit.

本発明の情報処理システムによれば、ループ状通信手段を備えた構成において、障害部位の特定、回復作業を迅速、簡便かつ的確に行うことができる、という効果が得られる。   According to the information processing system of the present invention, in the configuration including the loop communication means, it is possible to obtain an effect that it is possible to quickly and easily and accurately perform the identification and recovery work of the faulty part.

本発明の情報処理システムによれば、ループ状通信手段を多重に備えた構成において、複数のループ状通信手段に及ぶ多重障害発生時の復旧を確実に行うことができる、という効果が得られる。   According to the information processing system of the present invention, it is possible to reliably perform recovery when a multiple failure occurs across a plurality of loop communication means in a configuration including multiple loop communication means.

以下、本発明の一実施例について図面を用いて詳細に説明する。   Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.

図1は、本発明の情報処理システムおよび記憶装置の一実施の形態である記憶装置のループ接続構成の1例を示した概念図であり、図2は、本実施の形態の記憶装置の全体構成の一例を示す概念図である。   FIG. 1 is a conceptual diagram showing an example of a loop connection configuration of a storage device which is an embodiment of an information processing system and a storage device of the present invention. FIG. 2 is an overall view of the storage device of the present embodiment. It is a conceptual diagram which shows an example of a structure.

本実施の形態では、記憶装置におけるループ状通信手段の一例としてFC_AL(FIBRE CHANNEL ARBITRATED LOOP)(以下、FCループと記す)を用いた場合を例に採って説明する。   In this embodiment, a case where FC_AL (FIBER CHANNEL ARBITRATED LOOP) (hereinafter referred to as an FC loop) is used as an example of a loop communication unit in a storage device will be described as an example.

図2の全体構成に例示されるように、本実施の形態の記憶装置は、複数のコントローラ101、コントローラ102と、これらに共有されるキャッシュメモリ103、図示しない上位装置との間におけるデータの授受を制御する複数のホストインタフェース104、ホストインタフェース105、を備えている。   As illustrated in the overall configuration of FIG. 2, the storage device according to the present embodiment is configured to exchange data between a plurality of controllers 101, a controller 102, a cache memory 103 shared by them, and a host device (not shown). A plurality of host interfaces 104 and a host interface 105 are provided.

複数のコントローラ101、102の配下には、複数のドライブ111、ドライブ112、ドライブ113、ドライブ114が、多重に設けられたFCループ161、FCループ171、ポートバイパス回路(PBC)を介して共有されるように接続されている。   Under the plurality of controllers 101 and 102, a plurality of drives 111, drives 112, drives 113, and drives 114 are shared via multiple FC loops 161, FC loops 171 and port bypass circuits (PBC). Connected so that.

すなわち、図2に例示されるように、本実施の形態の記憶装置では、2個のコントローラ101、102が、それぞれ別々のFCループ161、162にPBC121、PBC122、および PBC131、PBC132を通じて接続されている。4台のドライブ111、112、113、114は、一方のFCループ161にPBC123、PBC124、PBC125、PBC126を通じて接続されており、他方のFCループ171にPBC133、PBC134、PBC135、PBC136を通じて接続されている。   That is, as illustrated in FIG. 2, in the storage device of the present embodiment, two controllers 101 and 102 are connected to separate FC loops 161 and 162 through PBC 121, PBC 122, PBC 131, and PBC 132, respectively. Yes. The four drives 111, 112, 113, 114 are connected to one FC loop 161 through PBC123, PBC124, PBC125, PBC126, and connected to the other FC loop 171 through PBC133, PBC134, PBC135, PBC136. .

本実施の形態の場合、FCループ161には、FCループを短絡させるためのPBC141、PBC142、PBC143が接続されており、FCループ171には、PBC151、PBC152、PBC153が接続されている。   In the present embodiment, PBC 141, PBC 142, and PBC 143 for short-circuiting the FC loop are connected to the FC loop 161, and PBC 151, PBC 152, and PBC 153 are connected to the FC loop 171.

図3および図4に本実施の形態におけるPBCの構成の一例を示す。すなわち、図3に例示されるように、個々のコントローラやドライブをFCループに接続するPBC121〜PBC126およびPBC131〜PBC136の各々(以下、PBC600と総称する)は、FCループ161およびFCループ171に対するドライブ、コントローラの接続の有無を切り換えるセレクタ601と、ドライブ、コントローラの側の動作異常の有無を監視して、異常(障害)の発生時には、セレクタ601に入力されるバイパス制御信号602にて、ドライブ、コントローラをバイパスしてFCループ側から切り離す(図3のセレクタ601の状態はバイパス状態を示している)動作を行う障害監視回路603と、バイパス制御信号602がON(バイパス状態)のときに点灯して外部にバイパス状態であることを報知するLED等の表示ランプ604、等で構成されている。   3 and 4 show an example of the configuration of the PBC in the present embodiment. That is, as illustrated in FIG. 3, each of PBC 121 to PBC 126 and PBC 131 to PBC 136 (hereinafter collectively referred to as PBC 600) that connects individual controllers and drives to the FC loop is a drive for the FC loop 161 and the FC loop 171. The selector 601 for switching the presence / absence of connection of the controller and the presence / absence of an operation abnormality on the drive / controller side are monitored. When an abnormality (failure) occurs, the bypass control signal 602 input to the selector 601 Lights up when the fault monitoring circuit 603 for performing the operation of bypassing the controller and disconnecting from the FC loop side (the state of the selector 601 in FIG. 3 indicates the bypass state) and the bypass control signal 602 are ON (bypass state). Make sure that it is bypassed externally. Display lamp 604 such as an LED that knowledge, and a like.

バイパス制御信号602は、外部(たとえばドライブに設けられた図示しない制御端子等)からも入力することが可能であり、障害監視回路603の動作とは無関係に外部からバイパス状態を制御することも可能である。   The bypass control signal 602 can be input from the outside (for example, a control terminal (not shown) provided in the drive), and the bypass state can be controlled from the outside regardless of the operation of the failure monitoring circuit 603. It is.

すなわち、本実施の形態の記憶装置では、一例として、FCループ161およびFCループ171におけるファイバチャネルプロトコルのデータリンク層として、SCSI−FCP(SCSI−3 Fibre Channel Protocol)を用いる。   That is, in the storage device of this embodiment, as an example, SCSI-FCP (SCSI-3 Fiber Channel Protocol) is used as the data link layer of the fiber channel protocol in the FC loop 161 and the FC loop 171.

このSCSI−FCPを用いる場合、記憶装置はSCSI−FCPのイニシエータであるコントローラ101および102からターゲットとしてのドライブ111〜114の各々に対して発行されるFCPコマンドのSCSI SendDiagnosticsにて、パラメータ・リストで指定することにより、バイパス制御信号602、バイパス制御信号702、のON/OFFの出力指令を、ドライブ111〜114の各々に指示することが可能である。   When this SCSI-FCP is used, the storage device is a parameter list in SCSI Send Diagnostics of FCP commands issued from the controllers 101 and 102 which are SCSI-FCP initiators to each of the drives 111 to 114 as targets. By specifying, it is possible to instruct each of the drives 111 to 114 to output an ON / OFF command of the bypass control signal 602 and the bypass control signal 702.

これにより、コントローラ101および102は、ドライブ111〜114の図示しない制御端子を経由してバイパス制御信号602、バイパス制御信号702を出力させることで、PBC600、PBC700の各々におけるバイパス動作を制御する。   Thus, the controllers 101 and 102 control the bypass operation in each of the PBC 600 and the PBC 700 by outputting the bypass control signal 602 and the bypass control signal 702 via control terminals (not shown) of the drives 111 to 114.

また、同様に、現在のPBC600、PBC700におけるバイパスの有無の状態(すなわち、バイパス制御信号602、バイパス制御信号702の状態)は、FCPコマンドのSCSI Receive Diagnostic Resultsにて、ドライブ111〜114の各々を介して、コントローラ101および102が知ることができる。   Similarly, the current presence / absence of bypass in the PBC 600 and PBC 700 (that is, the states of the bypass control signal 602 and the bypass control signal 702) is determined by setting each of the drives 111 to 114 in the SCSI Receive Diagnostics Results of the FCP command. Through this, the controllers 101 and 102 can know.

一方、図4に例示されるように、FCループ161およびFCループ171の途中に設けられたPBC141〜143およびPBC151〜153の各々(以下、PBC700と総称する)は、FCループ161およびFCループ171の途中の短絡(バイパス)を行うセレクタ701と、外部からこのセレクタ701の切換え動作の制御のために入力されるバイパス制御信号702と、バイパス制御信号702がON(バイパス状態)のときに点灯して外部にバイパス状態であることを報知するLED等の表示ランプ703、等で構成されている。   On the other hand, as illustrated in FIG. 4, each of PBC 141 to 143 and PBC 151 to 153 (hereinafter collectively referred to as PBC 700) provided in the middle of the FC loop 161 and the FC loop 171 is the FC loop 161 and the FC loop 171. Lights when the selector 701 performs a short circuit (bypass) in the middle of the signal, the bypass control signal 702 input from outside for controlling the switching operation of the selector 701, and the bypass control signal 702 is ON (bypass state). And a display lamp 703 such as an LED for informing the outside of the bypass state.

たとえば、図1および図2の構成例では、PBC121〜PBC126およびPBC131〜PBC136、PBC141〜143およびPBC151〜153の各々に入力されるバイパス 制御信号602、バイパス制御信号702は、コントローラ101、102から、互いに反対側のFCループを経由して、最も近いドライブから入力することができる。   For example, in the configuration example of FIG. 1 and FIG. 2, bypass control signal 602 and bypass control signal 702 input to each of PBC 121 to PBC 126 and PBC 131 to PBC 136, PBC 141 to 143 and PBC 151 to 153 are transmitted from controllers 101 and 102, respectively. It is possible to input from the nearest drive via FC loops opposite to each other.

これにより、本実施の形態の記憶装置では、一方のFCループ161(171)に障害が発生した時、他のFCループ171(161)を経由して目的のドライブに対してバイパス制御信号602、バイパス制御信号702を近傍のPBCに出力させることで、後述の図9におけるような個々のPBCの切換え制御が可能になる。   Thereby, in the storage device of the present embodiment, when a failure occurs in one FC loop 161 (171), the bypass control signal 602 is sent to the target drive via the other FC loop 171 (161). By outputting the bypass control signal 702 to nearby PBCs, switching control of individual PBCs as shown in FIG. 9 described later becomes possible.

なお、本実施の形態の記憶装置では、FCループ161、171として、光ファイバや導線等の通信媒体を用いることに限らず、図6に例示されるような、実装ボード上の配線パターンにてFCループ161、171を構成することも含まれる。   In the storage device of this embodiment, the FC loops 161 and 171 are not limited to using a communication medium such as an optical fiber or a conductive wire, but may be a wiring pattern on a mounting board as illustrated in FIG. The configuration of the FC loops 161 and 171 is also included.

すなわち、図6に例示されるように、本実施の形態の記憶装置では、実装ボード10に、複数のFCループ161、FCループ171を配線パターンとして配置し、さらに、これらに接続されるPBC121〜126、PBC131〜136、さらにはPBC141〜143、PBC151〜153を、この実装ボード10上に形成する。そして、コネクタ11を介して、複数のコントローラ101、102および複数のドライブ111〜114のユニットは、複数のFCループ161、FCループ171の各々に着脱自在に実装される。このような図6の構成の場合、個々のPBCの表示ランプは、たとえば、実装ボード10上に配置され、個々のPBCのバイパス状態が外部から視認可能にされる。   That is, as illustrated in FIG. 6, in the storage device according to the present embodiment, a plurality of FC loops 161 and FC loops 171 are arranged as wiring patterns on the mounting board 10, and further, PBC 121-1 connected to these are arranged. 126, PBC 131 to 136, and further PBC 141 to 143 and PBC 151 to 153 are formed on the mounting board 10. The units of the plurality of controllers 101 and 102 and the plurality of drives 111 to 114 are detachably mounted on each of the plurality of FC loops 161 and 171 via the connector 11. In the case of such a configuration of FIG. 6, the display lamps of the individual PBCs are arranged on the mounting board 10, for example, and the bypass state of the individual PBCs can be visually recognized from the outside.

また、特に図示しないが、必要に応じて、コネクタ11を用いて、一部のドライブの代わりに、FCループ161、FCループ171に、外部の光ファイバや導線等の通信媒体を接続することで、本実施の形態の記憶装置を外部システムと接続する構成としてもよい。   Although not particularly shown, if necessary, a communication medium such as an external optical fiber or a conductor can be connected to the FC loop 161 and the FC loop 171 using a connector 11 instead of a part of the drives. The storage device of this embodiment may be connected to an external system.

図6のような構成を採る記憶装置としては、たとえば、複数のドライブ111〜114に、上位装置との間で授受されるデータおよび当該データから生成された冗長データを分散して格納することにより、格納データの信頼性の向上や、複数のドライブ111〜114に対する並列アクセスによるスループットの向上を実現するディスクアレイシステムが考えられる。   As a storage device having the configuration as shown in FIG. 6, for example, by distributing and storing data exchanged with a host device and redundant data generated from the data to a plurality of drives 111 to 114 A disk array system that can improve the reliability of stored data and improve the throughput by parallel access to a plurality of drives 111 to 114 can be considered.

通常の動作では、コントローラ101は、FCループ161だけを使用し、コントローラ102は、FCループ171だけを使用する事によって、各コントローラは、多重に設けられたFCループ161、171の各々の通信帯域を占有して使用することができる。また、コントローラ101、102の各々とドライブ111〜114の通信は、互いに他のコントローラの動作等の影響を受けることがない。   In normal operation, the controller 101 uses only the FC loop 161, and the controller 102 uses only the FC loop 171, so that each controller can communicate with each of the communication bands of the FC loops 161 and 171 provided in multiplex. Can be used exclusively. Further, the communication between each of the controllers 101 and 102 and the drives 111 to 114 is not affected by the operation of other controllers.

特開平10−285198号公報に示される様にドライブが故障した場合や、性能向上のため未使用のドライブを切り離す場合には、本実施の形態の記憶装置では、PBC123〜126、あるいはPBC133〜135を使用して、該当のドライブを切り離す。   As shown in Japanese Patent Laid-Open No. 10-285198, when a drive fails or when an unused drive is disconnected for performance improvement, the storage device of this embodiment uses PBC 123-126 or PBC 133-135. Use to disconnect the drive.

一例として、本実施の形態の記憶装置は、ドライブ114を各FCループから切り離す場合、PBC126を切り替えて、FCループ161からドライブ114を切り離し、PBC136を切り替えて、FCループ171からドライブ114を切り離す。   As an example, when the drive 114 is disconnected from each FC loop, the storage device of this embodiment switches the PBC 126 to disconnect the drive 114 from the FC loop 161 and switches the PBC 136 to disconnect the drive 114 from the FC loop 171.

この時のPBCの状態を図7に示す。本実施の形態の記憶装置のPBCでは、ドライブやコントローラが接続されている場合は、図7の左側に例示された接続状態201となる。また、ドライブやコントローラを切り離す場合は、図7の右側に例示された切断状態202(バイパス状態)になり、ドライブやコントローラはFCループから切り離される。   The state of the PBC at this time is shown in FIG. In the PBC of the storage device of this embodiment, when a drive or a controller is connected, the connection state 201 illustrated on the left side of FIG. 7 is obtained. When the drive or controller is disconnected, the disconnection state 202 (bypass state) illustrated on the right side of FIG. 7 is set, and the drive or controller is disconnected from the FC loop.

但し、ドライブやコントローラではなく、FCループ161、171の一部で障害が発生した場合は、上記の方式では回復できないため、もし、FCループ161に障害が発生した場合、FCループ161を使用していたコントローラ101は、コントローラ102と同じく、FCループ171を使用することによって、障害を回避する。この場合、コントローラ101、102が同じFCループ171を使用するため、通信の帯域が2つのFCループを使用していた場合に比べて半減し、性能が低下する。   However, if a failure occurs in a part of the FC loop 161 or 171 instead of the drive or controller, the above method cannot be used for recovery. If a failure occurs in the FC loop 161, the FC loop 161 is used. The controller 101 that had been used avoids a failure by using the FC loop 171 as in the controller 102. In this case, since the controllers 101 and 102 use the same FC loop 171, the communication band is halved compared to the case where two FC loops are used, and the performance is degraded.

そこで、本実施の形態では、FCループ障害発生時に、PBC141〜143あるいはPBC151〜153を用いてFCループの障害部位を切り離すことによって、性能低下を防ぐ。以下に具体例を示す。   Therefore, in the present embodiment, when an FC loop failure occurs, performance degradation is prevented by separating the failure portion of the FC loop using PBC 141 to 143 or PBC 151 to 153. Specific examples are shown below.

図9の(a)は、片方のFCループ161がループ障害箇所181によって、通信不可能になった場合の状態を示している(簡略化のため、片側のFCループ161のみ表示している)。コントローラ101または102では、FCループの障害発生時に、まずコントローラから1番遠いドライブ114をPBC126を切り替えることによって、FCループから切り離す。この状態が図9の(b)である。しかし、この図9の(b)の状態でもFCループ161上にループ障害箇所181があるため、当該FCループ161は通信不可能である。   FIG. 9A shows a state where one FC loop 161 becomes unable to communicate due to a loop failure point 181 (for simplification, only one FC loop 161 is shown). . When the failure of the FC loop occurs, the controller 101 or 102 first disconnects the drive 114 farthest from the controller from the FC loop by switching the PBC 126. This state is shown in FIG. However, even in the state shown in FIG. 9B, the loop failure location 181 exists on the FC loop 161, so that the FC loop 161 cannot communicate.

コントローラ101または102では、次にPBC143を切り替えて、FCループを短絡させる。この時のPBC143の状態を図8に示す。PBC143は、通常の接続状態では、図8の左側の接続状態301の状態であるが、FCループを短絡させる時は、図8の右側の短絡状態302(バイパス状態)になり、FCループをコントローラに近い側(FCループ161a)と、遠い側(FCループ161b)に分割する。PBC143を短絡状態302に切り替えた状態が、図9の(c)である。この図9の(c)の状態だとループ障害箇所181を含むFCループ161bがFCループ161から切り離されたため、FCループ161aは通信可能である。これによってFCループの障害がループ障害箇所181で発生していることが特定できる。   Next, the controller 101 or 102 switches the PBC 143 to short-circuit the FC loop. The state of the PBC 143 at this time is shown in FIG. In the normal connection state, the PBC 143 is in the state of the connection state 301 on the left side of FIG. 8, but when the FC loop is short-circuited, the PBC 143 becomes the short-circuit state 302 (bypass state) on the right side of FIG. It is divided into a side closer to (FC loop 161a) and a side farther (FC loop 161b). FIG. 9C shows a state where the PBC 143 is switched to the short circuit state 302. In the state shown in FIG. 9C, the FC loop 161b including the loop fault location 181 is disconnected from the FC loop 161, so that the FC loop 161a can communicate. As a result, it can be determined that a failure of the FC loop has occurred at the loop failure location 181.

すなわち、本実施の形態の各PBCでは、バイパス状態(短絡状態302)では表示ランプが点灯するので、障害の対策時に、各PBCにおける表示ランプの点灯の有無にてFCループやドライブのどこが障害かわかるため、部品の交換等の保守作業が容易になる。たとえば、ディスクアレイ等の記憶装置では、多数のドライブを備えた構成であるため、障害箇所の特定の迅速化等に、特に大きい効果が期待できる。   That is, in each PBC of the present embodiment, the display lamp is lit in the bypass state (short circuit state 302). Therefore, where the failure of the FC loop or drive depends on whether or not the display lamp is lit in each PBC at the time of troubleshooting As a result, maintenance work such as replacement of parts becomes easy. For example, since a storage device such as a disk array has a configuration including a large number of drives, a particularly great effect can be expected in speeding up the identification of a failure location.

図9(c)の状態では、ループ障害箇所181を含むFCループ161bに属するドライブ114は、FCループ161から通信できないので、他のFCループ171から 通信を行う必要があるが、ドライブ111、112、113は、FCループ161(FCループ161a)から通信できるので、他のFCループ171の通信の負荷の増加を最小限に抑止することができる。   In the state of FIG. 9C, the drive 114 belonging to the FC loop 161b including the loop fault location 181 cannot communicate from the FC loop 161. Therefore, it is necessary to perform communication from the other FC loop 171, but the drives 111 and 112 113 can communicate from the FC loop 161 (FC loop 161a), so that an increase in communication load of other FC loops 171 can be suppressed to a minimum.

FCループ161の他の場所でループ障害が発生した場合でも、コントローラ101または102は、FCループのコントローラから遠い順にPBC126、143、125、142、124、141、123を切り替えてゆけば、どこでループ障害が発生しているか判断可能であり、ループ障害の部位を切り離せば、FCループの通信可能な部分を使用して、性能の低下を最小限に押さえることが可能である。   Even if a loop failure occurs elsewhere in the FC loop 161, if the controller 101 or 102 switches the PBC 126, 143, 125, 142, 124, 141, 123 in order of increasing distance from the controller of the FC loop, the loop It is possible to determine whether or not a failure has occurred, and by separating the loop failure portion, it is possible to minimize the performance degradation by using the communicable portion of the FC loop.

図5に、上述のような障害部位の検出動作をコントローラに自動的に実行させる場合の制御動作の一例をフローチャートとして示す。このフローチャートでは、制御対象の複数のPBCの各々に対して、コントローラから最も遠い位置から近い方に昇順に、0、1、2、3…のようなIDを付与して障害検出プログラムに認識/制御させることで、コントローラ101または102に、各PBCのバイパス/接続動作を自動的に行わせる例を示している。   FIG. 5 is a flowchart showing an example of the control operation when the controller automatically executes the operation for detecting the faulty part as described above. In this flowchart, IDs such as 0, 1, 2, 3,... Are assigned to each of a plurality of PBCs to be controlled in ascending order from the position farthest from the controller to be recognized / recognized by the failure detection program. An example is shown in which the controller 101 or 102 is automatically controlled to perform bypass / connection operation of each PBC by being controlled.

すなわち、FCループ161に着目すると(FCループ162の側も以下と同様)、コントローラ101および102は、まず、コントローラ以外の複数のPBC123〜126およびPBC141〜143の各々に、コントローラから遠い順に、0〜6のIDを付与しておく。具体的には、PBC126:ID=“0”、PBC125:ID=“1”、PBC124:ID=“2”、PBC123:ID=“3”、PBC143:ID=“4”、PBC142:ID=“5”、PBC141:ID=“6”、となる。   That is, when attention is focused on the FC loop 161 (the FC loop 162 side is the same as the following), the controllers 101 and 102 first set the PBCs 123 to 126 and the PBC 141 to 143 other than the controller in the order of increasing distance from the controller. ID of ~ 6 is given. Specifically, PBC126: ID = “0”, PBC125: ID = “1”, PBC124: ID = “2”, PBC123: ID = “3”, PBC143: ID = “4”, PBC142: ID = “ 5 ”, PBC141: ID =“ 6 ”.

そして、コントローラ101、102は、ループでの障害発生を監視し(ステップ801)、検出したら、コントローラから最も遠いPBC(この場合、PBC126)のIDをセットし(ステップ802)、セットされたIDのPBCをバイパス状態にする(ステップ803)。この操作は、上述のFCPコマンドで可能である。   Then, the controllers 101 and 102 monitor the occurrence of a fault in the loop (step 801), and if detected, set the ID of the PBC farthest from the controller (in this case, PBC 126) (step 802), and set the ID of the set ID. The PBC is set to a bypass state (step 803). This operation can be performed with the FCP command described above.

次に、コントローラ101または102は、上述のバイパス操作で障害が回復したか否かを調べ(ステップ804)、回復するまで、IDをインクリメント(この場合、ID=6まで)しながら同様の操作を反 復する(ステップ810)。なお、コントローラ101または102は、ループの部分使用が不可能な場合(PBC141:ID=“6”のバイパス操作でも障害が回復しない場合)には(ステップ809)、PBC141よりもコントローラに近い側でのループ上のエラーと判定し、FCループ161の放棄を表示する(ステップ813)。   Next, the controller 101 or 102 checks whether or not the failure has been recovered by the above-described bypass operation (step 804), and performs the same operation while incrementing the ID (up to ID = 6 in this case) until the failure is recovered. Repeat (step 810). Note that if the controller 101 or 102 cannot use a part of the loop (PBC 141: failure is not recovered even by bypass operation with ID = “6”) (step 809), the controller 101 or 102 is closer to the controller than the PBC 141. It is determined that there is an error on the loop of the current loop, and the abandonment of the FC loop 161 is displayed (step 813).

ステップ804で障害が回復した場合には、コントローラ101または102は、バイパスした当該IDのPBCが、ドライブのバイパス用のPBC123〜126か、あるいはループ自体のバイパス用のPBC141〜143かを判定する(ステップ805)。すなわち、障害部位が、ドライブ起因かループ起因かでコントローラは障害を切りわける。   When the failure is recovered in step 804, the controller 101 or 102 determines whether the bypassed PBC of the ID is the PBC 123-126 for bypassing the drive or the PBC 141-143 for bypassing the loop itself ( Step 805). That is, the controller divides the fault depending on whether the fault site is caused by a drive or a loop.

そして、コントローラ101または102は、ドライブの障害と判明したら(ステップ806)、バイパスしたPBC(ドライブ)の表示ランプ(LED等)を点灯させ、バイパス状態であることを外部に表示する(ステップ807)。   When the controller 101 or 102 is found to have a drive failure (step 806), the bypassed PBC (drive) indicator lamp (LED, etc.) is turned on to indicate the bypass state to the outside (step 807). .

ステップ805に戻って、ループの部分障害であると判明した場合には(ステップ811)、コントローラ101または102は、ループ用の当該PBCの表示ランプ703を点灯させ、ループの部分障害であることを外部に表示し(ステップ812)、バイパスによって切り離されたループに属するドライブを、他(この場合、FCループ171)の側の制御下に移行させる処理を行う(ステップ808)。   Returning to step 805, if it is determined that the fault is a partial fault in the loop (step 811), the controller 101 or 102 turns on the display lamp 703 of the relevant PBC for the loop to indicate that the fault is a partial fault in the loop. A process of displaying outside (step 812) and shifting the drive belonging to the loop separated by bypass to the other (in this case, FC loop 171) side is performed (step 808).

以上説明したように、本実施の形態の記憶装置では、記憶装置等の情報処理システムにおいて、コントローラ101、102およびドライブ111〜114を多重に設けられたFCループ161およびFCループ171にPBC121〜126およびPBC131〜136を介して接続した構成において、個々のFCループ161、171の各々に当該FCループを短絡するPBC141〜143およびPBC151〜153を備え、これらのPBCによるバイパス動作の切換え制御にて障害位置の特定を行い、その部分を切り離して、ファイバチャネルのFCループを再構成する。   As described above, in the storage device of this embodiment, in the information processing system such as the storage device, the PBCs 121 to 126 are connected to the FC loop 161 and the FC loop 171 in which the controllers 101 and 102 and the drives 111 to 114 are provided in a multiplexed manner. In addition, each of the FC loops 161 and 171 is provided with PBC 141 to 143 and PBC 151 to 153 for short-circuiting the FC loop in the configuration connected via the PBC 131 to 136, and the failure of the bypass operation switching control by these PBCs The position is specified, the part is cut off, and the FC loop of the fiber channel is reconfigured.

これにより、本実施の形態の記憶装置では、障害が発生したFCループでも、通信可能な健全な部位(FCループ161a)はそのまま使用し、通信不可能な部分(FCループ161b)のみ他のFCループに切り替えることによって、部分的ではあるがFCループの多重状態を維持して性能や信頼性の低下を最小限に抑えることが出来る。   As a result, in the storage device according to the present embodiment, a healthy part (FC loop 161a) that can be communicated is used as it is even in the FC loop in which a failure occurs, and only the part that cannot communicate (FC loop 161b) is used for other FCs. By switching to the loop, it is possible to maintain the multiplex state of the FC loop partially, but to minimize degradation of performance and reliability.

また、本実施の形態の記憶装置では、個々のコントローラが、当該コントローラから遠い順にPBC切換え制御を行うことで、ドライブの障害のみならず、FCループの障害位置も自動的に検出できるので、障害の回復操作等の保守管理作業を迅速かつ的確に行うことが可能になる。   Further, in the storage device of the present embodiment, each controller can perform PBC switching control in the order of distance from the controller, so that not only the failure of the drive but also the failure position of the FC loop can be automatically detected. Maintenance management work such as recovery operations can be performed quickly and accurately.

上述のように、多重に設けられた複数のFCループ161、171を用いて、ループ障害時に互いに他の健全なFCループ側からPBCの切換え制御を行わせる場合には、二つのFCループに同時に障害が発生した場合には回復が困難になる。   As described above, when a plurality of FC loops 161 and 171 are used and PBC switching control is performed from the other healthy FC loop side at the time of a loop failure, the two FC loops are simultaneously controlled. When a failure occurs, recovery becomes difficult.

そこで、本実施の形態の記憶装置の変形例として、以下に、2つのFCループに同時に障害が発生した場合に、FCループの通信を回復する手段の一例を示す。   Therefore, as a modification of the storage device of the present embodiment, an example of means for recovering communication of the FC loop when two faults occur at the same time will be described below.

FCループを2重に持つ図1の構成の記憶装置では、先に述べた方法でFCループの一方だけに発生したループ障害に対しては、他方のFCループに切り換えることで対処可能である。しかしコントローラやドライブは両方のFCループに接続されており、コントローラやドライブの障害で両方のFCループに障害を発生させる場合がある。   In the storage device having the structure of FIG. 1 having two FC loops, a loop fault that occurs in only one of the FC loops by the method described above can be dealt with by switching to the other FC loop. However, the controller and the drive are connected to both FC loops, and a failure of the controller and the drive may cause both FC loops to fail.

この場合、図1のような構成の記憶装置では、一方のFCループが通信可能ならそのFCループから障害発生のFCループのPBCを制御して、通信を回復させることが可能であるが、両方のFCループが通信不可能になるとPBCを制御できないため、通信不可能を回復できない。   In this case, in the storage device configured as shown in FIG. 1, if one FC loop is communicable, it is possible to control the PBC of the failed FC loop from that FC loop to recover the communication. When the FC loop becomes incapable of communication, the PBC cannot be controlled, so that the communication inability cannot be recovered.

そこで、この技術的課題の対策として、本実施の形態の記憶装置の変形例では、PBCをFCループの通信よって制御するのではなく、他の信号線によって各コントローラと各PBCを接続し、その信号線の通信によって、PBCを制御する。この本実施の形態の記憶装置の変形例の構成を図10に示す。   Therefore, as a countermeasure for this technical problem, in the modification of the storage device of the present embodiment, the PBC is not controlled by communication of the FC loop, but each controller and each PBC are connected by another signal line. The PBC is controlled by signal line communication. FIG. 10 shows a configuration of a modification of the storage device according to the present embodiment.

図10の本実施の形態の記憶装置の変形例の構成では、上述の図1に例示した構成に、各コントローラと各PBCをつなぐ、信号線501、信号線502が追加されている。2つのFCループに同時に障害が発生した場合の回復方法を以下に示す。例としてドライブ113の障害で両FCループが通信不可能になった場合を考える。   In the configuration of the modified example of the storage device of this embodiment in FIG. 10, a signal line 501 and a signal line 502 that connect each controller and each PBC are added to the configuration illustrated in FIG. 1 described above. A recovery method when a failure occurs in two FC loops simultaneously is shown below. As an example, consider a case where both FC loops cannot communicate due to a failure of the drive 113.

図10の本実施の形態の記憶装置の変形例の構成では、FCループ161の回復は、個々のコントローラ101、102が、信号線501を介して、個々のPBCを当該コントローラから遠い方から切り替えて、通信が可能になるところを探すことで行われる。   In the configuration of the modification example of the storage device of this embodiment in FIG. 10, the recovery of the FC loop 161 is performed by the individual controllers 101 and 102 switching the individual PBC from the far side from the controller via the signal line 501. This is done by searching for a place where communication is possible.

実際には個々のコントローラ101、102が、信号線501を介して、FCループにおいて当該コントローラから遠い順にPBC126、143、125、142、124、141、123を切り替えてゆく動作を行う。上述のようなドライブ113の部位の障害では、PBC125を切り替えた時点でFCループ161の通信が回復する。   Actually, the individual controllers 101 and 102 perform an operation of switching the PBCs 126, 143, 125, 142, 124, 141, and 123 through the signal line 501 in order from the controller in the FC loop. In the case of the failure of the part of the drive 113 as described above, the communication of the FC loop 161 is restored when the PBC 125 is switched.

同様にFCループ171の回復も、個々のコントローラ101、102が、信号線502を介して、個々のPBCをコントローラから遠い方から切り替えて、通信が可能になるところを探すことで行われる。   Similarly, the recovery of the FC loop 171 is also performed by the individual controllers 101 and 102 switching the individual PBC from the far side from the controller via the signal line 502 and searching for a place where communication is possible.

実際には個々のコントローラ101、102が、信号線502を介して、FCループにおいて当該コントローラから遠い順にPBC136、PBC153、PBC135、PBC152、PBC134、PBC151、PBC133を切り替えてゆく動作を行う。上述のように、ドライブ113の部位の障害なので、PBC135を切り替えた時点でFCループの通信が回復する。   Actually, the individual controllers 101 and 102 perform an operation of switching the PBC 136, PBC 153, PBC 135, PBC 152, PBC 134, PBC 151, and PBC 133 in order from the controller in the FC loop via the signal line 502. As described above, the failure of the part of the drive 113 causes the FC loop communication to recover when the PBC 135 is switched.

このように、図10に例示した本実施の形態の記憶装置の変形例の構成では、コントローラ、ドライブ、さらにはFCループをバイパスして切り離す複数のPBCの動作を、多重のFCループとは別個に設けられた信号線501、信号線502を介してコントローラが制御する構成としたので、FCループ上の通信手段が全て通信不可能になった場合でも、障害部位を切り離すことで、障害の回復が可能となる。   As described above, in the configuration of the modification example of the storage device of this embodiment illustrated in FIG. 10, the operations of the controller, the drive, and the plurality of PBCs that bypass and separate the FC loop are separated from the multiple FC loops. Since the controller controls the signal line 501 and the signal line 502 provided in the communication line, even if all the communication means on the FC loop become incapable of communication, it is possible to recover the failure by separating the faulty part. Is possible.

以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。   As mentioned above, the invention made by the present inventor has been specifically described based on the embodiment. However, the present invention is not limited to the embodiment, and various modifications can be made without departing from the scope of the invention. Needless to say.

例えば、上述の説明では、情報処理システムの一例として、記憶装置に適用した場合を例にとって説明したが、FC_AL等のループ状通信手段にて接続された一般の情報処理システム等に広く適用することができる。   For example, in the above description, the case where the present invention is applied to a storage device has been described as an example of the information processing system. However, the information processing system is widely applied to general information processing systems connected by loop communication means such as FC_AL. Can do.

障害箇所の表示方法としては、表示ランプ等を用いる方法に限らず、たとえば、コントローラを外部から制御する制御端末の画面に図1の様なシステム構成図を表示し、このシステム構成図上に可視化して表示する方法でもよい。   The fault location display method is not limited to a method using a display lamp or the like. For example, a system configuration diagram as shown in FIG. 1 is displayed on the screen of a control terminal that controls the controller from the outside, and is visualized on the system configuration diagram. The method of displaying the

以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記の実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更が可能であることは言うまでもない。   As mentioned above, the invention made by the present inventor has been specifically described based on the embodiments. However, the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the scope of the invention. Needless to say.

本発明の情報処理システムおよび記憶装置の一実施の形態である記憶装置のFCループの構成の一例を示した概念図である。It is the conceptual diagram which showed an example of the structure of FC loop of the memory | storage device which is one Embodiment of the information processing system of this invention, and a memory | storage device. 本発明の一実施の形態である記憶装置の全体構成の一例を示す概念図である。It is a conceptual diagram which shows an example of the whole structure of the memory | storage device which is one embodiment of this invention. 本発明の一実施の形態である記憶装置において機器とFCループとの接続に用いられるポートバイパス回路(PBC)の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the port bypass circuit (PBC) used for the connection of an apparatus and FC loop in the memory | storage device which is one embodiment of this invention. 本発明の一実施の形態である記憶装置においてFCループの短絡に用いられるポートバイパス回路(PBC)の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the port bypass circuit (PBC) used for the short circuit of FC loop in the memory | storage device which is one embodiment of this invention. 本発明の一実施の形態である記憶装置における障害部位の検出動作の一例を示すフローチャートである。It is a flowchart which shows an example of the detection operation | movement of the fault site | part in the memory | storage device which is one embodiment of this invention. 本発明の一実施の形態である記憶装置の実装例を示す斜視図である。It is a perspective view which shows the example of mounting of the memory | storage device which is one embodiment of this invention. 本発明の一実施の形態である記憶装置におけるドライブ、コントローラのFCループからの切り離し動作の一例を示す概念図である。It is a conceptual diagram which shows an example of isolation | separation operation | movement from the FC loop of the drive in the memory | storage device which is one embodiment of this invention, and a controller. 本発明の一実施の形態である記憶装置におけるFCループの部分的な切り離し動作の作用の一例を示す概念図である。It is a conceptual diagram which shows an example of the effect | action of partial separation operation | movement of FC loop in the memory | storage device which is one embodiment of this invention. (a)〜(c)は、本発明の一実施の形態である記憶装置におけるFCループ障害発生時のFCループの部分的な切り離し動作の作用の一例を示す概念図である。(A)-(c) is a conceptual diagram which shows an example of the effect | action of partial disconnection operation | movement of the FC loop at the time of FC loop failure occurrence in the memory | storage device which is one embodiment of this invention. 本発明の一実施の形態である記憶装置におけるポートバイパス回路(PBC)の制御方法の変形例を示す概念図である。It is a conceptual diagram which shows the modification of the control method of the port bypass circuit (PBC) in the memory | storage device which is one embodiment of this invention.

符号の説明Explanation of symbols

10…実装ボード、11…コネクタ、101…コントローラ(単位構成要素)、102…コントローラ(単位構成要素)、103…キャッシュメモリ、104…ホストインタフェース、105…ホストインタフェース、111〜114…ドライブ(単位記憶装置、単位構成要素)、121〜126…PBC(第1のバイパス手段)、131〜136…PBC(第1のバイパス手段)、141〜143…PBC(第2のバイパス手段)、151〜153…PBC(第2のバイパス手段)、161…FCループ(ループ状通信手段)、171…FCループ(ループ状通信手段)、181…ループ障害箇所、201…接続状態、202…切断状態、301…接続状態、302…短絡状態、501…信号線(制御線)、502…信号線(制御線)、600…PBC、601…セレクタ、602…バイパス制御信号、603…障害監視回路、604…表示ランプ、700…PBC、701…セレクタ、702…バイパス制御信号、703…表示ランプ。 DESCRIPTION OF SYMBOLS 10 ... Mounting board, 11 ... Connector, 101 ... Controller (unit component), 102 ... Controller (unit component), 103 ... Cache memory, 104 ... Host interface, 105 ... Host interface, 111-114 ... Drive (unit storage) Device, unit component), 121-126 ... PBC (first bypass means), 131-136 ... PBC (first bypass means), 141-143 ... PBC (second bypass means), 151-153 ... PBC (second bypass means), 161 ... FC loop (loop communication means), 171 ... FC loop (loop communication means), 181 ... loop failure location, 201 ... connection state, 202 ... disconnection state, 301 ... connection State 302: Short circuit state 501 Signal line (control line) 502 ... Signal line (control line) 6 0 ... PBC, 601 ... selector, 602 ... bypass control signal, 603 ... fault monitoring circuit, 604 ... display lamp, 700 ... PBC, 701 ... selector, 702 ... bypass control signal, 703 ... display lamp.

Claims (5)

複数のディスクドライブを含む記憶装置であって、
前記記憶装置は、前記複数のディスクドライブを接続するファイバチャネルループと、当該ファイバチャネルループをバイパスするためのポートバイパス回路と、前記複数のディスクドライブと前記ポートバイパス回路を制御するためのコントローラとを含み、
前記コントローラは、該記憶装置の障害発生を監視し、前記ファイバチャネルループの障害を検出した場合、前記ポートバイパス回路の切り替え制御を行ない、当該ファイバチャネルループの障害位置を切り離し、当該ファイバチャネルループの障害が発生していない部分を使用して前記複数のディスクドライブの制御を行う
ことを特徴とする記憶装置。
A storage device including a plurality of disk drives,
The storage device includes: a Fiber Channel loop connecting the plurality of disk drives; a port bypass circuit for bypassing the Fiber Channel loop; and a controller for controlling the plurality of disk drives and the port bypass circuit. Including
The controller monitors the occurrence of a failure in the storage device and, when detecting a failure in the Fiber Channel loop, performs switching control of the port bypass circuit, disconnects the failure position of the Fiber Channel loop, A storage device that controls the plurality of disk drives by using a portion in which no failure has occurred.
請求項1に記載の記憶装置であって、前記障害発生の監視とは、前記複数のディスクドライブのいずれかに起因して生じた障害であるか、前記ファイバチャネルループに起因して生じた障害であるか、のいずれかを判定する処理であることを特徴とする請求項1に記載の記憶装置。   2. The storage device according to claim 1, wherein the failure monitoring is a failure caused by any of the plurality of disk drives or a failure caused by the Fiber Channel loop. The storage device according to claim 1, wherein the storage device is a process for determining whether or not. 複数のディスクドライブを含む記憶装置であって、
前記記憶装置は、前記複数のディスクドライブを接続するファイバチャネルループと、当該ファイバチャネルループをバイパスするための複数のポートバイパス回路と、前記複数のディスクドライブと前記複数のポートバイパス回路を制御するためのコントローラとを含み、
前記コントローラは、前記記憶装置の障害発生を監視し、前記ファイバチャネルループの障害を検出した場合、当該ファイバチャネルループの障害位置を特定する処理を行い、
当該特定した障害位置に応じて、前記複数のポートバイパス回路の切り替え制御を行い、当該ファイバチャネルループの障害位置を切り離し、当該ファイバチャネルループの障害が発生していない部分を使用して前記複数のディスクドライブの制御を行う
ことを特徴とする記憶装置。
A storage device including a plurality of disk drives,
The storage device controls a fiber channel loop connecting the plurality of disk drives, a plurality of port bypass circuits for bypassing the fiber channel loop, and the plurality of disk drives and the plurality of port bypass circuits. Controller and
The controller monitors the occurrence of a failure in the storage device and, when detecting a failure in the Fiber Channel loop, performs a process of specifying the failure position of the Fiber Channel loop,
In accordance with the identified failure position, the switching control of the plurality of port bypass circuits is performed, the failure position of the Fiber Channel loop is disconnected, and the plurality of the failure points of the Fiber Channel loop are used. A storage device that controls a disk drive.
請求項3に記載の記憶装置であって、
前記ファイバチャネルループの障害位置を特定する処理とは、前記複数のポートバイパス回路のうち前記コントローラから遠い位置のポートバイパス回路から順にバイパス操作を行い、当該バイパス操作によって障害が回復したか否かを調べることを特徴とする請求項3に記載に記憶装置。
The storage device according to claim 3,
The process of identifying the failure position of the Fiber Channel loop is a bypass operation in order from the port bypass circuit far from the controller among the plurality of port bypass circuits, and whether or not the failure has been recovered by the bypass operation. The storage device according to claim 3, wherein the storage device is checked.
請求項3に記載の記憶装置であって、
前記障害発生の監視とは、前記複数のディスクドライブのいずれかに起因して生じた障害であるか、前記ファイバチャネルループに起因して生じた障害であるか、のいずれかを判定する処理であることを特徴とする請求項3に記載の記憶装置。
The storage device according to claim 3,
The failure monitoring is a process for determining whether a failure has occurred due to any of the plurality of disk drives or a failure has occurred due to the Fiber Channel loop. The storage device according to claim 3, wherein the storage device is provided.
JP2007339189A 2007-12-28 2007-12-28 Storage device Expired - Fee Related JP4658114B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007339189A JP4658114B2 (en) 2007-12-28 2007-12-28 Storage device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007339189A JP4658114B2 (en) 2007-12-28 2007-12-28 Storage device

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2000032873A Division JP2001222385A (en) 2000-02-10 2000-02-10 Storage device and information processing system

Publications (2)

Publication Number Publication Date
JP2008148339A true JP2008148339A (en) 2008-06-26
JP4658114B2 JP4658114B2 (en) 2011-03-23

Family

ID=39607924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007339189A Expired - Fee Related JP4658114B2 (en) 2007-12-28 2007-12-28 Storage device

Country Status (1)

Country Link
JP (1) JP4658114B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015008337A1 (en) * 2013-07-16 2015-01-22 富士通株式会社 Information processing device, port control program, and port control method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10285198A (en) * 1997-03-31 1998-10-23 Hewlett Packard Co <Hp> Fiber channel mediation dynamic loop sizing
JPH1132068A (en) * 1997-07-08 1999-02-02 Hitachi Ltd Fc-al system
JP2001216206A (en) * 2000-02-01 2001-08-10 Nec Corp Fault analysis method for loop-like interface, and system provided with fault analysis function

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10285198A (en) * 1997-03-31 1998-10-23 Hewlett Packard Co <Hp> Fiber channel mediation dynamic loop sizing
JPH1132068A (en) * 1997-07-08 1999-02-02 Hitachi Ltd Fc-al system
JP2001216206A (en) * 2000-02-01 2001-08-10 Nec Corp Fault analysis method for loop-like interface, and system provided with fault analysis function

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015008337A1 (en) * 2013-07-16 2015-01-22 富士通株式会社 Information processing device, port control program, and port control method
JPWO2015008337A1 (en) * 2013-07-16 2017-03-02 富士通株式会社 Information processing apparatus, port control program, and port control method
US9921924B2 (en) 2013-07-16 2018-03-20 Fujitsu Limited Information processing device, port control method, and computer-readable recording medium

Also Published As

Publication number Publication date
JP4658114B2 (en) 2011-03-23

Similar Documents

Publication Publication Date Title
JP2001222385A (en) Storage device and information processing system
JP4982304B2 (en) Storage system that understands the occurrence of power failure
US6678839B2 (en) Troubleshooting method of looped interface and system provided with troubleshooting function
US7047450B2 (en) Storage system and a method for diagnosing failure of the storage system
JP4148931B2 (en) Network system, monitoring server, and monitoring server program
JP2005222379A (en) Disk-array device and control method for avoiding failure thereof
US7825799B2 (en) Method and apparatus for monitoring power supply failure
JP2006072717A (en) Disk subsystem
JP2006343822A (en) Library device
WO2010140189A1 (en) Storage system and control methods for the same
JP2006285519A (en) Fault diagnostic method for data transfer system, data transfer system, and data storage device
JP2016100843A (en) Relay device
JP4658114B2 (en) Storage device
US20090110399A1 (en) Storage system and optical module switching method for storage system
JP4395766B2 (en) Fault analysis system, method and program
US9116859B2 (en) Disk array system having a plurality of chassis and path connection method
US11003394B2 (en) Multi-domain data storage system with illegal loop prevention
WO2012032607A1 (en) Storage system, storage apparatus, and controller
US9838285B2 (en) Connection monitoring device and connection monitoring method
JP4024475B2 (en) Information network control method and information processing system
US9632885B2 (en) Fault detection method and related device and stack system
JP6750380B2 (en) Control device, storage device, and control program
JP2007228058A (en) Duplex switching device
JP2005117434A (en) Transmission system and its failure detecting method
JP2009110040A (en) Logical operation processor

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100812

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101222

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees