JP2008148339A - Storage device - Google Patents
Storage device Download PDFInfo
- Publication number
- JP2008148339A JP2008148339A JP2007339189A JP2007339189A JP2008148339A JP 2008148339 A JP2008148339 A JP 2008148339A JP 2007339189 A JP2007339189 A JP 2007339189A JP 2007339189 A JP2007339189 A JP 2007339189A JP 2008148339 A JP2008148339 A JP 2008148339A
- Authority
- JP
- Japan
- Prior art keywords
- loop
- storage device
- pbc
- failure
- controller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Small-Scale Networks (AREA)
Abstract
Description
本発明は、記憶装置および情報処理技術に関し、特に、複数の構成要素をファイバチャネルループ等のループ状通信手段にて接続した構成の記憶装置および情報処理システム等に適用して有効な技術に関する。 The present invention relates to a storage device and information processing technology, and more particularly to a technology effective when applied to a storage device, an information processing system, and the like having a configuration in which a plurality of components are connected by loop communication means such as a fiber channel loop.
超高速ギガビット・ネットワーク技術の一つとして、ANSI NCITST11(旧ANSI X3 T11)で標準化が進められているファイバチャネルが知られている。 As one of ultra-high speed gigabit network technologies, Fiber Channel, which is being standardized by ANSI NCITST11 (formerly ANSI X3 T11), is known.
このようなファイバチャネル(FC)を利用すれば、複数のハードディスク(ドライブ)を接続し、1つの大きな記憶装置を構築することが可能である。このFCループの接続方式(FIBRE CHANNEL ARBITRATED LOOP(FC‐AL))では、記憶装置のドライブを制御するコントローラと各ドライブをループ状に接続する。各ドライブとFCループとの接続部には、ドライブの交換時や故障時の場合等ドライブをループから切り離すためのポートバイパス回路(PBC)が接続されている。 By using such a fiber channel (FC), it is possible to connect a plurality of hard disks (drives) to construct one large storage device. In this FC loop connection method (FIBRE CHANNEL ARBITRATED LOOP (FC-AL)), the controller for controlling the drive of the storage device and each drive are connected in a loop. A connection portion between each drive and the FC loop is connected to a port bypass circuit (PBC) for disconnecting the drive from the loop, such as when a drive is replaced or failed.
FCループの規格上、ループが1カ所でも切断されると、コントローラとループ上の各ドライブとの通信が不可能になるため、当該FCループを利用して構築された外部記憶装置では、個々のドライブを切り離す場合に、PBCによって接続を繋ぎ変えてループが切れない様にFCループを制御する必要がある。 According to the FC loop standard, if the loop is disconnected even at one location, communication between the controller and each drive on the loop becomes impossible. Therefore, in the external storage device constructed using the FC loop, individual When disconnecting the drive, it is necessary to control the FC loop so that the connection is changed by the PBC and the loop is not broken.
特開平10−285198号公報(特許文献1)に述べられている様に、異常発生時だけでなく、正常時も性能向上のためにPBCを制御して、使用率が低いドライブは、使用する時だけループに接続する事や各ループの負荷分散のためにPBCを制御することも可能である。
FCループを利用して、複数のドライブを接続して構築された1つの記憶装置において、特定のドライブに障害が発生した場合は、PBCによって、障害のドライブをループから切り離すことによって、他のドライブは動作を続けることが可能である。しかし、何らかの理由でループの接続が切れた場合やループの通信を妨害された場合は、ループに接続されている全ドライブが使用不可になる、という技術的課題がある。 In a single storage device constructed by connecting a plurality of drives using an FC loop, if a failure occurs in a specific drive, the PBC decouples the failed drive from the loop to another drive. Can continue to operate. However, there is a technical problem that all the drives connected to the loop become unusable when the connection of the loop is interrupted for some reason or when communication of the loop is interrupted.
上記技術的課題の対策として、複数のドライブをFCループを介して接続することで構成された記憶装置において、FCループを2重に設定し、片方のループで障害が発生した場合、もう一方のループを使用して通信を続けさせる方法が考えられる。 As a countermeasure for the above technical problem, in a storage device configured by connecting multiple drives via an FC loop, if the FC loop is set to be double and a failure occurs in one loop, the other A method of continuing communication using a loop can be considered.
但し、このようなFCループを2重に設定する、という対策を施した場合でも障害の発生したループでは、障害部位がどこかわからない。このため保守員は、障害ループの修復時に当該障害ループに含まれている個々のドライブ等の構成要素を1つ1つ交換して正常に動作するか確認することにより、どこが障害部位だったかを特定する煩雑な作業が必要となる、という別の技術的課題が生じる。 However, even when a countermeasure is taken to set such an FC loop in a double manner, the location of the fault is unknown in the loop where the fault has occurred. For this reason, the maintenance staff can identify the location of the failure by exchanging the individual components such as individual drives included in the failure loop one by one and confirming that they are operating normally. Another technical problem arises that it is necessary to specify complicated work.
また、2重のループのうちの片方のループだけで通信を行うためデータ転送速度等の性能が低下する。さらに、ループを2重に設定している場合でも、ドライブの各ループで共通の部分に障害が発生した場合、2つのループとも通信が不可能になるため、記憶装置全体が動作不可能になる、という技術的課題がある。 Further, since communication is performed using only one of the double loops, performance such as data transfer speed is degraded. Furthermore, even when the loop is set to be double, if a failure occurs in a common part of each loop of the drive, communication with the two loops becomes impossible, and the entire storage device becomes inoperable. There is a technical problem.
本発明の目的は、ループ状通信手段を備えた構成において障害発生時の性能や信頼性の低下を最小限に止めることが可能な記憶装置を提供することにある。 An object of the present invention is to provide a storage device capable of minimizing degradation in performance and reliability when a failure occurs in a configuration including a loop communication means.
本発明の他の目的は、ループ状通信手段を備えた構成において、障害部位の特定、回復作業を迅速、簡便かつ的確に行うことが可能な記憶装置を提供することにある。 Another object of the present invention is to provide a storage device capable of quickly, simply and accurately performing identification and recovery of a faulty part in a configuration including a loop communication means.
本発明の他の目的は、ループ状通信手段を多重に備えた構成において、複数のループ状通信手段に及ぶ多重障害発生時の復旧を確実に行うことが可能な記憶装置を提供することにある。 Another object of the present invention is to provide a storage device capable of reliably performing recovery when a multiple failure occurs across a plurality of loop communication means in a configuration including multiple loop communication means. .
本発明の目的は、ループ状通信手段を備えた構成において障害発生時の性能や信頼性の低下を最小限に止めることが可能な情報処理システムを提供することにある。 An object of the present invention is to provide an information processing system capable of minimizing a decrease in performance and reliability when a failure occurs in a configuration including a loop communication unit.
本発明の他の目的は、ループ状通信手段を備えた構成において、障害部位の特定、回復作業を迅速、簡便かつ的確に行うことが可能な情報処理システムを提供することにある。 Another object of the present invention is to provide an information processing system capable of quickly, simply and accurately performing a failure site identification and recovery operation in a configuration including a loop communication means.
本発明の他の目的は、ループ状通信手段を多重に備えた構成において、複数のループ状通信手段に及ぶ多重障害発生時の復旧を確実に行うことが可能な情報処理システムを提供することにある。 Another object of the present invention is to provide an information processing system capable of reliably recovering from the occurrence of multiple faults extending to a plurality of loop communication means in a configuration having multiple loop communication means. is there.
本発明は、少なくとも一つの単位記憶装置と、前記単位記憶装置を制御する少なくとも一つのコントローラと、前記単位記憶装置および前記コントローラをループ状に接続し、前記コントローラおよび前記単位記憶装置の相互間における情報の授受を行うループ状通信手段とを含む記憶装置において、前記単位記憶装置および前記コントローラの前記ループ状通信手段に対する接続および切り離しを個別に制御する第1のバイパス手段と、前記ループ状通信手段を任意の位置で短絡させ、前記ループ状通信手段の経路の一部を選択的に切り離す第2のバイパス手段と、を含む構成としたものである。 The present invention relates to at least one unit storage device, at least one controller for controlling the unit storage device, the unit storage device and the controller connected in a loop, and between the controller and the unit storage device. In a storage device including a loop communication means for exchanging information, a first bypass means for individually controlling connection and disconnection of the unit storage device and the controller to the loop communication means, and the loop communication means And a second bypass means for selectively disconnecting a part of the path of the loop communication means.
また、本発明は、各々が情報の記憶および処理の少なくとも一方の動作を行う複数の単位構成要素と、複数の前記単位構成要素をループ状に接続し、前記単位構成要素の間における情報の授受が行われるループ状通信手段とを含む情報処理システムにおいて、前記単位構成要素の前記ループ状通信手段に対する接続および切り離しを個別に制御する第1のバイパス手段と、前記ループ状通信手段を任意の位置で短絡させ、前記ループ状通信手段の経路の一部を選択的に切り離す第2のバイパス手段と、を備えたものである。 The present invention also provides a plurality of unit components that each perform at least one of storage and processing of information and a plurality of the unit components connected in a loop to exchange information between the unit components. In the information processing system including the loop-shaped communication unit, the first bypass unit that individually controls connection and disconnection of the unit component to and from the loop-shaped communication unit, and the loop-shaped communication unit at an arbitrary position. And a second bypass means for selectively disconnecting a part of the path of the loop communication means.
より具体的には、複数のドライブとコントローラをFC_AL等のループで接続した構成の記憶装置において、ドライブおよびコントローラとループとの間の切り離しを行うPBC(第1のバイパス手段)の他に、ループの所々に当該ループを短絡させるPBC(第2のバイパス手段)を設置する。 More specifically, in a storage device having a configuration in which a plurality of drives and a controller are connected by a loop such as FC_AL, in addition to the PBC (first bypass means) that separates the drive and the controller from the loop, the loop PBC (second bypass means) for short-circuiting the loop is installed at these locations.
これらのPBCを制御することによって、ループのどこで障害が発生しているか切り分ける。実際には、PBCを制御してループの一部分だけを有効にして、通信が可能か確認する操作を、当該ループの有効部分を変更して反復することにより、障害部位を特定する。ループで使用できる部分がある場合は、そのループを使用して、使用できない部分のみ他方のループに切り替えることによって、性能の低下を最小限にする。 By controlling these PBCs, it is determined where in the loop the failure has occurred. Actually, the PBC is controlled to enable only a part of the loop, and the operation of confirming whether communication is possible is performed by changing the effective part of the loop and repeating the operation to identify the faulty part. If there is a part that can be used in the loop, the loop is used to switch only the unusable part to the other loop, thereby minimizing performance degradation.
また、ループからPBCを制御する命令を発行するのではなく、PBCを制御する専用のバスを設けることにより、2重のループが両方とも通信が不可能になった場合でも、障害部位を切り離すことが可能となり、その他の部分は通信可能状態に復帰できる。 Also, instead of issuing an instruction to control the PBC from the loop, by providing a dedicated bus for controlling the PBC, even if both loops cannot communicate, the faulty part is separated. The other parts can return to the communicable state.
本発明の記憶装置によれば、ループ状通信手段を備えた構成において障害発生時の性能や信頼性の低下を最小限に止めることができる、という効果が得られる。 According to the storage device of the present invention, it is possible to obtain an effect that it is possible to minimize a decrease in performance and reliability when a failure occurs in a configuration including a loop communication unit.
本発明の記憶装置によれば、ループ状通信手段を備えた構成において、障害部位の特定、回復作業を迅速、簡便かつ的確に行うことができる、という効果が得られる。 According to the storage device of the present invention, in the configuration including the loop communication means, it is possible to obtain the effect that the faulty part can be identified and recovered quickly, simply and accurately.
本発明の記憶装置によれば、ループ状通信手段を多重に備えた構成において、複数のループ状通信手段に及ぶ多重障害発生時の復旧を確実に行うことができる、という効果が得られる。 According to the storage device of the present invention, it is possible to reliably perform recovery when a multiple failure occurs across a plurality of loop communication means in a configuration including multiple loop communication means.
本発明の情報処理システムによれば、ループ状通信手段を備えた構成において障害発生時の性能や信頼性の低下を最小限に止めることができる、という効果が得られる。 According to the information processing system of the present invention, it is possible to obtain an effect that it is possible to minimize a decrease in performance and reliability when a failure occurs in a configuration including a loop communication unit.
本発明の情報処理システムによれば、ループ状通信手段を備えた構成において、障害部位の特定、回復作業を迅速、簡便かつ的確に行うことができる、という効果が得られる。 According to the information processing system of the present invention, in the configuration including the loop communication means, it is possible to obtain an effect that it is possible to quickly and easily and accurately perform the identification and recovery work of the faulty part.
本発明の情報処理システムによれば、ループ状通信手段を多重に備えた構成において、複数のループ状通信手段に及ぶ多重障害発生時の復旧を確実に行うことができる、という効果が得られる。 According to the information processing system of the present invention, it is possible to reliably perform recovery when a multiple failure occurs across a plurality of loop communication means in a configuration including multiple loop communication means.
以下、本発明の一実施例について図面を用いて詳細に説明する。 Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.
図1は、本発明の情報処理システムおよび記憶装置の一実施の形態である記憶装置のループ接続構成の1例を示した概念図であり、図2は、本実施の形態の記憶装置の全体構成の一例を示す概念図である。 FIG. 1 is a conceptual diagram showing an example of a loop connection configuration of a storage device which is an embodiment of an information processing system and a storage device of the present invention. FIG. 2 is an overall view of the storage device of the present embodiment. It is a conceptual diagram which shows an example of a structure.
本実施の形態では、記憶装置におけるループ状通信手段の一例としてFC_AL(FIBRE CHANNEL ARBITRATED LOOP)(以下、FCループと記す)を用いた場合を例に採って説明する。 In this embodiment, a case where FC_AL (FIBER CHANNEL ARBITRATED LOOP) (hereinafter referred to as an FC loop) is used as an example of a loop communication unit in a storage device will be described as an example.
図2の全体構成に例示されるように、本実施の形態の記憶装置は、複数のコントローラ101、コントローラ102と、これらに共有されるキャッシュメモリ103、図示しない上位装置との間におけるデータの授受を制御する複数のホストインタフェース104、ホストインタフェース105、を備えている。
As illustrated in the overall configuration of FIG. 2, the storage device according to the present embodiment is configured to exchange data between a plurality of
複数のコントローラ101、102の配下には、複数のドライブ111、ドライブ112、ドライブ113、ドライブ114が、多重に設けられたFCループ161、FCループ171、ポートバイパス回路(PBC)を介して共有されるように接続されている。
Under the plurality of
すなわち、図2に例示されるように、本実施の形態の記憶装置では、2個のコントローラ101、102が、それぞれ別々のFCループ161、162にPBC121、PBC122、および PBC131、PBC132を通じて接続されている。4台のドライブ111、112、113、114は、一方のFCループ161にPBC123、PBC124、PBC125、PBC126を通じて接続されており、他方のFCループ171にPBC133、PBC134、PBC135、PBC136を通じて接続されている。
That is, as illustrated in FIG. 2, in the storage device of the present embodiment, two
本実施の形態の場合、FCループ161には、FCループを短絡させるためのPBC141、PBC142、PBC143が接続されており、FCループ171には、PBC151、PBC152、PBC153が接続されている。
In the present embodiment, PBC 141, PBC 142, and PBC 143 for short-circuiting the FC loop are connected to the
図3および図4に本実施の形態におけるPBCの構成の一例を示す。すなわち、図3に例示されるように、個々のコントローラやドライブをFCループに接続するPBC121〜PBC126およびPBC131〜PBC136の各々(以下、PBC600と総称する)は、FCループ161およびFCループ171に対するドライブ、コントローラの接続の有無を切り換えるセレクタ601と、ドライブ、コントローラの側の動作異常の有無を監視して、異常(障害)の発生時には、セレクタ601に入力されるバイパス制御信号602にて、ドライブ、コントローラをバイパスしてFCループ側から切り離す(図3のセレクタ601の状態はバイパス状態を示している)動作を行う障害監視回路603と、バイパス制御信号602がON(バイパス状態)のときに点灯して外部にバイパス状態であることを報知するLED等の表示ランプ604、等で構成されている。
3 and 4 show an example of the configuration of the PBC in the present embodiment. That is, as illustrated in FIG. 3, each of PBC 121 to PBC 126 and PBC 131 to PBC 136 (hereinafter collectively referred to as PBC 600) that connects individual controllers and drives to the FC loop is a drive for the
バイパス制御信号602は、外部(たとえばドライブに設けられた図示しない制御端子等)からも入力することが可能であり、障害監視回路603の動作とは無関係に外部からバイパス状態を制御することも可能である。
The
すなわち、本実施の形態の記憶装置では、一例として、FCループ161およびFCループ171におけるファイバチャネルプロトコルのデータリンク層として、SCSI−FCP(SCSI−3 Fibre Channel Protocol)を用いる。
That is, in the storage device of this embodiment, as an example, SCSI-FCP (SCSI-3 Fiber Channel Protocol) is used as the data link layer of the fiber channel protocol in the
このSCSI−FCPを用いる場合、記憶装置はSCSI−FCPのイニシエータであるコントローラ101および102からターゲットとしてのドライブ111〜114の各々に対して発行されるFCPコマンドのSCSI SendDiagnosticsにて、パラメータ・リストで指定することにより、バイパス制御信号602、バイパス制御信号702、のON/OFFの出力指令を、ドライブ111〜114の各々に指示することが可能である。
When this SCSI-FCP is used, the storage device is a parameter list in SCSI Send Diagnostics of FCP commands issued from the
これにより、コントローラ101および102は、ドライブ111〜114の図示しない制御端子を経由してバイパス制御信号602、バイパス制御信号702を出力させることで、PBC600、PBC700の各々におけるバイパス動作を制御する。
Thus, the
また、同様に、現在のPBC600、PBC700におけるバイパスの有無の状態(すなわち、バイパス制御信号602、バイパス制御信号702の状態)は、FCPコマンドのSCSI Receive Diagnostic Resultsにて、ドライブ111〜114の各々を介して、コントローラ101および102が知ることができる。
Similarly, the current presence / absence of bypass in the
一方、図4に例示されるように、FCループ161およびFCループ171の途中に設けられたPBC141〜143およびPBC151〜153の各々(以下、PBC700と総称する)は、FCループ161およびFCループ171の途中の短絡(バイパス)を行うセレクタ701と、外部からこのセレクタ701の切換え動作の制御のために入力されるバイパス制御信号702と、バイパス制御信号702がON(バイパス状態)のときに点灯して外部にバイパス状態であることを報知するLED等の表示ランプ703、等で構成されている。
On the other hand, as illustrated in FIG. 4, each of
たとえば、図1および図2の構成例では、PBC121〜PBC126およびPBC131〜PBC136、PBC141〜143およびPBC151〜153の各々に入力されるバイパス 制御信号602、バイパス制御信号702は、コントローラ101、102から、互いに反対側のFCループを経由して、最も近いドライブから入力することができる。
For example, in the configuration example of FIG. 1 and FIG. 2,
これにより、本実施の形態の記憶装置では、一方のFCループ161(171)に障害が発生した時、他のFCループ171(161)を経由して目的のドライブに対してバイパス制御信号602、バイパス制御信号702を近傍のPBCに出力させることで、後述の図9におけるような個々のPBCの切換え制御が可能になる。
Thereby, in the storage device of the present embodiment, when a failure occurs in one FC loop 161 (171), the
なお、本実施の形態の記憶装置では、FCループ161、171として、光ファイバや導線等の通信媒体を用いることに限らず、図6に例示されるような、実装ボード上の配線パターンにてFCループ161、171を構成することも含まれる。
In the storage device of this embodiment, the
すなわち、図6に例示されるように、本実施の形態の記憶装置では、実装ボード10に、複数のFCループ161、FCループ171を配線パターンとして配置し、さらに、これらに接続されるPBC121〜126、PBC131〜136、さらにはPBC141〜143、PBC151〜153を、この実装ボード10上に形成する。そして、コネクタ11を介して、複数のコントローラ101、102および複数のドライブ111〜114のユニットは、複数のFCループ161、FCループ171の各々に着脱自在に実装される。このような図6の構成の場合、個々のPBCの表示ランプは、たとえば、実装ボード10上に配置され、個々のPBCのバイパス状態が外部から視認可能にされる。
That is, as illustrated in FIG. 6, in the storage device according to the present embodiment, a plurality of
また、特に図示しないが、必要に応じて、コネクタ11を用いて、一部のドライブの代わりに、FCループ161、FCループ171に、外部の光ファイバや導線等の通信媒体を接続することで、本実施の形態の記憶装置を外部システムと接続する構成としてもよい。
Although not particularly shown, if necessary, a communication medium such as an external optical fiber or a conductor can be connected to the
図6のような構成を採る記憶装置としては、たとえば、複数のドライブ111〜114に、上位装置との間で授受されるデータおよび当該データから生成された冗長データを分散して格納することにより、格納データの信頼性の向上や、複数のドライブ111〜114に対する並列アクセスによるスループットの向上を実現するディスクアレイシステムが考えられる。
As a storage device having the configuration as shown in FIG. 6, for example, by distributing and storing data exchanged with a host device and redundant data generated from the data to a plurality of
通常の動作では、コントローラ101は、FCループ161だけを使用し、コントローラ102は、FCループ171だけを使用する事によって、各コントローラは、多重に設けられたFCループ161、171の各々の通信帯域を占有して使用することができる。また、コントローラ101、102の各々とドライブ111〜114の通信は、互いに他のコントローラの動作等の影響を受けることがない。
In normal operation, the
特開平10−285198号公報に示される様にドライブが故障した場合や、性能向上のため未使用のドライブを切り離す場合には、本実施の形態の記憶装置では、PBC123〜126、あるいはPBC133〜135を使用して、該当のドライブを切り離す。 As shown in Japanese Patent Laid-Open No. 10-285198, when a drive fails or when an unused drive is disconnected for performance improvement, the storage device of this embodiment uses PBC 123-126 or PBC 133-135. Use to disconnect the drive.
一例として、本実施の形態の記憶装置は、ドライブ114を各FCループから切り離す場合、PBC126を切り替えて、FCループ161からドライブ114を切り離し、PBC136を切り替えて、FCループ171からドライブ114を切り離す。
As an example, when the
この時のPBCの状態を図7に示す。本実施の形態の記憶装置のPBCでは、ドライブやコントローラが接続されている場合は、図7の左側に例示された接続状態201となる。また、ドライブやコントローラを切り離す場合は、図7の右側に例示された切断状態202(バイパス状態)になり、ドライブやコントローラはFCループから切り離される。
The state of the PBC at this time is shown in FIG. In the PBC of the storage device of this embodiment, when a drive or a controller is connected, the
但し、ドライブやコントローラではなく、FCループ161、171の一部で障害が発生した場合は、上記の方式では回復できないため、もし、FCループ161に障害が発生した場合、FCループ161を使用していたコントローラ101は、コントローラ102と同じく、FCループ171を使用することによって、障害を回避する。この場合、コントローラ101、102が同じFCループ171を使用するため、通信の帯域が2つのFCループを使用していた場合に比べて半減し、性能が低下する。
However, if a failure occurs in a part of the
そこで、本実施の形態では、FCループ障害発生時に、PBC141〜143あるいはPBC151〜153を用いてFCループの障害部位を切り離すことによって、性能低下を防ぐ。以下に具体例を示す。
Therefore, in the present embodiment, when an FC loop failure occurs, performance degradation is prevented by separating the failure portion of the FC
図9の(a)は、片方のFCループ161がループ障害箇所181によって、通信不可能になった場合の状態を示している(簡略化のため、片側のFCループ161のみ表示している)。コントローラ101または102では、FCループの障害発生時に、まずコントローラから1番遠いドライブ114をPBC126を切り替えることによって、FCループから切り離す。この状態が図9の(b)である。しかし、この図9の(b)の状態でもFCループ161上にループ障害箇所181があるため、当該FCループ161は通信不可能である。
FIG. 9A shows a state where one
コントローラ101または102では、次にPBC143を切り替えて、FCループを短絡させる。この時のPBC143の状態を図8に示す。PBC143は、通常の接続状態では、図8の左側の接続状態301の状態であるが、FCループを短絡させる時は、図8の右側の短絡状態302(バイパス状態)になり、FCループをコントローラに近い側(FCループ161a)と、遠い側(FCループ161b)に分割する。PBC143を短絡状態302に切り替えた状態が、図9の(c)である。この図9の(c)の状態だとループ障害箇所181を含むFCループ161bがFCループ161から切り離されたため、FCループ161aは通信可能である。これによってFCループの障害がループ障害箇所181で発生していることが特定できる。
Next, the
すなわち、本実施の形態の各PBCでは、バイパス状態(短絡状態302)では表示ランプが点灯するので、障害の対策時に、各PBCにおける表示ランプの点灯の有無にてFCループやドライブのどこが障害かわかるため、部品の交換等の保守作業が容易になる。たとえば、ディスクアレイ等の記憶装置では、多数のドライブを備えた構成であるため、障害箇所の特定の迅速化等に、特に大きい効果が期待できる。 That is, in each PBC of the present embodiment, the display lamp is lit in the bypass state (short circuit state 302). Therefore, where the failure of the FC loop or drive depends on whether or not the display lamp is lit in each PBC at the time of troubleshooting As a result, maintenance work such as replacement of parts becomes easy. For example, since a storage device such as a disk array has a configuration including a large number of drives, a particularly great effect can be expected in speeding up the identification of a failure location.
図9(c)の状態では、ループ障害箇所181を含むFCループ161bに属するドライブ114は、FCループ161から通信できないので、他のFCループ171から 通信を行う必要があるが、ドライブ111、112、113は、FCループ161(FCループ161a)から通信できるので、他のFCループ171の通信の負荷の増加を最小限に抑止することができる。
In the state of FIG. 9C, the
FCループ161の他の場所でループ障害が発生した場合でも、コントローラ101または102は、FCループのコントローラから遠い順にPBC126、143、125、142、124、141、123を切り替えてゆけば、どこでループ障害が発生しているか判断可能であり、ループ障害の部位を切り離せば、FCループの通信可能な部分を使用して、性能の低下を最小限に押さえることが可能である。
Even if a loop failure occurs elsewhere in the
図5に、上述のような障害部位の検出動作をコントローラに自動的に実行させる場合の制御動作の一例をフローチャートとして示す。このフローチャートでは、制御対象の複数のPBCの各々に対して、コントローラから最も遠い位置から近い方に昇順に、0、1、2、3…のようなIDを付与して障害検出プログラムに認識/制御させることで、コントローラ101または102に、各PBCのバイパス/接続動作を自動的に行わせる例を示している。
FIG. 5 is a flowchart showing an example of the control operation when the controller automatically executes the operation for detecting the faulty part as described above. In this flowchart, IDs such as 0, 1, 2, 3,... Are assigned to each of a plurality of PBCs to be controlled in ascending order from the position farthest from the controller to be recognized / recognized by the failure detection program. An example is shown in which the
すなわち、FCループ161に着目すると(FCループ162の側も以下と同様)、コントローラ101および102は、まず、コントローラ以外の複数のPBC123〜126およびPBC141〜143の各々に、コントローラから遠い順に、0〜6のIDを付与しておく。具体的には、PBC126:ID=“0”、PBC125:ID=“1”、PBC124:ID=“2”、PBC123:ID=“3”、PBC143:ID=“4”、PBC142:ID=“5”、PBC141:ID=“6”、となる。
That is, when attention is focused on the FC loop 161 (the FC loop 162 side is the same as the following), the
そして、コントローラ101、102は、ループでの障害発生を監視し(ステップ801)、検出したら、コントローラから最も遠いPBC(この場合、PBC126)のIDをセットし(ステップ802)、セットされたIDのPBCをバイパス状態にする(ステップ803)。この操作は、上述のFCPコマンドで可能である。
Then, the
次に、コントローラ101または102は、上述のバイパス操作で障害が回復したか否かを調べ(ステップ804)、回復するまで、IDをインクリメント(この場合、ID=6まで)しながら同様の操作を反 復する(ステップ810)。なお、コントローラ101または102は、ループの部分使用が不可能な場合(PBC141:ID=“6”のバイパス操作でも障害が回復しない場合)には(ステップ809)、PBC141よりもコントローラに近い側でのループ上のエラーと判定し、FCループ161の放棄を表示する(ステップ813)。
Next, the
ステップ804で障害が回復した場合には、コントローラ101または102は、バイパスした当該IDのPBCが、ドライブのバイパス用のPBC123〜126か、あるいはループ自体のバイパス用のPBC141〜143かを判定する(ステップ805)。すなわち、障害部位が、ドライブ起因かループ起因かでコントローラは障害を切りわける。
When the failure is recovered in
そして、コントローラ101または102は、ドライブの障害と判明したら(ステップ806)、バイパスしたPBC(ドライブ)の表示ランプ(LED等)を点灯させ、バイパス状態であることを外部に表示する(ステップ807)。
When the
ステップ805に戻って、ループの部分障害であると判明した場合には(ステップ811)、コントローラ101または102は、ループ用の当該PBCの表示ランプ703を点灯させ、ループの部分障害であることを外部に表示し(ステップ812)、バイパスによって切り離されたループに属するドライブを、他(この場合、FCループ171)の側の制御下に移行させる処理を行う(ステップ808)。
Returning to step 805, if it is determined that the fault is a partial fault in the loop (step 811), the
以上説明したように、本実施の形態の記憶装置では、記憶装置等の情報処理システムにおいて、コントローラ101、102およびドライブ111〜114を多重に設けられたFCループ161およびFCループ171にPBC121〜126およびPBC131〜136を介して接続した構成において、個々のFCループ161、171の各々に当該FCループを短絡するPBC141〜143およびPBC151〜153を備え、これらのPBCによるバイパス動作の切換え制御にて障害位置の特定を行い、その部分を切り離して、ファイバチャネルのFCループを再構成する。
As described above, in the storage device of this embodiment, in the information processing system such as the storage device, the
これにより、本実施の形態の記憶装置では、障害が発生したFCループでも、通信可能な健全な部位(FCループ161a)はそのまま使用し、通信不可能な部分(FCループ161b)のみ他のFCループに切り替えることによって、部分的ではあるがFCループの多重状態を維持して性能や信頼性の低下を最小限に抑えることが出来る。
As a result, in the storage device according to the present embodiment, a healthy part (
また、本実施の形態の記憶装置では、個々のコントローラが、当該コントローラから遠い順にPBC切換え制御を行うことで、ドライブの障害のみならず、FCループの障害位置も自動的に検出できるので、障害の回復操作等の保守管理作業を迅速かつ的確に行うことが可能になる。 Further, in the storage device of the present embodiment, each controller can perform PBC switching control in the order of distance from the controller, so that not only the failure of the drive but also the failure position of the FC loop can be automatically detected. Maintenance management work such as recovery operations can be performed quickly and accurately.
上述のように、多重に設けられた複数のFCループ161、171を用いて、ループ障害時に互いに他の健全なFCループ側からPBCの切換え制御を行わせる場合には、二つのFCループに同時に障害が発生した場合には回復が困難になる。
As described above, when a plurality of
そこで、本実施の形態の記憶装置の変形例として、以下に、2つのFCループに同時に障害が発生した場合に、FCループの通信を回復する手段の一例を示す。 Therefore, as a modification of the storage device of the present embodiment, an example of means for recovering communication of the FC loop when two faults occur at the same time will be described below.
FCループを2重に持つ図1の構成の記憶装置では、先に述べた方法でFCループの一方だけに発生したループ障害に対しては、他方のFCループに切り換えることで対処可能である。しかしコントローラやドライブは両方のFCループに接続されており、コントローラやドライブの障害で両方のFCループに障害を発生させる場合がある。 In the storage device having the structure of FIG. 1 having two FC loops, a loop fault that occurs in only one of the FC loops by the method described above can be dealt with by switching to the other FC loop. However, the controller and the drive are connected to both FC loops, and a failure of the controller and the drive may cause both FC loops to fail.
この場合、図1のような構成の記憶装置では、一方のFCループが通信可能ならそのFCループから障害発生のFCループのPBCを制御して、通信を回復させることが可能であるが、両方のFCループが通信不可能になるとPBCを制御できないため、通信不可能を回復できない。 In this case, in the storage device configured as shown in FIG. 1, if one FC loop is communicable, it is possible to control the PBC of the failed FC loop from that FC loop to recover the communication. When the FC loop becomes incapable of communication, the PBC cannot be controlled, so that the communication inability cannot be recovered.
そこで、この技術的課題の対策として、本実施の形態の記憶装置の変形例では、PBCをFCループの通信よって制御するのではなく、他の信号線によって各コントローラと各PBCを接続し、その信号線の通信によって、PBCを制御する。この本実施の形態の記憶装置の変形例の構成を図10に示す。 Therefore, as a countermeasure for this technical problem, in the modification of the storage device of the present embodiment, the PBC is not controlled by communication of the FC loop, but each controller and each PBC are connected by another signal line. The PBC is controlled by signal line communication. FIG. 10 shows a configuration of a modification of the storage device according to the present embodiment.
図10の本実施の形態の記憶装置の変形例の構成では、上述の図1に例示した構成に、各コントローラと各PBCをつなぐ、信号線501、信号線502が追加されている。2つのFCループに同時に障害が発生した場合の回復方法を以下に示す。例としてドライブ113の障害で両FCループが通信不可能になった場合を考える。
In the configuration of the modified example of the storage device of this embodiment in FIG. 10, a
図10の本実施の形態の記憶装置の変形例の構成では、FCループ161の回復は、個々のコントローラ101、102が、信号線501を介して、個々のPBCを当該コントローラから遠い方から切り替えて、通信が可能になるところを探すことで行われる。
In the configuration of the modification example of the storage device of this embodiment in FIG. 10, the recovery of the
実際には個々のコントローラ101、102が、信号線501を介して、FCループにおいて当該コントローラから遠い順にPBC126、143、125、142、124、141、123を切り替えてゆく動作を行う。上述のようなドライブ113の部位の障害では、PBC125を切り替えた時点でFCループ161の通信が回復する。
Actually, the
同様にFCループ171の回復も、個々のコントローラ101、102が、信号線502を介して、個々のPBCをコントローラから遠い方から切り替えて、通信が可能になるところを探すことで行われる。
Similarly, the recovery of the
実際には個々のコントローラ101、102が、信号線502を介して、FCループにおいて当該コントローラから遠い順にPBC136、PBC153、PBC135、PBC152、PBC134、PBC151、PBC133を切り替えてゆく動作を行う。上述のように、ドライブ113の部位の障害なので、PBC135を切り替えた時点でFCループの通信が回復する。
Actually, the
このように、図10に例示した本実施の形態の記憶装置の変形例の構成では、コントローラ、ドライブ、さらにはFCループをバイパスして切り離す複数のPBCの動作を、多重のFCループとは別個に設けられた信号線501、信号線502を介してコントローラが制御する構成としたので、FCループ上の通信手段が全て通信不可能になった場合でも、障害部位を切り離すことで、障害の回復が可能となる。
As described above, in the configuration of the modification example of the storage device of this embodiment illustrated in FIG. 10, the operations of the controller, the drive, and the plurality of PBCs that bypass and separate the FC loop are separated from the multiple FC loops. Since the controller controls the
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。 As mentioned above, the invention made by the present inventor has been specifically described based on the embodiment. However, the present invention is not limited to the embodiment, and various modifications can be made without departing from the scope of the invention. Needless to say.
例えば、上述の説明では、情報処理システムの一例として、記憶装置に適用した場合を例にとって説明したが、FC_AL等のループ状通信手段にて接続された一般の情報処理システム等に広く適用することができる。 For example, in the above description, the case where the present invention is applied to a storage device has been described as an example of the information processing system. However, the information processing system is widely applied to general information processing systems connected by loop communication means such as FC_AL. Can do.
障害箇所の表示方法としては、表示ランプ等を用いる方法に限らず、たとえば、コントローラを外部から制御する制御端末の画面に図1の様なシステム構成図を表示し、このシステム構成図上に可視化して表示する方法でもよい。 The fault location display method is not limited to a method using a display lamp or the like. For example, a system configuration diagram as shown in FIG. 1 is displayed on the screen of a control terminal that controls the controller from the outside, and is visualized on the system configuration diagram. The method of displaying the
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記の実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更が可能であることは言うまでもない。 As mentioned above, the invention made by the present inventor has been specifically described based on the embodiments. However, the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the scope of the invention. Needless to say.
10…実装ボード、11…コネクタ、101…コントローラ(単位構成要素)、102…コントローラ(単位構成要素)、103…キャッシュメモリ、104…ホストインタフェース、105…ホストインタフェース、111〜114…ドライブ(単位記憶装置、単位構成要素)、121〜126…PBC(第1のバイパス手段)、131〜136…PBC(第1のバイパス手段)、141〜143…PBC(第2のバイパス手段)、151〜153…PBC(第2のバイパス手段)、161…FCループ(ループ状通信手段)、171…FCループ(ループ状通信手段)、181…ループ障害箇所、201…接続状態、202…切断状態、301…接続状態、302…短絡状態、501…信号線(制御線)、502…信号線(制御線)、600…PBC、601…セレクタ、602…バイパス制御信号、603…障害監視回路、604…表示ランプ、700…PBC、701…セレクタ、702…バイパス制御信号、703…表示ランプ。
DESCRIPTION OF
Claims (5)
前記記憶装置は、前記複数のディスクドライブを接続するファイバチャネルループと、当該ファイバチャネルループをバイパスするためのポートバイパス回路と、前記複数のディスクドライブと前記ポートバイパス回路を制御するためのコントローラとを含み、
前記コントローラは、該記憶装置の障害発生を監視し、前記ファイバチャネルループの障害を検出した場合、前記ポートバイパス回路の切り替え制御を行ない、当該ファイバチャネルループの障害位置を切り離し、当該ファイバチャネルループの障害が発生していない部分を使用して前記複数のディスクドライブの制御を行う
ことを特徴とする記憶装置。 A storage device including a plurality of disk drives,
The storage device includes: a Fiber Channel loop connecting the plurality of disk drives; a port bypass circuit for bypassing the Fiber Channel loop; and a controller for controlling the plurality of disk drives and the port bypass circuit. Including
The controller monitors the occurrence of a failure in the storage device and, when detecting a failure in the Fiber Channel loop, performs switching control of the port bypass circuit, disconnects the failure position of the Fiber Channel loop, A storage device that controls the plurality of disk drives by using a portion in which no failure has occurred.
前記記憶装置は、前記複数のディスクドライブを接続するファイバチャネルループと、当該ファイバチャネルループをバイパスするための複数のポートバイパス回路と、前記複数のディスクドライブと前記複数のポートバイパス回路を制御するためのコントローラとを含み、
前記コントローラは、前記記憶装置の障害発生を監視し、前記ファイバチャネルループの障害を検出した場合、当該ファイバチャネルループの障害位置を特定する処理を行い、
当該特定した障害位置に応じて、前記複数のポートバイパス回路の切り替え制御を行い、当該ファイバチャネルループの障害位置を切り離し、当該ファイバチャネルループの障害が発生していない部分を使用して前記複数のディスクドライブの制御を行う
ことを特徴とする記憶装置。 A storage device including a plurality of disk drives,
The storage device controls a fiber channel loop connecting the plurality of disk drives, a plurality of port bypass circuits for bypassing the fiber channel loop, and the plurality of disk drives and the plurality of port bypass circuits. Controller and
The controller monitors the occurrence of a failure in the storage device and, when detecting a failure in the Fiber Channel loop, performs a process of specifying the failure position of the Fiber Channel loop,
In accordance with the identified failure position, the switching control of the plurality of port bypass circuits is performed, the failure position of the Fiber Channel loop is disconnected, and the plurality of the failure points of the Fiber Channel loop are used. A storage device that controls a disk drive.
前記ファイバチャネルループの障害位置を特定する処理とは、前記複数のポートバイパス回路のうち前記コントローラから遠い位置のポートバイパス回路から順にバイパス操作を行い、当該バイパス操作によって障害が回復したか否かを調べることを特徴とする請求項3に記載に記憶装置。 The storage device according to claim 3,
The process of identifying the failure position of the Fiber Channel loop is a bypass operation in order from the port bypass circuit far from the controller among the plurality of port bypass circuits, and whether or not the failure has been recovered by the bypass operation. The storage device according to claim 3, wherein the storage device is checked.
前記障害発生の監視とは、前記複数のディスクドライブのいずれかに起因して生じた障害であるか、前記ファイバチャネルループに起因して生じた障害であるか、のいずれかを判定する処理であることを特徴とする請求項3に記載の記憶装置。 The storage device according to claim 3,
The failure monitoring is a process for determining whether a failure has occurred due to any of the plurality of disk drives or a failure has occurred due to the Fiber Channel loop. The storage device according to claim 3, wherein the storage device is provided.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007339189A JP4658114B2 (en) | 2007-12-28 | 2007-12-28 | Storage device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007339189A JP4658114B2 (en) | 2007-12-28 | 2007-12-28 | Storage device |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000032873A Division JP2001222385A (en) | 2000-02-10 | 2000-02-10 | Storage device and information processing system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008148339A true JP2008148339A (en) | 2008-06-26 |
JP4658114B2 JP4658114B2 (en) | 2011-03-23 |
Family
ID=39607924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007339189A Expired - Fee Related JP4658114B2 (en) | 2007-12-28 | 2007-12-28 | Storage device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4658114B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015008337A1 (en) * | 2013-07-16 | 2015-01-22 | 富士通株式会社 | Information processing device, port control program, and port control method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10285198A (en) * | 1997-03-31 | 1998-10-23 | Hewlett Packard Co <Hp> | Fiber channel mediation dynamic loop sizing |
JPH1132068A (en) * | 1997-07-08 | 1999-02-02 | Hitachi Ltd | Fc-al system |
JP2001216206A (en) * | 2000-02-01 | 2001-08-10 | Nec Corp | Fault analysis method for loop-like interface, and system provided with fault analysis function |
-
2007
- 2007-12-28 JP JP2007339189A patent/JP4658114B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10285198A (en) * | 1997-03-31 | 1998-10-23 | Hewlett Packard Co <Hp> | Fiber channel mediation dynamic loop sizing |
JPH1132068A (en) * | 1997-07-08 | 1999-02-02 | Hitachi Ltd | Fc-al system |
JP2001216206A (en) * | 2000-02-01 | 2001-08-10 | Nec Corp | Fault analysis method for loop-like interface, and system provided with fault analysis function |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015008337A1 (en) * | 2013-07-16 | 2015-01-22 | 富士通株式会社 | Information processing device, port control program, and port control method |
JPWO2015008337A1 (en) * | 2013-07-16 | 2017-03-02 | 富士通株式会社 | Information processing apparatus, port control program, and port control method |
US9921924B2 (en) | 2013-07-16 | 2018-03-20 | Fujitsu Limited | Information processing device, port control method, and computer-readable recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP4658114B2 (en) | 2011-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001222385A (en) | Storage device and information processing system | |
JP4982304B2 (en) | Storage system that understands the occurrence of power failure | |
US6678839B2 (en) | Troubleshooting method of looped interface and system provided with troubleshooting function | |
US7047450B2 (en) | Storage system and a method for diagnosing failure of the storage system | |
JP4148931B2 (en) | Network system, monitoring server, and monitoring server program | |
JP2005222379A (en) | Disk-array device and control method for avoiding failure thereof | |
US7568119B2 (en) | Storage control device and storage control device path switching method | |
JP2006072717A (en) | Disk subsystem | |
JP2006343822A (en) | Library device | |
JP2006285519A (en) | Fault diagnostic method for data transfer system, data transfer system, and data storage device | |
JP2008090354A (en) | Power failure monitoring method and apparatus therefor | |
JP2007272702A (en) | Disk array subsystem, and redundancy maintenance method and program | |
US8019217B2 (en) | Storage system and optical module switching method for storage system | |
JP2016100843A (en) | Relay device | |
JP4658114B2 (en) | Storage device | |
JP4395766B2 (en) | Fault analysis system, method and program | |
US9116859B2 (en) | Disk array system having a plurality of chassis and path connection method | |
US11003394B2 (en) | Multi-domain data storage system with illegal loop prevention | |
WO2012032607A1 (en) | Storage system, storage apparatus, and controller | |
US9838285B2 (en) | Connection monitoring device and connection monitoring method | |
JP4024475B2 (en) | Information network control method and information processing system | |
JP6750380B2 (en) | Control device, storage device, and control program | |
JP4417495B2 (en) | Center modem | |
JP5082418B2 (en) | Information processing system with drive devices connected by FC-AL | |
JP2024121449A (en) | Status monitoring device, status monitoring system, status monitoring method, and status monitoring method program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100601 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100615 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101207 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101222 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140107 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |