JP6582523B2 - ストレージ装置、制御装置、制御プログラム - Google Patents

ストレージ装置、制御装置、制御プログラム Download PDF

Info

Publication number
JP6582523B2
JP6582523B2 JP2015093637A JP2015093637A JP6582523B2 JP 6582523 B2 JP6582523 B2 JP 6582523B2 JP 2015093637 A JP2015093637 A JP 2015093637A JP 2015093637 A JP2015093637 A JP 2015093637A JP 6582523 B2 JP6582523 B2 JP 6582523B2
Authority
JP
Japan
Prior art keywords
unit
abnormality
svc
information
connection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015093637A
Other languages
English (en)
Other versions
JP2016212531A (ja
Inventor
宏和 松林
宏和 松林
章二 大嶋
章二 大嶋
町田 達彦
達彦 町田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015093637A priority Critical patent/JP6582523B2/ja
Priority to US15/068,675 priority patent/US9842070B2/en
Publication of JP2016212531A publication Critical patent/JP2016212531A/ja
Application granted granted Critical
Publication of JP6582523B2 publication Critical patent/JP6582523B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1668Details of memory controller
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4027Coupling between buses using bus bridges
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4063Device-to-bus coupling
    • G06F13/4068Electrical coupling

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、ストレージ装置、制御装置、制御プログラムに関する。
複数の記憶装置をそなえるストレージ装置には、ホストとこれらの記憶装置との間のアクセス制御を行なう制御装置がそなえられることが知られている(例えば特許文献1及び2参照)。
ストレージ装置では、例えば同種の装置やケーブル等を複数設け、制御装置や、制御装置と記憶装置との間のパス等を冗長化することにより、システムの可用性や性能の向上が図られることがある。
制御装置、例えばController Module(CM)が複数設けられる場合、ストレージ装置はこれらのCM間の通信を行なうためのスイッチユニットをそなえることも知られている(例えば特許文献3及び4参照)。また、このスイッチユニットについても、システムの可用性や性能の向上のために、ストレージ装置に複数設けられ冗長化され得る。
なお、上述したストレージ装置において、複数のスイッチユニットがストレージ装置のそなえるバックパネルに接続されることも知られている(例えば特許文献4参照)。
特開2005−122763号公報 特開2007−87266号公報 特開2006−155392号公報 特開2006−209549号公報
上述したストレージ装置においては、バックパネルが冗長化されていないため、バックパネルが故障した場合、ストレージ装置はその運用が停止され、例えばストレージ装置全体の電源がオフにされてからバックパネルの交換が行なわれることになる。
このように、複数の制御装置をそなえるストレージ装置において、可用性が低下する場合があるという課題がある。
1つの側面では、本発明は、ストレージ装置の可用性を向上させることを目的とする。
1つの態様では、本件のストレージ装置は、上位装置から複数の記憶装置へのアクセスを制御する複数の制御装置と、前記複数の制御装置の各々を相互に通信可能に接続する接続装置を複数そなえる中継装置と、をそなえる。また、前記中継装置は、前記複数の接続装置を相互に通信可能に接続するブリッジ部をそなえるとともに、前記中継装置の監視を行なう監視部を前記接続装置ごとにそなえる。さらに、前記複数の接続装置のうちの第1の接続装置にそなえられ、前記監視により検出した異常に関する情報を前記複数の制御装置のうちの第1の制御装置へ通知する権限を有する第1の監視部は、前記中継装置内における異常を検出すると、前記検出した異常に関する情報を前記第1の制御装置へ通知する。また、前記第1の制御装置は、前記第1の監視部から通知された前記異常に関する情報に基づき異常個所を判定し、前記異常個所が、前記第1の接続装置のモジュール、又は、前記第1の接続装置と前記ブリッジ部を介して接続された第2の接続装置のモジュールであると判定した場合、前記第1の監視部に対して前記中継装置から前記異常個所を切り離すことを指示する切離処理を行ない、前記異常個所が前記ブリッジ部であると判定した場合、前記第2の接続装置にそなえられた第2の監視部に対して前記第2の接続装置の複数のモジュールを前記中継装置から切り離すことを指示する切離処理を行なう。
1つの側面では、ストレージ装置の可用性を向上させることができる。
一実施形態の一例としてのストレージ装置の構成例を示す図である。 図1に示す中継装置の構成例を示す図である。 図1に示す中継装置及びCMのハードウェア構成例を示す図である。 図1及び図2に示すSVCの監視処理に係る機能構成例を示す図である。 MPブリッジに異常が発生した場合の監視制御への影響範囲を例示する図である。 図1に示すCMの縮退処理に係る機能構成例を示す図である。 CMが管理する構成情報の一例を示す図である。 一実施形態に係るストレージ装置における他系のSVCが異常となった場合の処理の一例を説明するフローチャートである。 一実施形態に係るストレージ装置におけるMPブリッジが異常となった場合の処理の一例を説明するフローチャートである。 一実施形態に係るストレージ装置におけるMPブリッジが復旧した場合の処理の一例を説明するフローチャートである。
以下、図面を参照して本発明の実施の形態を説明する。ただし、以下に説明する実施形態は、あくまでも例示であり、以下に明示しない種々の変形や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。なお、以下の実施形態で用いる図面において、同一符号を付した部分は、特に断らない限り、同一若しくは同様の部分を表す。
〔1〕一実施形態
〔1−1〕ストレージ装置の構成例
図1は一実施形態の一例としてのストレージ装置1の構成例を示す図である。図1に示すように、ストレージ装置1は、例示的に、中継装置2、1以上(図1ではn;nは自然数)のController Enclosure(CE)3−1〜3−n、及び複数のDrive Enclosure(DE)5をそなえることができる。なお、以下の説明においてCE3−1〜3−nを区別しない場合には単にCE3と表記する。また、CE3−1〜3−nをそれぞれCE#0〜CE#n−1と表記する場合がある。
ストレージ装置1は、DE5に複数の記憶装置51を搭載し、ホスト装置(図示省略)に対して記憶装置51の記憶領域を提供することができる。例えばストレージ装置1は、Redundant Arrays of Inexpensive Disks(RAID)を用いて複数の記憶装置51にデータを分散又は冗長化した状態で保存することができる。なお、CE3が記憶装置51を内部にそなえていてもよい。
CE3は、中継装置2及びDE5とそれぞれ接続され、種々の制御を行なう制御筐体の一例である。CE3は、例示的に、複数(図1では2つ)のCM4をそなえることができる。以下の説明において、CE3内のCM4をCM#0及びCM#1と表記する場合がある。なお、CE3−1〜3−nはそれぞれ同様の構成とすることができ、CM4についても他のCM4と同様の構成とすることができるため、以下、図1に示すCE3−1(及びCM4)を例に挙げて説明する。
CM4は、ホスト装置から複数の記憶装置51へのアクセスを制御する制御装置(コントローラ)又は情報処理装置(コンピュータ)の一例である。
図1の例では、一実施形態に係るCM4は、CE3内の他のCM4との間で冗長化(例えば二重化)されている。これらのCM4は、例えばSmall Computer System Interface(SCSI)に準拠したSerial Attached SCSI(SAS)等のケーブルにより接続してもよい。なお、図1の例では、CE3内の各CM4はそれぞれCE3に対応するDE5の各々に直接的に又は間接的に接続されており、アクセス経路の冗長化が図られている。
また、一実施形態において、ストレージ装置1における複数のCM4には、マスタCM4が含まれてもよい。マスタCM4は、ホスト装置、中継装置2、又は他のCM4(スレーブCM4)等からの要求に応じて、ストレージ装置1に係る種々の制御を行なうことができる。
さらに、ストレージ装置1における複数のCM4(マスタCM4及びスレーブCM4)は、相互に通信(以下、CM間通信と表記する)を行なうことで、ストレージ装置1の制御や複数の記憶装置51へのアクセス等に関する情報の共有(同期)又は通知等を行なうことができる。CM4の詳細については後述する。
DE5は、複数の記憶装置51をそなえ、CE3(CM4)からの要求に応じて記憶装置51に対するデータ等の書き込み又は読み出し等の種々のアクセスを行なうことができる。なお、図1の例では、4つのDE5がグループ化されている(纏められている)が、このグループ化された4つのDE5はカスケード状に接続(縦列接続)されていることを表している。
記憶装置51は、種々のデータやプログラム等を格納するハードウェアの一例である。記憶装置51としては、例えばHard Disk Drive(HDD)等の磁気ディスク装置や、Solid State Drive(SSD)等の半導体ドライブ装置等の各種記憶装置が挙げられる。
中継装置2は、複数のCM4に接続され、CM4間で送受信される情報を中継する装置の一例である。中継装置2は、例示的に、冗長化された複数(図1では2つ)のMidplane(MP)20−1及び20−2と、これらのMP20−1及び20−2を接続するMPブリッジ21とをそなえることができる。なお、以下の説明においてMP20−1及び20−2を区別しない場合には単にMP20と表記する。
MP20は、複数のCE3(CM4)を通信可能に接続する装置の一例である。MP20は、例示的に、冗長化された複数(図1では2つ)のFront End Router(FRT)22と、Service Controller(SVC)23とをそなえることができる。
FRT22は、複数のCM4の各々を互いに通信可能に接続する接続部の一例である。FRT22は、例えばPeripheral Component Interconnect (PCI) Express(PCIe)に準拠したアダプタを複数そなえ、複数のCM4の各々とPCIeに対応したケーブル等によって接続されてもよい。
SVC23は、ストレージ装置1の監視を行なう監視部又は情報処理装置(コンピュータ)の一例である。また、SVC23は、複数のCE3の電源制御、例えば電源のオン/オフの制御等を行なうことができる。
SVC23は、例えばCM4との接続用のインタフェースを複数そなえ、複数のCM4の各々とケーブル等によって接続されてもよい。図1の例では、“CE#0_CM#0,#1 〜 CE#n−1_CM#0,#1”と表記されたSVC23側の実線で示すラインが、“SVC#0,#1”と表記されたCM4側の実線で示すラインに繋がることで、SVC23と複数のCM4の各々とを接続することができる。なお、SVC23は、ストレージ装置1の他のコンポーネントについても監視及び電源制御を行なってもよい。
また、一実施形態において、中継装置2における複数のSVC23には、上述したストレージ装置1の監視や電源制御等を主導で実施するマスタSVC23が含まれてもよい。マスタSVC23は、CM4等との間で通信を行なうことができる。マスタSVC23において異常が発生した場合、他のSVC23(スレーブSVC23)がマスタSVC23に昇格し、上述したストレージ装置1の監視や電源制御等を引き継ぐことができる。
MPブリッジ21は、複数のMP20を通信可能に接続するブリッジ部の一例である。SVC23は、MPブリッジ21を介して他系(他方のMP20)の監視を行なうことができる。中継装置2の詳細については後述する。
なお、ストレージ装置1は、上述した中継装置2、CE3、及びDE5を搭載するために、例えばラック(図示省略)をそなえ、このラック内に中継装置2、CE3、及びDE5を抜き挿し可能に搭載することができる。
一実施形態に係るストレージ装置1においては、上述した構成により、CM4は、複数のMP20におけるいずれかのFRT22を経由して、他のCM4との間で通信を行なうことができる。このように、ストレージ装置1においてはCM4間通信の経路の冗長化が図られている。
ここで、一実施形態においては、MP20間で冗長化された複数のSVC23のうちのいずれかのSVC23(第1のSVC23;例えばマスタSVC23)は、異常の発生した中継装置2内の異常個所を検出すると、検出した異常個所を複数のCM4のうちの少なくともいずれかのCM4(第1のCM4;例えばマスタCM4)へ通知することができる。
また、通知を受けたCM4(例えばマスタCM4)は、SVC23からの通知に基づき中継装置2から異常個所を切り離す切離処理を行なうことができる。
このように、ストレージ装置1においては、SVC23が中継装置2内の異常個所を検出すると、CM4がSVC23により検出された異常個所の切離処理を行なうことができる。これにより、中継装置2に対して冗長経路が確保されたCM4から異常個所の切離処理を確実に実行することができ、異常個所の切り離しが行なえないことに起因した二次故障の発生確率等を低減させることができるため、可用性を向上させることができる。
以下、ストレージ装置1の詳細について説明する。
〔1−2〕ハードウェア構成例
・中継装置2について
次に、図2及び図3を参照して、図1に示す中継装置2のハードウェア構成例について説明する。図2に示すように、中継装置2は、上述した2つのMP20−1及び20−2(#0及び#1)、MPブリッジ21、4つのFRT22(#0〜#3)、並びに2つのSVC23(#0及び#1)をそなえることができる。また、中継装置2は、これらに加えて、2つのMP−EXT20a−1及び20a−2(#0及び#1)、並びに2つのMP−PSU20b−1及び20b−2(#0及び#1)をそなえることができる。さらに、中継装置2は、4つのファンユニット24(#0〜#3)、並びに4つのPower Supply Unit(PSU)25(#0〜#3)をそなえることができる。
以下の説明において、中継装置2がそなえる各ユニット(図2に例示する各ブロック)を特定する場合、符号に代えて#0〜#3を用い、例えばMP20−1及び20−2をそれぞれMP#0及びMP#1と表記する場合がある。また、MP−EXT20a−1及び20a−2を単にMP−EXT20aと表記し、MP−PSU20b−1及び20b−2を単にMP−PSU20bと表記する場合がある。
さらに、以下の説明において、MP#0に接続されたMP−EXT20a−1、MP−PSU20b−1、FRT#0、FRT#1、SVC#0、ファンユニット#0、ファンユニット#1、PSU#0、及びPSU#1を“#0系”と表記する場合がある。同様に、MP#1に接続されたMP−EXT20a−2、MP−PSU20b−2、FRT#2、FRT#3、SVC#1、ファンユニット#2、ファンユニット#3、PSU#2、及びPSU#3を“#1系”と表記する場合がある。換言すれば、MP20、MP−EXT20a、MPブリッジ21、FRT22、SVC23、及びファンユニット24を含む第1(#0)及び第2(#1)の系統の各々は、複数のCM4の各々を相互に通信可能に接続する接続装置の一例である。
図2に示す例において、各ユニット間の斜線で示す四角は各ユニットがコネクタによって通信可能に接続されていることを示している。
MP20は、例えば基板状の装置(基板ユニット)とすることができる。図2に例示するように、#0系及び#1系のMP20にはそれぞれ、MP−EXT20a、MPブリッジ21、FRT22、SVC23、及びファンユニット24がコネクタを介して相互に通信可能に接続されてもよい。
MP−EXT20aは、例えばMP20及びMP−PSU20bと互いに通信可能に接続され、MP20とMP−PSU20bとの間で送受信される信号等を中継することができる。MP−PSU20bは、例えばMP−EXT20a及びPSU25と互いに通信可能に接続される。なお、MP−EXT20a及びMP−PSU20bについても基板状の装置とすることができる。
MPブリッジ21は、中継装置2内の上述の如き#0系及び#1系の2系統のコンポーネントを相互に通信可能に接続することができる。例えばMPブリッジ21は、MP#0のコネクタに挿抜可能なアダプタとMP#1のコネクタに挿抜可能なアダプタとをそなえ、これらのアダプタを基板上の配線又はケーブル等で結線したユニットとすることができる。
ファンユニット(Fan Unit;FANU)24は、中継装置2の各ユニットの冷却を行なうことができる。例えばファンユニット24は、1以上のファンをそなえ、中継装置2内を通過する気流を生成することにより、中継装置2内の熱を低下させることができる。
PSU25は、中継装置2内の各ユニットに電力を供給することができる。例えばPSU25は、MP−PSU20b、MP−EXT20a、及びMP20を介して各ユニット22〜24へ電力を供給してもよい。
SVC23は、自系のMP20、MP−EXT20a、MP−PSU20b、FRT22、ファンユニット24、及びPSU25の監視及び制御等を行なうことができる。また、SVC23は、自系のMP20及びMPブリッジ21を介して、他系のMP20、MP−EXT20a、MP−PSU20b、FRT22、SVC23、ファンユニット24、及びPSU25の監視及び制御等を行なうことができる。SVC23の機能構成例については、図4を参照して後述する。
SVC23は、図3に例示するハードウェア構成であってもよい。図3に示すように、SVC23は、例示的に、Central Processing Unit(CPU)2a、メモリ2b、記憶部2c、インタフェース部2d、及び入出力部2eをそなえることができる。
CPU2aは、種々の制御や演算を行なう演算処理装置(プロセッサ)の一例である。CPU2aは、各ブロック2b〜2eとバスで相互に通信可能に接続されてもよい。なお、演算処理装置としては、CPU2aに代えて、電子回路、例えばMicro Processing Unit(MPU)、Application Specific Integrated Circuit(ASIC)、Field Programmable Gate Array(FPGA)等の集積回路(Integrated Circuit;IC)が用いられてもよい。
メモリ2bは、種々のデータやプログラムを格納するハードウェアの一例である。メモリ2bとしては、例えばRandom Access Memory(RAM)等の揮発性メモリが挙げられる。
記憶部2cは、種々のデータやプログラム等を格納するハードウェアの一例である。記憶部2cとしては、例えばHard Disk Drive(HDD)等の磁気ディスク装置、Solid State Drive(SSD)等の半導体ドライブ装置、フラッシュメモリやRead Only Memory(ROM)等の不揮発性メモリ等の各種記憶装置が挙げられる。
例えば記憶部2cは、SVC23の各種機能の全部若しくは一部を実現する制御プログラム200を格納することができる。CPU2aは、例えば記憶部2cに格納された制御プログラム200をメモリ2bに展開して実行することにより、SVC23の機能を実現することができる。
インタフェース部2dは、MP20(FRT22、ファンユニット24、及びPSU25等)、CM4、並びに作業者の作業端末等との間の接続及び通信の制御等を行なう通信インタフェースの一例である。例えばインタフェース部2dは、MP20に接続するためのアダプタや、CM4との接続用の複数のインタフェース、作業端末を接続するためのアダプタ(ポート)等をそなえてもよい。なお、制御プログラム200は、図示しないネットワークからインタフェース部2dを介してSVC23にダウンロードされてもよい。
また、インタフェース部2dは、記録媒体2fに記録されたデータやプログラムを読み出す読取部をそなえてもよい。読取部は、コンピュータ読取可能な記録媒体2fを接続又は挿入可能な接続端子又は装置を含んでもよい。読取部としては、例えばUniversal Serial Bus(USB)等に準拠したアダプタ、記録ディスクへのアクセスを行なうドライブ装置、SDカード等のフラッシュメモリへのアクセスを行なうカードリーダ等が挙げられる。なお、記録媒体2fには制御プログラム200が格納されてもよい。
記録媒体2f及び後述する記録媒体4fとしては、例えばフレキシブルディスク、CD、DVD、ブルーレイディスク等の光ディスクや、USBメモリやSDカード等のフラッシュメモリ等の非一時的な記録媒体が挙げられる。なお、CDとしては、CD−ROM、CD−R、CD−RW等が挙げられる。また、DVDとしては、DVD−ROM、DVD−RAM、DVD−R、DVD−RW、DVD+R、DVD+RW等が挙げられる。
入出力部2eは、マウス、キーボード、操作ボタン等の入力部、並びにディスプレイ等の出力部の少なくとも一部を含むことができる。例えば入力部は、作業者(使用者)等による設定の登録や変更、システムのモード選択(切替)等の各種操作やデータの入力等の作業に用いられてよく、出力部は、作業者等による設定の確認や各種通知等の出力に用いられてもよい。
上述した中継装置2及びSVC23のハードウェア構成は例示である。従って、中継装置2及びSVC23内でのハードウェアの増減(例えば任意のブロックの追加や省略)、分割、任意の組み合わせでの統合、バスの追加又は省略等は適宜行なわれてもよい。
・CM4のハードウェア構成例
次に、図1及び図3を参照して、図1に示すCM4のハードウェア構成例について説明する。図3に示すように、CM4は、例示的に、CPU4a、メモリ4b、記憶部4c、インタフェース部4d、及び入出力部4eをそなえることができる。
CPU4aは、種々の制御や演算を行なう演算処理装置(プロセッサ)の一例である。CPU4aは、CM4内の各ブロックとバスで相互に通信可能に接続されてもよい。なお、演算処理装置としては、CPU4aに代えて、電子回路、例えばMPU、ASIC、FPGA等の集積回路(IC)が用いられてもよい。
メモリ4bは、種々のデータやプログラムを格納するハードウェアの一例である。メモリ4bは、DE5に対するアクセス等に用いられるデータやプログラムを一時的に記憶するキャッシュメモリとして用いられてもよい。メモリ4bとしては、例えばRAM等の揮発性メモリが挙げられる。
記憶部4cは、種々のデータやプログラム等を格納するハードウェアの一例である。記憶部4cとしては、例えばHDD等の磁気ディスク装置、SSD等の半導体ドライブ装置、フラッシュメモリやROM等の不揮発性メモリ等の各種記憶装置が挙げられる。
例えば記憶部4cは、CM4の各種機能の全部若しくは一部を実現する制御プログラム400を格納することができる。CPU4aは、例えば記憶部4cに格納された制御プログラム400をメモリ4bに展開して実行することにより、CM4の機能を実現することができる。
インタフェース部4dは、中継装置2(FRT22、SVC23)、ホスト装置、DE5、CE3内の他のCM4、並びに作業者の作業端末等との間の接続及び通信の制御等を行なう通信インタフェースの一例である。例えばインタフェース部4dは、図1に示すIF4d−1〜4d−3や、作業端末を接続するためのアダプタ(ポート)等をそなえてもよい。なお、制御プログラム400は、図示しないネットワークからインタフェース部4dを介してCM4にダウンロードされてもよい。
図1に示す例において、IF4d−1は、中継装置2との間の接続及び通信の制御等を行なう通信インタフェースの一例である。IF4d−1としては、例えばPCIe等に準拠したアダプタをそなえるNon Transparent Bridge(NTB)が挙げられる。
IF4d−2は、ホスト装置との間の接続及び通信の制御等を行なう通信インタフェース(ホストインタフェース)の一例である。IF4d−2としては、例えばLocal Area Network(LAN)、Storage Area Network(SAN)、Fibre Channel(FC)、InfiniBand(インフィニバンド)等に準拠したアダプタをそなえるChannel Adapter(CA)が挙げられる。IF4d−2は、これらに準拠したケーブル等によってホスト装置と接続されてよく、図示しないネットワークを介してもよい。なお、図1の例では、IF4d−2はCM4に4つ設けられている。
IF4d−3は、DE5(記憶装置51)との間の接続及び通信の制御等を行なう通信インタフェースの一例である。IF4d−3は、例えば複数(図1の例では2つ)のInput/Output (I/O) Controller(IOC)4gと、Expander(EXP)4hとをそなえることができる。
IOC4gは、DE5へのアクセス(I/O)を制御するI/O制御部の一例である。また、EXP4hは、CM4配下に接続(例えばSAS接続)可能なデバイス数の拡張を行なうためのモジュールの一例である。EXP4hは、SASに対応したケーブル等によってDE5と接続されてもよい。
なお、図1の例では、複数のIOC4gがそれぞれ自身のCM4のEXP4hとCE3内の他のCM4のEXP4hとに接続され、これらのEXP4hはそれぞれCE3に対応するDE5に接続されている。
例えばホスト装置からIF4d−2を介して入力されたDE5(記憶装置51)へのアクセス要求は、CPU4a及びIOC4gによりパケット生成が行なわれ、EXP4hを介してDE5へ発行される。また、DE5からの応答はEXP4h及びIOC4gを介してCPU4aに受信され、IF4d−2を介してホスト装置へ返される。
図3の説明に戻り、インタフェース部4dは、記録媒体4fに記録されたデータやプログラムを読み出す読取部をそなえてもよい。読取部は、コンピュータ読取可能な記録媒体4fを接続又は挿入可能な接続端子又は装置を含んでもよい。読取部としては、例えばUSB等に準拠したアダプタ、記録ディスクへのアクセスを行なうドライブ装置、SDカード等のフラッシュメモリへのアクセスを行なうカードリーダ等が挙げられる。なお、記録媒体4fには制御プログラム400が格納されてもよい。
入出力部4eは、マウス、キーボード、操作ボタン等の入力部、並びにディスプレイ等の出力部の少なくとも一部を含むことができる。例えば入力部は、作業者(使用者)等による設定の登録や変更、システムのモード選択(切替)等の各種操作やデータの入力等の作業に用いられてよく、出力部は、作業者等による設定の確認や各種通知等の出力に用いられてもよい。
上述したCM4のハードウェア構成は例示である。従って、CM4内でのハードウェアの増減(例えば任意のブロックの追加や省略)、分割、任意の組み合わせでの統合、バスの追加又は省略等は適宜行なわれてもよい。
〔1−3〕機能構成例
・SVC23について
次に、図4を参照して、一実施形態に係るSVC23の機能構成例について説明する。図4は、図2に示す中継装置2をSVC23に着目して表した図であり、SVC23の監視処理に係る機能構成の一例を示している。
図4に示すように、SVC23は、例示的に、情報取得部231、異常検出部232、通知部233、及び縮退部234をそなえることができる。これらの機能は、CPU2aが実行する制御プログラム200により実現されてもよい。
情報取得部231は、中継装置2内の部品について、異常の判定に用いる監視情報を取得することができる。例えば情報取得部231は、MP20とのコネクタを経由して、自系のMP20、MP−EXT20a、MP−PSU20b、FRT22、ファンユニット24、及びPSU25、並びにMPブリッジ21の監視情報を取得することができる。また、情報取得部231は、他系のMP20、MP−EXT20a、MP−PSU20b、FRT22、SVC23、ファンユニット24、及びPSU25についても、自系のMP20及びMPブリッジ21経由で監視情報を取得することができる。
情報取得部231による監視情報の取得の手法(監視の手法)としては、以下に例示するものが挙げられる。なお、以下の説明において、中継装置2における各系統(各接続装置)にそなえられるMP20、MP−EXT20a、MP−PSU20b、MPブリッジ21、FRT22、SVC23、ファンユニット24、及びPSU25を区別しない場合には、これらを挿抜可能なモジュールの一例としてのユニットと表記する場合がある。
(i)他系SVC23へのハートビート監視
中継装置2内の各SVC23は、他系のSVC23及びCM4(例えばマスタCM4又は全てのCM4)に対して定期的に信号(ハートビート)を送信することができる。情報取得部231は、他系のSVC23から受信する自系のSVC23宛のハートビートの受信結果(受信状況)を、他系SVC23の監視情報として取得することができる。
(ii)入力電源監視
情報取得部231は、各ユニットに入力される電源を監視することができる。この監視では、他系のMP20全体の停電の発生や、PSU25から当該PSU25の属する系における他のユニットまでの給電経路での部分的な停電の発生等を監視することができる。例えば情報取得部231は、MP20や各ユニットへ入力されるDirect Current(DC)電圧等を監視情報として取得してもよい。
(iii)状態監視
中継装置2では、各ユニット(又は当該ユニットが接続されたMP20、MP−EXT20a、若しくはMP−PSU20b等)からマスタSVC23へユニットのステータスが通知されることがある。このステータスには、例えばMP20、MP−EXT20a、又はMP−PSU20b等に対してユニットが接続された状態であることを示すマウント(Mount)や、取り外された状態であることを示すアンマウント(Unmount)等が含まれてもよい。
情報取得部231は、他系(又は自系)のユニットのハードウェアから受信するこのようなステータスを監視情報として取得することができる。
なお、情報取得部231は、このようなステータス以外にも、中継装置2において予め定義されたステータスや、正常又は異常の範囲が定められた測定値等を監視情報として取得してもよい。測定値としては、ファンユニット24におけるファンの回転数や、各ユニットにおける温度等が挙げられる。
情報取得部231は、上述した(i)〜(iii)のうちの少なくとも1つについて監視情報を取得し、取得した監視情報を異常検出部232へ出力(通知)することができる。
異常検出部232は、情報取得部231により取得された監視情報に基づき、監視情報が中継装置2における各ユニットの異常を示すか否かを判定し、異常を示すと判定した監視情報について、異常に関する情報を通知部233へ出力(通知)することができる。
例えば異常検出部232は、上述した(i)〜(iii)のうちのいずれかの監視結果に基づき異常を検出したり、(i)〜(iii)の監視結果のうちの所定の組み合わせによって異常を検出することができる。なお、発生した異常の種別によっては、上述した(i)〜(iii)に係る複数の監視結果について、段階的に又は同様のタイミングで異常が検出されることもある。
異常に関する情報には、異常を示すと判定した監視情報の種別(異常の種別)、例えば停電、ハートビート異常、アンマウント等と、異常の発生した異常個所、例えばFRT22やSVC23等のユニットを表す情報とが含まれてもよい。異常検出部232は、このような異常に関する情報を、検出した異常の種別ごとに生成して通知部233へ出力することができる。
中継装置2において発生し得る異常としては、以下に例示するものが挙げられる。なお、以下、いずれかの系統に異常が発生する例を説明する場合には、異常の発生した系統を#1系と仮定し、異常の発生していない系統を#0系と仮定する。
(I)中継装置2内の片系(#1系)停電
この場合、#0系のSVC23(情報取得部231)では、入力電源監視によって#1系の全体又は部分的な停電を示す監視情報が取得され得る。従って、異常検出部232は、入力電源監視に係る監視情報に基づき#1系の全体又は部分的な停電を検出することができる。
また、#1系の全体又は#1系のSVC23を含む部分的な停電が発生した場合、#0系のSVC23では、停電の発生した#1系のSVC23からのハートビートが受信されない。従って、この場合、#0系の異常検出部232は、ハートビート監視に係る監視情報に基づきSVC23から一定期間ハートビートを受信していないと判断し、#1系のSVC23についてハートビート異常を検出することができる。
なお、停電によって動作が停止した#1系のユニットについては、#0系のSVC23へアンマウントを示すステータスが通知されることもある。この場合、異常検出部232は、状態監視に係る監視情報に基づき1以上のユニットのアンマウントを検出することができる。
(II)#1系のSVC23のハングアップ
この場合、#0系のSVC23では、ハングアップした#1系のSVC23からのハートビートが受信されない。従って、#0系の異常検出部232は、ハートビート監視に係る監視情報に基づきSVC23から一定期間ハートビートを受信していないと判断し、#1系のSVC23についてハートビート異常を検出することができる。
(III)#1系のSVC23の異常
#1系のSVC23の異常には、上記(I)又は(II)以外の異常も含まれる。例えば#1系のSVC23が自身の異常を検出して#0系のSVC23へ通知を行なった場合や、#1系のSVC23のステータス若しくは測定値等が異常の状態若しくは異常値(所定の閾値以上若しくは以下)を示すような場合等が挙げられる。
このような場合、#0系のSVC23では、監視情報に基づき#1系のSVC23の異常を検出することができる。
(IV)#1系のSVC23以外の#1系のユニットの異常
#1系のSVC23以外の#1系のユニットの異常には、例えばユニットのステータス若しくは測定値等が異常の状態若しくは異常値(例えば所定の閾値以上若しくは以下)を示すような場合等が挙げられる。一例として、ユニットのステータスが異常の状態(例えばアンマウント)を示す場合や、ファンユニット24におけるファンの回転数や各ユニットにおける温度等の測定値等が異常値を示す場合が挙げられる。
このような場合、#0系のSVC23では、監視情報に基づき#1系のユニットの異常を検出することができる。なお、このとき、#1系のSVC23によっても同様の異常が検出され得る。
なお、上述した(I)〜(IV)の異常は、マスタSVC23及びスレーブSVC23のいずれによっても検出され得る。
(V)MPブリッジ21の異常
一実施形態に係るストレージ装置1では、図1及び図2に例示するように中継装置2内のユニットが2系統で冗長化されている。しかし、これら2系統のユニット間は1つのMPブリッジ21により接続されている。
MPブリッジ21については冗長化が図られていないため、MPブリッジ21に故障等の異常が発生すると、中継装置2内の系間通信のアクセスパスが断たれてしまい、マスタSVC23(例えばSVC#0)とスレーブSVC23(例えばSVC#1)との間で互いの状態を確認することができない。
一例として、図5に示すように、MPブリッジ21に異常が発生した場合、マスタSVC#0からは、網掛けで示すFRT#2、FRT#3、SVC#1、ファンユニット#2、ファンユニット#3、PSU#2、及びPSU#3へアクセスすることができず、これらの監視が不可能となり得る。
このように、MPブリッジ21に異常が発生した場合、異常検出部232は、MPブリッジ21のアンマウントを検出することができるとともに、MPブリッジ21の先に接続された他系の全てのユニットについてもアンマウントを検出することができる。
但し、異常検出部232で他系の全てのユニットのアンマウントが検出されたとしても、これらのユニットのアンマウントはMPブリッジ21の異常に起因するものである可能性が高く、実際には他系の全てのユニットが正常である可能性が高い。
そこで、MPブリッジ21及び他系の全ユニットのアンマウントを検出すると、異常検出部232は、MPブリッジ21の状態(アンマウント)に係る監視情報に基づき、異常個所としてMPブリッジ21を表す情報を含む異常に関する情報を通知部233へ出力することができる。一方、異常検出部232は、他系のユニット(配下部品)については、通知部233からCM4へ、異常個所として当該他系のユニットを表す情報を含む異常に関する情報が出力(通知)されることを抑止することができる。
他系のユニットが異常個所としてCM4へ通知されないようにするには、例えば異常検出部232が通知部233に対して、異常個所として当該他系のユニットを表す情報を通知しないようにすればよい。或いは、異常検出部232が通知部233に対して、異常個所として当該他系のユニットを表す情報を通知するものの、通知部233からCM4への当該通知の送信を抑止させるような指示を与えてもよい。
なお、異常検出部232は、異常に関する情報を通知部233へ出力した後に、対応する異常個所が活性交換等により復旧したことを検出した場合、異常個所が復旧したことを示す情報を通知部233へ出力することもできる。なお、異常個所が復旧したことは、例えば状態監視においてアンマウントの状態からマウントの状態に変化したこと(切り離されていた他系ユニットが認識されたこと)によって検出されてもよい。
通知部233は、異常検出部232からの情報を複数のCM4へ通知することができる。この通知には、上述のように異常検出部232が検出した異常の種別ごとに、異常個所を表す情報が含まれてもよい。通知部233による通知先としては、ストレージ装置1における複数のCE3のそれぞれにそなえられたCM4のうち、少なくともマスタCM4であればよく、例えばストレージ装置1内の全CM4であってもよい。
なお、上述のように、SVC23では、マスタSVC23がCM4に対して通知を行なうことができる(通知を行なう権限を有する)ため、異常個所の通知についても、マスタSVC23が行なえばよい。一方、スレーブSVC23は、マスタSVC23の異常を検出した場合には、自身がマスタSVC23に昇格することで、CM4に対して異常個所の通知を行なうことができる。
このため、通知部233は、異常検出部232で他系SVC23の異常が検出された場合、自身のSVC23がスレーブであるか否かを判断し、スレーブである場合にはマスタに昇格してから(複数のCM4へ通知する権限を取得してから)、異常検出部232からの情報を複数のCM4へ通知すればよい。これにより、マスタSVC23において異常が発生しても、CM4は当該異常を確実に認識することができる。
なお、スレーブSVC23によるマスタSVC23への昇格は、例えばSVC23内のメモリ2b等の記憶装置に格納された設定情報等をスレーブからマスタに更新すること等により行なわれてもよい。
また、通知部233は、異常検出部232から、異常の種別が状態異常(アンマウント)であって、異常個所としてMPブリッジ21を表す情報を受け取ると、当該情報を複数のCM4へ通知することができる。このとき、通知部233は、当該アンマウントに起因して認識されなくなる他系の各部品(スレーブSVC23を含む配下のFRT22、ファンユニット24、PSU25等)についてのCM4へのアンマウント通知を抑止することができる。このように、通知部233は、異常検出部232によりMPブリッジ21のアンマウントが検出されると、MPブリッジ21の異常のみをCM4へ通知することができる。
なお、通知部233は、異常検出部232から異常個所が復旧したことを示す情報を入力された場合、当該情報を複数のCM4(少なくともマスタCM4)へ通知することができる。
縮退部234は、後述するCM4による縮退処理において、マスタCM4からの指示により自系又は他系のユニットの縮退を行なうことができる。
例えば縮退部234は、自系又は他系のユニットについて縮退を指示されると、該当ユニットを無効化(disable)又はリセットし、該当ユニットへの電源供給をオフに制御して停止させることができる。このようなユニットの縮退は、既知の種々の手法により行なうことが可能であり、個々のユニットに対する詳細な縮退の手順等については、その詳細な説明を省略する。
また、縮退部234は、マスタCM4から指示された縮退が完了すると、CM4へ完了通知を送信することができる。
・CM4について
次に、図6を参照して、一実施形態に係るCM4の機能構成例について説明する。図6は、図1に示すCM4の縮退処理に係る機能構成の一例を示す図である。
図6に示すように、CM4は、例示的に、情報取得部41、通知受信部42、判定部43、縮退処理部44、保持部45、及び組込処理部46をそなえることができる。これらの機能は、CPU4aが実行する制御プログラム400により実現されてもよい。なお、以下の説明では図6に示すCM4がマスタCM4であるものとするが、マスタCM4の異常によりスレーブCM4がマスタCM4に昇格し得るため、図6に示す構成はストレージ装置1内の全てのCM4がそなえてもよい。
情報取得部41は、中継装置2内の部品について、異常の判定に用いる監視情報を取得し、取得した監視情報を判定部43へ出力(通知)することができる。例えば情報取得部41は、SVC#0及び#1と接続されたラインを介して、#0系及び#1系の全てのSVC23の監視情報を取得することができる。
情報取得部41による監視情報の取得の手法(監視の手法)としては、上述したSVC23の情報取得部231によるハートビート監視(上記(i)参照)が挙げられる。例えば情報取得部41は、SVC#0及び#1(全SVC23)から受信するCM4宛のハートビートの受信結果(受信状況)を、SVC23の監視情報として取得することができる。
通知受信部42は、マスタSVC23の通知部233から送信された異常に関する情報や異常個所が復旧したことを示す情報等を受信し、受信した情報を判定部43へ出力(通知)する受信部の一例である。
なお、一実施形態において、通知部233からの通知はストレージ装置1における全てのCM4に対して送信されてよく、この場合、通知部233から通知を受信した各スレーブCM4は、マスタCM4に対して当該通知を転送してもよい。これにより、エラー等によりマスタCM4が通知部233からの通知を取得できないような事態を回避することができる。なお、各スレーブCM4からマスタCM4への通知(転送)は、図1に例示するIF4d−1及び中継装置2のFRT22経由で行なわれてもよい。
判定部43は、情報取得部41及び通知受信部42から入力される情報に基づき、縮退部234による縮退処理を行なう対象(例えば異常個所)を判定することができる。
例えば判定部43は、通知受信部42から通知される、上記(I)〜(V)等に基づく異常に関する情報を受けて、当該情報に含まれる異常個所を縮退処理の対象と判定することができる。
また、一実施形態においては情報取得部41によりハートビート監視が行なわれているため、例えば上記(I)〜(III)等におけるSVC23を含むユニットの異常については、判定部43は、情報取得部41から入力される情報(監視情報)に基づき判定を行なってもよい。
なお、判定部43は、情報取得部41から入力される情報、及び通知受信部42から通知される情報のうち、例えば先に判定部43に入力された情報に基づいて、縮退処理の対象を判定することができる。
なお、判定部43は、複数のユニットについて異常に関する情報を受信した場合、これらのユニットを総合的に判断して、例えばMP20、MP−EXT20a、又はMP−PSU20b等の複数のユニットに影響を与え得るユニットの異常と判断してもよい。この場合、判定部43は、保持部45に格納された後述する構成情報25aを参照してもよい。
ところで、上述のように、MPブリッジ21に故障等の異常が発生すると、中継装置2内の系間通信のアクセスパスが断たれてしまい、マスタSVC23とスレーブSVC23との間で互いの状態を確認することができない。このとき、マスタSVC23(例えばSVC#0)と連絡が取れなくなったスレーブSVC23(例えばSVC#1)においても、MPブリッジ21及び#0系の全てのユニットのアンマウントが検出され得る。
この場合、スレーブSVC#1は、CM4へ異常に関する情報(MPブリッジ21の異常)を通知するためにマスタSVC#1に昇格する。しかし、マスタSVC#0も正常に動作している場合、中継装置2において1つだけ存在するはずのマスタSVC23に重複が生じてしまい、中継装置2の監視やCE3(CM4)の制御に支障が出る可能性がある。
そこで、判定部43は、MPブリッジ21が縮退処理の対象であることを縮退処理部44に通知する場合、スレーブSVC23配下のユニット(スレーブSVC23の系統内の全ユニット)の縮退処理を指示することができる。なお、スレーブSVC23は、この時点で既にマスタSVC23に昇格しており、SVC#0及びSVC#1の双方がマスタSVC23になっているが、説明の便宜上、ここではスレーブSVC23と表記する。
なお、MPブリッジ21が異常の場合、2系統のSVC23の双方からMPブリッジ21のアンマウントが通知される可能性がある。この場合、判定部43は、システムの設定情報等を参照して、MPブリッジ21の異常前にスレーブSVC23であったSVC23を判断してもよいし、MPブリッジ21のアンマウント通知の受信が遅い方のSVC23をスレーブSVC23と判断してもよい。スレーブSVC23は、マスタSVC23に昇格するための処理を実行するため、マスタSVC23よりもアンマウント通知を送信するタイミングが遅いはずだからである。
また、MPブリッジ21に異常が発生する前後にスレーブSVC23が異常となる場合もある。この場合、スレーブSVC23配下のユニットに障害が発生しても、マスタSVC23からスレーブSVC23配下の各ユニットへのアクセスパスが断たれているため、その障害の検出や対応が困難となる。また、スレーブSVC23も異常であるため、マスタCM4から異常の発生したスレーブSVC23及びスレーブSVC23配下のユニットを縮退することも困難となる。
このように、MPブリッジ21及びスレーブSVC23が異常となった場合、中継装置2におけるクリティカルな障害に対応できなくなる可能性がある。
そこで、判定部43は、MPブリッジ21及びスレーブSVC23の双方が異常である場合には、システム(ストレージ装置1)全体を停止することを縮退処理部44へ指示することができる。
なお、MPブリッジ21及びスレーブSVC23の双方が異常である場合、通知受信部42では、マスタSVC23からMPブリッジ21及びスレーブSVC23のそれぞれについて、異常に関する情報が受信され得る。また、このとき、情報取得部41では、スレーブSVC23についてハートビート異常に関する監視情報が検出され得る。判定部43は、情報取得部41及び通知受信部42からのこれらの情報に基づいて、MPブリッジ21及びスレーブSVC23の異常と判断することができる。
また、判定部43は、通知受信部42から異常個所が復旧したことを示す情報(ユニットがマウントされたことの通知)を入力されると、組込処理部46に対して、該当するユニットについてシステムへの再組込処理を指示することができる。組込処理部46及び再組込処理の詳細については後述する。
保持部45は、データを格納する記憶領域であり、メモリ4b等の少なくとも一部の記憶領域により実現されてもよい。図6に例示するように、保持部45には構成情報45aが格納されてもよい。構成情報45aは、マスタCM4が管理する情報であってストレージ装置1の状態を表す情報の一例である。
図7に構成情報45aの一例を示す。図7に示すように、構成情報45aには、各ユニットの情報、例えばユニット名と、当該ユニットの状態、例えばonline/offline等とが含まれてもよい。なお、説明のために、図7の例では中継装置2のユニットの状態のみを示しているが、構成情報45aには、ストレージ装置1における他のユニット、例えばCE3やDE5内の部品の状態についても設定され管理されてもよい。
構成情報45aは、例えばCM4の出力装置(入出力部4e)やホスト装置、作業端末等に、ストレージ装置1の状態を提示するために用いられてもよい。例えばストレージ装置1の管理者等は、提示された情報に基づき異常個所の交換等を行なうことができる。
縮退処理部44は、判定部43から指示された縮退処理の対象となるユニットについて、縮退処理(切離処理)を行なうことができる。
換言すれば、縮退処理部44は、通知受信部42が受信した異常に関する情報等に基づき、中継装置2から異常個所を切り離す切離処理を行なう切離処理部の一例である。
縮退処理には、マスタSVC23又は異常個所を含む系(MP20)のSVC23(例えばスレーブSVC23)に対して、異常個所の動作を停止させる指示を送信する処理が含まれてもよい。また、縮退処理には、構成情報45aに対して異常個所に対応するユニットの状態を無効に設定する処理が含まれてもよい。
縮退処理部44による縮退処理としては、縮退処理の対象に応じて以下に例示するような処理が挙げられる。なお、以下、#0系又は#1系に異常が発生する例を説明する場合には、異常の発生した系を#1系と仮定し、異常の発生していない系を#0系と仮定する。
(a)#1系の個々のユニットの異常
この場合、縮退処理部44は、マスタSVC#0に対して縮退対象のユニットを停止させることを指示することができる。また、縮退処理部44は、マスタSVC#0から停止(縮退)の完了を通知されると、構成情報45aに対して縮退対象のユニットの状態を無効化するように更新することができる。
なお、構成情報45aの更新において、縮退処理部44は、縮退対象のユニット、例えば“SVC#1”のエントリのステータスを“offline”等の無効を意味する値に設定することで、縮退対象のユニットを無効化することができる。
これにより、MPブリッジ21の異常によりマスタSVC23からアクセスできず切り離しが行なえない異常個所についても、冗長化された経路を用いてマスタCM4がシステム(ストレージ装置1)からの切り離しを行なうことができる。
(b)MPブリッジ21の異常
MPブリッジ21が異常となった場合、縮退処理部44は、判定部43からスレーブSVC23(例えばSVC#1)を含むSVC#1配下のユニットの縮退処理を指示される。
この場合、縮退処理部44は、#1系(第2の接続装置)にそなえられたSVC#1を含む複数のユニットを縮退する縮退処理(中継装置2から切り離す切離処理)を行なうことができる。例えば、縮退処理部44は、スレーブSVC#1に対して、CM4間のインターコネクトを行なうFRT#2及びFRT#3の縮退を指示し、これらの縮退が完了すると、次にスレーブSVC#1自身の縮退を指示することができる。このように、縮退させる系統のSVC23が、自身以外の他のユニットを縮退させ、最後に自身を停止することで、SVC#1配下のユニットを確実に縮退させることができる。
このとき、ファンユニット24(#2及び#3)並びにPSU25(#2及び#3)については、電源オフ等の実際の縮退を行なわず、ファンユニット24のファンも回し続けることが好ましい。#0系については引き続き動作するため、#1系のファンを停止させると中継装置2内の温度が上昇し、#0系の動作に支障が出る可能性があるためである。従って、縮退処理部44は、#1系のファンユニット24及びPSU25についてはスレーブSVC#1に対して縮退の指示を行なわなくてもよい。
また、縮退処理部44は、スレーブSVC23への縮退の指示を行なうと(又はマスタSVC#0から縮退の完了を通知されると)、構成情報45aに対して縮退対象を無効化するように更新することができる。このとき、縮退処理部44は、停止させたFRT22及びSVC23に対応する“FRT#2”、“FRT#3”、及び“SVC#1”の他に、停止させていないファンユニット24及びPSU25に対応する“FANU#2”、“FANU#3”、“PSU#2”、及び“PSU#3”についても、無効化するように構成情報45aを更新することができる。これにより、#1系のFRT22及びSVC23の他に、#1系のファンユニット24及びPSU25についてもシステム管理上の部品ステータスとしてはシステムから切り離し済みとして扱うことができる。なお、このとき構成情報45aにおいてMPブリッジ21についても無効化してもよい。
(c)MPブリッジ21及びスレーブSVC#1の異常
MPブリッジ21及びスレーブSVC#1が異常となった場合、縮退処理部44は、判定部43からシステム全体の停止を指示される。この場合、縮退処理部44は、例えばシステムのシャットダウンを行なうことにより、システムを停止させることができる。一例として、縮退処理部44は、システムの疑似的な停電を発生させ、システムをシャットダウンさせることができる。
これにより、システムにおけるクリティカルな障害の発生を抑止することができ、システムの可用性を向上させることができる。なお、システムのシャットダウンの手法については、既知の種々の手法により行なうことが可能であり、その詳細な説明は省略する。
組込処理部46は、判定部43からの指示に応じて、ユニットをシステムに再度組み込むための再組込処理を行なうことができる。
再組込処理には、構成情報45aに対して、復旧したユニットの状態を有効に設定する処理が含まれてもよい。
一例として、組込処理部46は、復旧したユニット、例えば“SVC#1”のエントリのステータスを“online”等の有効を意味する値に設定することで、復旧したユニットを有効化することができる。
以上のように、一実施形態に係るストレージ装置1では、CE3及びDE5に加えて、FRT22及びSVC23を含むMP20を複数そなえた中継装置2が新たに設けられている。このような構成において、中継装置2内の異常個所を確実に縮退し、例えば二次故障等の発生を抑止することは、システムの可用性を高める上で重要である。
このため、一実施形態においては、例えば、SVC23により検出された異常に関する情報がCM4に通知され、CM4により、CE3から複数のSVC23への経路を経由して異常個所の縮退処理が行なわれる。これにより、中継装置2内の監視を行なうSVC23が確実に中継装置2内の異常を検出し、ストレージ装置1の制御を行なうCM4が確実に異常個所を縮退することができる。
また、CM4は、ストレージ装置1の状態を管理する管理情報(構成情報45a)を保持及び管理することができる。このため、縮退処理や再組込処理をCM4に行なわせることで、異常個所(縮退対象)の特定が容易且つ正確に行なえるとともに、縮退や再組込が行なわれたユニットの情報を一元管理することができ、システムの管理上の利便性も高い。
〔1−4〕ストレージ装置の動作例
次に、上述の如く構成されたストレージ装置1において中継装置2内で異常が発生した場合及び復旧した場合の動作例を、図8〜図10を参照して説明する。以下、他系のSVC23又はMPブリッジ21について異常又は復旧を検出するSVC23とマスタCM4とに着目して説明する。
〔1−4−1〕他系SVC23の異常
はじめに、図8を参照して、他系SVC23において異常が発生する場合の処理について説明する。
図8に示すように、SVC23の情報取得部231が中継装置2(例えば他系のSVC23)から監視情報を取得し(ステップS1)、監視結果を異常検出部232へ出力する。なお、このとき取得される監視情報には、他系のSVC23に係るハートビートの受信結果、入力電源の有無、状態情報、異常の通知、測定値等が挙げられる。
次いで、異常検出部232は、監視情報が他系SVC23の異常を示すか否かを判定し(ステップS2)、異常を示さない(他系SVC23の異常を検出しない)場合(ステップS2のNoルート)、処理がステップS1に移行する。
一方、監視情報が他系SVC23の異常を示す(他系SVC23の異常を検出した)場合(ステップS2のYesルート)、異常検出部232は、当該監視情報について、異常に関する情報を生成し通知部233へ出力する。なお、異常に関する情報には、検出された異常の種別、例えば停電、ハートビート異常、異常の通知等と、異常個所、例えば他系SVC23に関する情報とが含まれてもよい。
通知部233は、異常に関する情報を入力されると、自身がマスタSVC23であるか否かを判定する(ステップS3)。マスタSVC23である場合(ステップS3のYesルート)、処理がステップS5に移行する。一方、自身がマスタSVC23ではない(スレーブSVC23である)場合(ステップS3のNoルート)、通知部233は、自身のSVC23をスレーブSVC23からマスタSVC23に昇格させ(ステップS4)、処理がステップS5に移行する。
ステップS5では、通知部233がマスタCM4(及びスレーブCM4)へ異常に関する情報を通知する。
マスタCM4の通知受信部42は、通知部233からの異常に関する情報の通知を受信する(ステップS6)。また、ステップS6の前後若しくは同様のタイミングで、マスタCM4の情報取得部41が、他系SVC23から監視情報を取得する(ステップS7)。
判定部43は、通知受信部42からの通知又は情報取得部41から監視情報に基づいて、異常個所を判定する(ステップS8)。そして、判定部43は、判定した異常個所(この場合、他系SVC23)を縮退対象として通知する。縮退処理部44は、マスタSVC23に対して、通知された縮退対象の停止を指示する(ステップS9)。
マスタSVC23の縮退部234は、マスタCM4の縮退処理部44からの指示に応じて、他系SVC23を停止させ(ステップS10)、停止の完了をマスタCM4へ通知する。
マスタCM4の縮退処理部44は、マスタSVC23から停止の完了を通知されると、構成情報45aに対して縮退対象である他系SVC23のステータスを無効化(無効値を設定)し(ステップS11)、処理が終了する。なお、この後はマスタSVC23の系統において運用が続けられるが、他系SVC23が活性交換されると2系統による運用が再開される。
なお、他系におけるSVC23以外のユニットが異常となった場合は、異常を検出したマスタSVC23がCM4へ異常に関する情報を通知すればよい。そして、マスタCM4が他系のSVC23へ異常ユニットを縮退(FRT22の場合)させ、異常ユニットの構成情報45aを無効化(FRT22、ファンユニット24、PSU25の場合)すればよい。
〔1−4−2〕MPブリッジ21の異常
次に、図9を参照して、MPブリッジ21において異常が発生する場合の処理について説明する。
図9に示すように、マスタSVC23の情報取得部231が中継装置2(例えばMPブリッジ21)から監視情報を取得し(ステップS21)、監視結果を異常検出部232へ出力する。なお、このとき取得される監視情報には、MPブリッジ21に係る状態情報、例えばアンマウント通知等が挙げられる。
次いで、異常検出部232は、監視情報がMPブリッジ21の異常を示すか否かを判定し(ステップS22)、異常を示さない(MPブリッジ21の異常を検出しない)場合(ステップS22のNoルート)、処理がステップS21に移行する。
一方、監視情報がMPブリッジ21の異常を示す(MPブリッジ21の異常を検出した)場合(ステップS22のYesルート)、異常検出部232は、当該監視情報について、異常に関する情報を生成し通知部233へ出力する。なお、異常に関する情報には、検出された異常の種別、例えば異常(アンマウント)の通知等と、異常個所、例えばMPブリッジ21に関する情報とが含まれてもよい。
通知部233は、MPブリッジ21に係る異常に関する情報を入力されると、スレーブSVC23についてはマスタCM4への異常の通知を抑止する(ステップS23)。なお、ここで抑止される異常の通知の種別は、アンマウント通知に制限されてもよい。そして、通知部233は、マスタCM4へMPブリッジ21に係る異常に関する情報を通知する(ステップS24)。
マスタCM4の通知受信部42は、通知部233からの異常に関する情報の通知を受信する(ステップS25)。
判定部43は、通知受信部42からの通知に基づいて異常個所がMPブリッジ21であると判定し、次いでスレーブSVC23が異常であるか否かを判定する(ステップS26)。この判定は、通知受信部42又は情報取得部41からの他の情報に基づきスレーブSVC23の異常が検出されているか否かや、構成情報45aを参照することにより行なうことができる。
スレーブSVC23も異常である場合(ステップS26のYesルート)、以後のクリティカルな障害の発生を回避するため、判定部43は、縮退処理部44へシステムの停止を指示し、縮退処理部44は、システムを疑似的に停電させ(ステップS27)、シャットダウンを行ない、処理が終了する。
一方、スレーブSVC23が異常ではない場合(ステップS26のNoルート)、判定部43は、スレーブSVC23の配下に未縮退のFRT22が存在するか否かを判定する(ステップS28)。この判定は、構成情報45aを参照することにより行なうことができる。
未縮退のFRT22が存在しない場合(ステップS28のNoルート)、判定部43は、縮退処理部44へスレーブSVC23を含む系統内の全ユニットについて、縮退処理を指示し、処理がステップS31に移行する。
一方、未縮退のFRT22が存在する場合(ステップS28のYesルート)、判定部43は、縮退処理部44へ当該未縮退のFRT22及びスレーブSVC23を含む系統内の全ユニットについて、縮退処理を指示する。
そして、縮退処理部44は、スレーブSVC23に対して、まず、未縮退のFRT22の停止を指示する(ステップS29)。スレーブSVC23の縮退部234は、縮退処理部44からの指示に応じて、未縮退のFRT22を停止させ(ステップS30)、停止の完了をマスタCM4へ通知し、処理がステップS31に移行する。
ステップS31では、マスタCM4の縮退処理部44は、スレーブSVC23に対して、スレーブSVC23(SVC23自身)の停止を指示する。スレーブSVC23の縮退部234は、縮退処理部44からの指示に応じて、自身を停止させる(ステップS32)。
マスタSVC23の縮退処理部44は、構成情報45aに対して縮退対象であるスレーブSVC23配下の全ユニットの状態を無効に設定し(ステップS33)、処理が終了する。なお、縮退処理部44は、構成情報45aに対してMPブリッジ21についても状態を無効に設定してもよい。
〔1−4−3〕MPブリッジ21の復旧
次に、図10を参照して、MPブリッジ21が復旧した場合の処理について説明する。
図10に示すように、マスタSVC23の情報取得部231が中継装置2(例えばMPブリッジ21)から監視情報を取得し(ステップS41)、監視結果を異常検出部232へ出力する。なお、このとき取得される監視情報には、MPブリッジ21に係る状態情報、例えばマウント通知等が挙げられる。
次いで、異常検出部232は、監視情報がMPブリッジ21の復旧を示すか否かを判定し(ステップS42)、復旧を示さない(MPブリッジ21の復旧を検出しない)場合(ステップS42のNoルート)、処理がステップS41に移行する。
一方、監視情報がMPブリッジ21の復旧を示す(MPブリッジ21の復旧を検出した)場合(ステップS42のYesルート)、異常検出部232は、当該監視情報について、異常個所が復旧したことを示す情報を生成し通知部233へ出力する。なお、異常個所が復旧したことを示す情報には、検出された情報の種別、例えば復旧(マウント)の通知等と、復旧個所、例えばMPブリッジ21に関する情報とが含まれてもよい。
通知部233は、MPブリッジ21に係る異常個所が復旧したことを示す情報を入力されると、スレーブSVC23配下のユニットについて、マスタCM4への異常通知の抑止を解除し(ステップS43)、マスタCM4へMPブリッジ21が復旧したことを示す情報を通知する(ステップS44)。
マスタCM4の通知受信部42は、通知部233からの異常個所が復旧したことを示す情報の通知を受信する(ステップS45)。
判定部43は、通知受信部42からの通知に基づいて、組込処理部46へMPブリッジ21が復旧したことを通知し、システムへの再組込処理を指示する。組込処理部46は、構成情報45aに対して再組込対象であるMPブリッジ21の状態を有効に設定するとともに、MPブリッジ21以外の復旧通知を受信したユニットについて、順次状態を有効に設定し(ステップS46)、処理が終了する。
〔2〕その他
以上、本発明の好ましい実施形態について詳述したが、本発明は、かかる特定の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲内において、種々の変形、変更して実施することができる。
例えば、図4に示すSVC23の各機能ブロックや図6に示すCM4の各機能ブロックは、それぞれ任意の組み合わせで併合してもよく、分割してもよい。
また、中継装置2内のMP20、MP20内のFRT22、CE3内のCM4の数は、それぞれ2つに限定されるものではなく、それぞれ1又は3以上であってもよい。なお、中継装置2にMP20が3以上そなえられる場合、MPブリッジ21も2以上そなえられてもよい。
さらに、CM4内のIF4d−1及びEXP4hはそれぞれ2以上であってもよく、IF4d−2は3以下又は5以上であってもよく、IOC4gは1又は3以上であってもよい。
また、DE5の縦列接続数は4に限られず、3以下でも5以上でもよい。
〔3〕付記
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
上位装置から複数の記憶装置へのアクセスを制御する複数の制御装置と、
前記複数の制御装置の各々を相互に通信可能に接続する接続装置を複数そなえる中継装置と、をそなえ、
前記中継装置は、前記中継装置の監視を行なう監視部を前記接続装置ごとにそなえ、
前記複数の接続装置のうちの第1の接続装置にそなえられた第1の監視部は、前記中継装置内における異常を検出すると、前記検出した異常に関する情報を前記複数の制御装置のうちの第1の制御装置へ通知し、
前記第1の制御装置は、前記第1の監視部から通知された前記異常に関する情報に基づき、前記中継装置から異常個所を切り離す切離処理を行なう
ことを特徴とする、ストレージ装置。
(付記2)
前記中継装置は、前記複数の接続装置を相互に通信可能に接続するブリッジ部をさらにそなえ、
前記第1の制御装置は、前記第1の監視部から通知された前記異常に関する情報に基づき、前記異常個所が前記ブリッジ部であると判定した場合、前記第1の接続装置に前記ブリッジ部を介して接続された第2の接続装置について、当該第2の接続装置にそなえられた第2の監視部を含む複数のモジュールを前記中継装置から切り離す切離処理を行なうことを特徴とする、付記1記載のストレージ装置。
(付記3)
前記第1の制御装置は、前記異常個所が前記ブリッジ部であると判定した場合、前記切離処理において、前記第2の監視部に対して、前記第2の接続装置にそなえられたモジュールを停止させ、当該モジュールの停止後に、前記第2の監視部を停止させることを特徴とする、付記2記載のストレージ装置。
(付記4)
前記第1の制御装置は、前記第1の監視部から通知された前記異常に関する情報に基づき、前記異常個所が、前記ブリッジ部及び前記第2の監視部であると判定した場合、前記ストレージ装置を停止させる停止処理を行なうことを特徴とする、付記2又は付記3記載のストレージ装置。
(付記5)
前記第1の制御装置は、前記複数の監視部の各々を監視し、前記監視結果と前記第1の監視部から通知された前記異常に関する情報とに基づき、前記異常個所の判定を行なうことを特徴とする、付記1〜4のいずれか1項記載のストレージ装置。
(付記6)
前記複数の接続装置のうちの第2の接続装置にそなえられた第2の監視部は、前記第1の接続装置における前記第1の監視部を含む1以上のモジュールの異常を検出すると、前記検出した異常に関する情報を前記第1の制御装置へ通知する権限を取得し、前記異常に関する情報を前記第1の制御装置へ通知することを特徴とする、付記1〜5のいずれか1項記載のストレージ装置。
(付記7)
前記切離処理は、前記第1の監視部又は前記異常個所を含む接続装置の監視部に対して前記異常個所の動作を停止させる指示を送信すること、及び、前記ストレージ装置の状態を表す情報であって前記第1の制御装置が管理する管理情報に対して前記異常個所に対応するモジュールの状態を無効に設定すること、を含むことを特徴とする、付記1〜6のいずれか1項記載のストレージ装置。
(付記8)
前記第1の監視部は、前記切離処理によって前記中継装置から切り離されたモジュールに対応するモジュールが前記中継装置に接続されたことを認識すると、前記接続されたことを表す情報を前記第1の制御装置へ通知し、
前記第1の制御装置は、前記接続されたことを表す情報に基づき、前記ストレージ装置の状態を表す情報であって前記第1の制御装置が管理する管理情報に対して当該モジュールの状態を有効に設定することを特徴とする、付記1〜7のいずれか1項記載のストレージ装置。
(付記9)
上位装置から複数の記憶装置へのアクセスを制御する複数の制御装置と、前記複数の制御装置の各々を相互に通信可能に接続する接続装置を複数そなえる中継装置と、をそなえるストレージ装置における前記複数の制御装置のうちの第1の制御装置であって、
前記中継装置が前記接続装置ごとにそなえる前記中継装置の監視を行なう監視部のうちの、第1の接続装置にそなえられた第1の監視部から、前記第1の監視部により検出された前記中継装置内における異常に関する情報を受信する受信部と、
前記受信部が受信した前記異常に関する情報に基づき、前記中継装置から異常個所を切り離す切離処理を行なう切離処理部と、をそなえる
ことを特徴とする、制御装置。
(付記10)
上位装置から複数の記憶装置へのアクセスを制御する複数のコンピュータと、前記複数のコンピュータの各々を相互に通信可能に接続する接続装置を複数そなえる中継装置と、をそなえるストレージ装置における前記複数のコンピュータのうちの第1のコンピュータに、
前記中継装置が前記接続装置ごとにそなえる前記中継装置の監視を行なう監視部のうちの、第1の接続装置にそなえられた第1の監視部から、前記第1の監視部により検出された前記中継装置内における異常に関する情報を受信し、
前記受信した前記異常に関する情報に基づき、前記中継装置から異常個所を切り離す切離処理を行なう
処理を実行させることを特徴とする、制御プログラム。
1 ストレージ装置
2 中継装置
2a、4a CPU
2b、4b メモリ
2c、4c 記憶部
2d、4d インタフェース部
2e、4e 入出力部
2f、4f 記録媒体
3、3−1〜3−n コントローラエンクロージャ(CE)
4 コントローラモジュール(CM)
4d−1〜4d−3 インタフェース(IF)
4g IOコントローラ(IOC)
4h エキスパンダ(EXP)
5 ドライブエンクロージャ(DE)
20、20−1、20−2 ミッドプレーン(MP)
20a、20a−1、20a−2 MP−EXT
20b、20b−1、20b−2 MP−PSU
21 MPブリッジ
22 フロントエンドルータ(FRT)
23 サービスコントローラ(SVC)
24 ファンユニット(FANU)
25 PSU
41、231 情報取得部
42 通知受信部
43 判定部
44 縮退処理部
45 保持部
45a 構成情報
46 組込処理部
51 記憶装置
200、400 制御プログラム
232 異常検出部
233 通知部
234 縮退部

Claims (7)

  1. 上位装置から複数の記憶装置へのアクセスを制御する複数の制御装置と、
    前記複数の制御装置の各々を相互に通信可能に接続する接続装置を複数そなえる中継装置と、をそなえ、
    前記中継装置は、前記複数の接続装置を相互に通信可能に接続するブリッジ部をそなえるとともに、前記中継装置の監視を行なう監視部を前記接続装置ごとにそなえ、
    前記複数の接続装置のうちの第1の接続装置にそなえられ、前記監視により検出した異常に関する情報を前記複数の制御装置のうちの第1の制御装置へ通知する権限を有する第1の監視部は、前記中継装置内における異常を検出すると、前記検出した異常に関する情報を前記第1の制御装置へ通知し、
    前記第1の制御装置は、
    前記第1の監視部から通知された前記異常に関する情報に基づき異常個所を判定し、前記異常個所が、前記第1の接続装置のモジュール、又は、前記第1の接続装置と前記ブリッジ部を介して接続された第2の接続装置のモジュールであると判定した場合、前記第1の監視部に対して前記中継装置から前記異常個所を切り離すことを指示する第1切離処理を行ない、
    前記異常個所が前記ブリッジ部であると判定した場合、前記第2の接続装置にそなえられた第2の監視部に対して前記第2の接続装置の複数のモジュールを前記中継装置から切り離すことを指示する第2切離処理を行なう
    ことを特徴とする、ストレージ装置。
  2. 前記第1の制御装置は、前記異常個所が前記ブリッジ部であると判定した場合、前記第2切離処理において、前記第2の監視部に対して、前記第2の接続装置にそなえられたモジュールを停止させる指示を行ない、当該モジュールの停止後に、前記第2の監視部を停止させる指示を行なうことを特徴とする、請求項記載のストレージ装置。
  3. 前記第1の制御装置は、前記第1の監視部から通知された前記異常に関する情報に基づき、前記異常個所が、前記ブリッジ部及び前記第2の監視部であると判定した場合、前記ストレージ装置を停止させる停止処理を行なうことを特徴とする、請求項又は請求項記載のストレージ装置。
  4. 記第2の監視部は、前記第1の接続装置における前記第1の監視部を含む1以上のモジュールの異常を検出すると、前記検出した異常に関する情報を前記第1の制御装置へ通知する権限を取得し、前記異常に関する情報を前記第1の制御装置へ通知することを特徴とする、請求項1〜のいずれか1項記載のストレージ装置。
  5. 前記第1の監視部は、前記第1切離処理又は前記第2切離処理によって前記中継装置から切り離されたモジュールに対応するモジュールが前記中継装置に接続されたことを認識すると、前記接続されたことを表す情報を前記第1の制御装置へ通知し、
    前記第1の制御装置は、前記接続されたことを表す情報に基づき、前記ストレージ装置の状態を表す情報であって前記第1の制御装置が管理する管理情報に対して当該モジュールの状態を有効に設定することを特徴とする、請求項1〜のいずれか1項記載のストレージ装置。
  6. 上位装置から複数の記憶装置へのアクセスを制御する複数の制御装置と、前記複数の制御装置の各々を相互に通信可能に接続する接続装置を複数そなえる中継装置と、をそなえるストレージ装置における前記複数の制御装置のうちの第1の制御装置であって、
    前記中継装置が前記接続装置ごとにそなえる前記中継装置の監視を行なう監視部のうちの、第1の接続装置にそなえられ、前記監視により検出した異常に関する情報を前記第1の制御装置へ通知する権限を有する第1の監視部から、前記第1の監視部により検出された前記中継装置内における異常に関する情報を受信する受信部と、
    前記受信部が受信した前記異常に関する情報に基づき異常個所を判定する判定部と、
    記異常個所が、前記第1の接続装置のモジュール、又は、前記中継装置がそなえるブリッジ部であって前記複数の接続装置を相互に通信可能に接続する前記ブリッジ部を介して前記第1の接続装置と接続された第2の接続装置のモジュールであると前記判定部が判定した場合、前記第1の監視部に対して前記中継装置から前記異常個所を切り離すことを指示する切離処理を行ない、前記異常個所が前記ブリッジ部であると前記判定部が判定した場合、前記第2の接続装置にそなえられた第2の監視部に対して前記第2の接続装置の複数のモジュールを前記中継装置から切り離すことを指示する切離処理を行なう切離処理部と、をそなえる
    ことを特徴とする、制御装置。
  7. 上位装置から複数の記憶装置へのアクセスを制御する複数のコンピュータと、前記複数のコンピュータの各々を相互に通信可能に接続する接続装置を複数そなえる中継装置と、をそなえるストレージ装置における前記複数のコンピュータのうちの第1のコンピュータに、
    前記中継装置が前記接続装置ごとにそなえる前記中継装置の監視を行なう監視部のうちの、第1の接続装置にそなえられ、前記監視により検出した異常に関する情報を前記第1のコンピュータへ通知する権限を有する第1の監視部から、前記第1の監視部により検出された前記中継装置内における異常に関する情報を受信し、
    前記受信した前記異常に関する情報に基づき異常個所を判定し、前記異常個所が、前記第1の接続装置のモジュール、又は、前記中継装置がそなえるブリッジ部であって前記複数の接続装置を相互に通信可能に接続する前記ブリッジ部を介して前記第1の接続装置と接続された第2の接続装置のモジュールであると判定した場合、前記第1の監視部に対して前記中継装置から前記異常個所を切り離すことを指示する切離処理を行ない、前記異常個所が前記ブリッジ部であると判定した場合、前記第2の接続装置にそなえられた第2の監視部に対して前記第2の接続装置の複数のモジュールを前記中継装置から切り離すことを指示する切離処理を行なう
    処理を実行させることを特徴とする、制御プログラム。
JP2015093637A 2015-04-30 2015-04-30 ストレージ装置、制御装置、制御プログラム Active JP6582523B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015093637A JP6582523B2 (ja) 2015-04-30 2015-04-30 ストレージ装置、制御装置、制御プログラム
US15/068,675 US9842070B2 (en) 2015-04-30 2016-03-14 Storage apparatus, control apparatus and computer-readable recording medium having stored therein control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015093637A JP6582523B2 (ja) 2015-04-30 2015-04-30 ストレージ装置、制御装置、制御プログラム

Publications (2)

Publication Number Publication Date
JP2016212531A JP2016212531A (ja) 2016-12-15
JP6582523B2 true JP6582523B2 (ja) 2019-10-02

Family

ID=57205754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015093637A Active JP6582523B2 (ja) 2015-04-30 2015-04-30 ストレージ装置、制御装置、制御プログラム

Country Status (2)

Country Link
US (1) US9842070B2 (ja)
JP (1) JP6582523B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6662185B2 (ja) * 2016-04-28 2020-03-11 横河電機株式会社 処理装置、代替処理装置、中継装置、処理システム及び処理方法
JP6750380B2 (ja) * 2016-08-05 2020-09-02 富士通株式会社 制御装置、ストレージ装置、及び制御プログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5586250A (en) * 1993-11-12 1996-12-17 Conner Peripherals, Inc. SCSI-coupled module for monitoring and controlling SCSI-coupled raid bank and bank environment
US6112311A (en) * 1998-02-20 2000-08-29 International Business Machines Corporation Bridge failover system
US6408343B1 (en) * 1999-03-29 2002-06-18 Hewlett-Packard Company Apparatus and method for failover detection
EP1662369B1 (en) 2004-11-30 2017-12-06 Fujitsu Limited Data storage system and data storage control device
JP4440127B2 (ja) 2005-01-28 2010-03-24 富士通株式会社 データストレージシステム及びデータストレージ制御装置
JP4404754B2 (ja) 2004-11-30 2010-01-27 富士通株式会社 データストレージ装置及び情報処理システム
JP3776438B2 (ja) 2004-12-03 2006-05-17 株式会社日立製作所 記憶装置
JP4411602B2 (ja) * 2004-12-16 2010-02-10 日本電気株式会社 フォールトトレラント・コンピュータシステム
JP2007087266A (ja) 2005-09-26 2007-04-05 Hitachi Ltd ストレージシステムおよびストレージ装置
JP2008041080A (ja) * 2006-07-10 2008-02-21 Hitachi Ltd 記憶制御システム、記憶制御システムの制御方法、ポートセレクタ、及びコントローラ
US9058306B2 (en) * 2006-08-31 2015-06-16 Dell Products L.P. Redundant storage enclosure processor (SEP) implementation for use in serial attached SCSI (SAS) environment
US8473779B2 (en) * 2008-02-29 2013-06-25 Assurance Software And Hardware Solutions, Llc Systems and methods for error correction and detection, isolation, and recovery of faults in a fail-in-place storage array
JP5453872B2 (ja) * 2009-03-27 2014-03-26 日本電気株式会社 ディスクアレイ装置、ディスク制御装置、ディスクアレイ装置における負荷分散方法
US9141493B2 (en) * 2013-07-12 2015-09-22 International Business Machines Corporation Isolating a PCI host bridge in response to an error event

Also Published As

Publication number Publication date
US9842070B2 (en) 2017-12-12
JP2016212531A (ja) 2016-12-15
US20160321199A1 (en) 2016-11-03

Similar Documents

Publication Publication Date Title
JP6455302B2 (ja) バス通信システム
JP6011210B2 (ja) ストレージ制御装置,プログラマブル論理回路の復旧処理方法及び制御プログラム
JP6307847B2 (ja) 情報処理装置,制御装置及び制御プログラム
US8583863B2 (en) Storage system
JP2017010390A (ja) ストレージ制御装置、ストレージ制御プログラム、およびストレージ制御方法
JP2004199551A (ja) ストレージシステム及び障害ストレージ装置の切り離し方法
JP2005339216A (ja) 記憶制御システム
US8099634B2 (en) Autonomic component service state management for a multiple function component
JP2007025933A (ja) ストレージシステム及びそのファームウェア自動更新方法
JP6582523B2 (ja) ストレージ装置、制御装置、制御プログラム
US7487293B2 (en) Data storage system and log data output method upon abnormality of storage control apparatus
TW201423582A (zh) Sas擴展卡自動切換系統及方法
US9507677B2 (en) Storage control device, storage apparatus, and computer-readable recording medium having storage control program stored therein
JP2007018034A (ja) 制御装置及び制御方法
JP6492939B2 (ja) 制御装置、ストレージシステムおよびプログラム
US9542273B2 (en) Storage control apparatus, storage control system, and storage control method for failure detection and configuration of cascaded storage cabinets
US10454757B2 (en) Control apparatus, storage apparatus, and non-transitory computer-readable recording medium having stored therein control program
US9838285B2 (en) Connection monitoring device and connection monitoring method
US20200073751A1 (en) Storage apparatus and recording medium
JP5736875B2 (ja) ストレージ装置およびストレージ装置の制御方法
US8307244B2 (en) Storage system and storage control apparatus
US11074144B2 (en) Active firmware replacement in storage system and in storage controller, and computer-readable recording medium having stored therein program for active firmware replacement in controlling storage
US20160320822A1 (en) Power source controller and storage device
US20180307554A1 (en) Apparatus and method to control a storage device
JP5217896B2 (ja) ストレージシステム、ストレージ装置、ホスト装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181106

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190311

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190806

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190819

R150 Certificate of patent or registration of utility model

Ref document number: 6582523

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150