JP4620152B2 - ストレージシステム、ストレージ管理装置、ストレージ管理方法 - Google Patents

ストレージシステム、ストレージ管理装置、ストレージ管理方法 Download PDF

Info

Publication number
JP4620152B2
JP4620152B2 JP2008318080A JP2008318080A JP4620152B2 JP 4620152 B2 JP4620152 B2 JP 4620152B2 JP 2008318080 A JP2008318080 A JP 2008318080A JP 2008318080 A JP2008318080 A JP 2008318080A JP 4620152 B2 JP4620152 B2 JP 4620152B2
Authority
JP
Japan
Prior art keywords
lip
time
initialization
initialization process
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008318080A
Other languages
English (en)
Other versions
JP2010140399A (ja
Inventor
弘昭 越智
智昭 鶴田
直浩 武田
司 牧野
麻理恵 安部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008318080A priority Critical patent/JP4620152B2/ja
Priority to US12/631,191 priority patent/US8234472B2/en
Publication of JP2010140399A publication Critical patent/JP2010140399A/ja
Application granted granted Critical
Publication of JP4620152B2 publication Critical patent/JP4620152B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Description

大容量のデータを記憶することができるストレージシステム、およびストレージシステムを管理するストレージ管理装置、ストレージ管理方法に関する。
膨大なデータを蓄積するため、複数の磁気ディスク装置(以下、磁気ディスク装置をDiskと記す)を搭載したストレージシステムがある。
図6にストレージシステムの全体図を示す。図6で示したストレージシステムは、RAID(Redundant Arrays of Independent (Inexpensive) Disks)を構成することによりデータの冗長性を高め、望ましい性能特性をホストに提供することを目的とするシステムである。
以下、図6に示した各モジュールについて説明する。
CA(Channel Adapter)は、Hostとのインターフェースの制御をつかさどるモジュールである。CAは、HostよりデータのWrite/Readオペレーション要求を受領すると、CM(後述)に対して処理要求を通知したり、CM上のCache Memoryに直接アクセスしてCMとHostとの間でのデータ転送を行う。
CM(Centralized Module)は、図6で示した全モジュールの中核となるモジュールである。CM内には、主にCACHE制御モジュール、Backend制御モジュールのファームウェアで実装された制御モジュールが存在する。
CACHE制御モジュールは、CM内のメモリ領域に関して、割り当て管理、制御全般を行う。BackEnd制御モジュールは、Diskと通信を行なうFibre Channel Interfaceの制御、DiskのI/O制御、および複数Diskによって構成されるRAIDの制御等を行う小モジュールを有する。これら制御は管理用のテーブルであるFCMAP(詳細は後述)に基づき行われる。尚、図6ではFibre Channel Interfaceの制御、およびDiskのI/O制御を行うモジュールをFC/Disk Driverと表記している。
また、CMにはDiskと通信を行なうためのQX4と呼ばれるFCコントローラが搭載されている。
BRT(BackEnd Router)は、CMとDE(後述)との間の通信経路を提供するファブリック機能を持つモジュールである。図7を参照しつつBRTの特徴について説明する。
BRT内にはCMとのインターフェースが8Port存在し、BRTは最大8個のCMと接続可能である。また、BRTはDEとの接続用インターフェースが8Port存在し、最大48個のDE(8パス×6カスケード)と接続可能である。本ストレージシステムは、最大で8個のBRTが実装される。また、DEへのパスを冗長化するため常に2つのBRTが組で実装される。
尚、ファブリックとは、ターゲット(本例ではDisk)とイニシエータ(本例ではCM)を接続する方式の一つであり、ファイバ・チャネル・スイッチを使用した、またはファイバ・チャネル・スイッチ同士が相互接続されたネットワークを指す。ファブリック機能が実装されている場合、イニシエータとターゲットのPortを直接接続しなくてもよいため、拡張性に優れている。また、ファブリック機能は、ターゲット複数をループ接続するAL−PA方式に比べると、コマンドが送られる際にはファブリック機能を有する装置のみが介されるため、高いコマンド処理能力を発揮する。
図6で示したストレージシステムの内部モジュールの説明に戻る。DE(Drive enclosure)は、Diskを実際に搭載する装置である。図8を参照しつつDEについて説明する。DEは1台につき最大15台のDiskを搭載することが可能である。また、DEは2枚のPBC(後述)を搭載し、PBCを介して他のDEとのカスケード接続が可能である。尚、以降の説明において必要な場合、イニシエータ(本例ではBRT)に直接接続されているDEを基本DEと称し、基本DEからカスケード接続されているDEを拡張DEと称す。
PBC(Port Bypass Circuit)は、はDE当たり2枚搭載され、FCC(Fiber Channel Controller)を搭載し、CMから指定されたDiskへ、また指定されたDiskからCMへFCパケットを転送する役割を持つ。
また、以下にストレージシステムの関連用語を以下に示す。
・PLU
PLUはCM内で管理しているシステム内のDiskの搭載位置を示す情報で、「DE No.」と、「Solt No.」で示される。
・Loop ID
Loop IDは、ファイバチャネルで構成されるループであるFC Loopに接続される各デバイスの識別情報である。FC Loopに接続される各デバイスにはそのループ内で固有のアドレスが割り当てられている。このアドレスをAL_PAと表す。AL_PAは連続した数値では無く、扱いにくい場合がある。このためそれぞれのAL_PAに対して論理的に連続した数値が割り当てられる。この連続した数値がLoop IDである。
ストレージシステム、および上流モジュールではDiskの位置情報はPLUで扱う。しかし、実際にDiskにコマンド発行が行われる際には、FCMAPから指定されたPLUの対となるLoop IDが使用され、Diskにコマンドが発行される。
・FCMAP
FCMAPは、FC Loopに接続されているDiskの情報の一覧をテーブル化したものである。FCMAPは、FC Loop上にLIP(後述)が発生した場合に作成される。FCMAPには以下の情報が格納される。
・PLUに対応するLoop ID
・FCCのLoop ID
・その他、Diskに関する情報
LIP(Loop Initialize Primitive)
LIPは、FC Loopに接続されているデバイスの識別情報を認識し、使用可能にするために行われるイニシャライズ処理である。Loop Master(本例ではCM)からLIP開始コマンドがFC Loop上に発行されることにより、LIPが実行される。尚、LIPは、BRT内の各Port(FC Loop)で構成が変更になった際に随時実施される。
ストレージシステムは、FC Loopの状態を以下の通りに区別する。
・Linkup
LIPが完了し、該当FC Loopが使用可能な状態を示す。
・LIP中
LIP実施中であり、該当FC Loopは使用不可能状態であることを示す。また、LIP処理が開始してから一定時間経過してもLIPが完了しなかった場合(LIP Timeout)、ハード異常などが発生している可能性があるため、本ストレージシステムは、該当Portを使用不可能な状態にする。
・Linkdown
LIP未完了の為、FC Loopが使用不可能な状態であることを示す。
また、本発明の関連ある従来技術として、以下の文献が開示されている。
特開2001−86146号公報 特開2007−274153号公報
同一BRTに接続されている複数のFC Loopで同時にLIPが発生した場合、BRTの処理能力限界によりLIPの完了が遅延する。
また、拡張DEに停電が発生した場合、ストレージシステムは、以下の条件で停電が発生したと判断する。
(1)停電が発生したDEのLIPが完了し、該当FC Loopの状態がLinkupである。
(2)停電が発生したDEに搭載されているDiskにアクセスがあった場合、該当DiskのLoop IDがFCMAPから消失する。
(3)そのDEに搭載されているFCCがFCMAPから消失する。
しかし、拡張DEの停電により、同一BRTに接続されている複数Port(FC Loop)にLIPが発生した場合、上述のようにBRT内の処理能力限界により停電が発生したDEのFC LoopがLinkupになるまでに時間がかかる。その結果、LIP TimeoutとなりDE停電と判断できないケースが存在する。
停電を検出できていれば、例えばCache上にあるデータを一時的にDisk(基本DE内のDisk)に退避することによりデータロストを防止することが可能となるが、停電を検出できなかった場合、それが不可能となってしまう。
ここで、図9を参照しつつ、上述の問題動作についてさらに説明する。尚、ストレージシステムの配置状況にもよるが、基本DEと拡張DEとは別のラックに搭載され、カスケード接続の段数が同一である拡張DEは、同一ラックに搭載される蓋然性が配線ケーブル長の関係で高くなる。また、ラックマウントされた各装置は、ラックの共通の電源ユニットから電力供給される。よって、停電が発生した場合はラック単位で電源断となる(すなわち、同一のラックに搭載されている各装置は同時に電源断になる)ことに留意する。図9の例では、破線でグループ化されたDEが1つのラックに搭載されているものとする。また、一点鎖線で示したグループが1つのFC Loopを構成しているものとする。尚、システムを構築する上で、主要なユニットは一箇所に集約するというポリシーがあり、このポリシーに則る場合、CMと基本DEとは同一のラックに搭載され、よってCMと基本DEとはラック上の共通の電源ユニットから電力が供給されることとなる。
1.まず、基本DEと直接接続している拡張DEを搭載したラックに、停電が発生したとする。
2.DEの停電が複数のFC Loopに跨って発生したため、BRTと接続された複数FC LoopにてLIPが発生する。BRTの処理能力限界のため、LIPの完了が間延びする。
3.LIP完了が間延びした結果、LIP監視時間超えが検出され、LIP Timeoutとなり、パスが閉塞する。
4.CMは停電が発生したDEに搭載されているDiskに対してコマンド発行を試みる。しかし、CMは、上記「3.」でパス閉塞が生じているため、DE停電が発生したと判断できない。
5.停電が検出されなければ、アクセス可能であった基本DEへのアクセスも不可能となり、データロストが発生する(バックアップ失敗)。
本発明は上述した問題点を解決するためになされたものであり、LIP Timeoutとなる時間を延長可能とすることで、DEの停電によるFC Loopの閉塞、およびバックアップの失敗を防止することができるストレージシステム、ストレージ管理装置、ストレージ管理方法を提供することを目的とする。
ストレージシステムは、複数の記憶装置と、前記記憶装置を少なくとも一つ搭載する、複数の搭載装置と、前記搭載装置が複数カスケード接続されることで成る、少なくとも2つのループと接続するルータ装置と、前記ルータ装置に接続されたループのうちの少なくとも一つのループで、記憶装置それぞれの識別情報を取得する初期化処理が実行された場合、該初期化処理が完了しているか否かを判定する初期化完了判定部と、前記初期化完了判定部による判定結果が否である場合、初期化処理の実行時間が所定の時間を経過しているか否かを判定する初期化時間判定部と、前記初期化時間判定部による判定結果が否であり、かつ、初期化処理が前記ルータ装置に接続されたループの複数で実行されている場合、前記所定の時間を延長する時間延長部と、を備える。
ストレージ管理装置は、記憶装置を少なくとも一つ搭載する搭載装置が複数カスケード接続されることで成る、複数のループのうちの少なくとも一つのループで、記憶装置それぞれの識別情報を取得する初期化処理が実行された場合、該初期化処理が完了しているか否かを判定する初期化完了判定部と、前記初期化完了判定部による判定結果が否である場合、初期化処理の実行時間が所定の時間を経過しているか否かを判定する初期化時間判定部と、前記初期化時間判定部による判定結果が否であり、かつ、初期化処理が複数のループで実行されている場合、前記所定の時間を延長する時間延長部と、を備える。
ストレージ管理方法は、記憶装置を少なくとも一つ搭載する搭載装置が複数カスケード接続されることで成る、複数のループのうちの少なくとも一つのループで、記憶装置それぞれの識別情報を取得する初期化処理が実行された場合、該初期化処理が完了しているか否かを判定する初期化完了判定ステップと、前記初期化完了判定ステップによる判定結果が否である場合、初期化処理の実行時間が所定の時間を経過しているか否かを判定する初期化時間判定ステップと、前記初期化時間判定ステップによる判定結果が否であり、かつ、初期化処理が複数のループで実行されている場合、前記所定の時間を延長する時間延長ステップと、を実行する。
初期化処理のタイムアウトとなる時間を延長することで、搭載装置の停電によるループの閉塞を防止する。
本実施の形態の概要について説明する。本実施の形態におけるストレージシステムは、拡張DEで停電が発生した場合、BRTの各Port、すなわちFC Loop(ループ)にてLIPが発生する。発生したLIPが一定時間完了しなかった場合、ストレージシステムは、同一BRTの他PortにてLIPが発生していないか確認する。発生している場合、ストレージシステムは、DEでの停電の可能性があるためLIP監視時間を延長しLIP完了を待つ。これにより、LIP TimeoutによるBRT Portの切り離し(閉塞)とBackupの失敗を防止する。
本実施の形態のストレージシステムのハードウェア構成を図1に示す。ストレージシステム100は、CM10、BRT20(ルータ装置)、少なくとも一つのDisk(記憶装置)を搭載した基本DE30および拡張DE31(搭載装置)を有する。また、CM10には、中央処理装置であるCPU(Central Processing Unit)900、揮発性/不揮発性の記憶装置であるメモリ901を備える。CM10の機能については後述するが、CM10以外の各モジュールは、従来と同様の機能を有するものである。次に、ストレージシステム100の動作について、図1を参照しつつ説明する。尚、図1は、図9同様破線でグループ化されたDEが1つのラックに搭載されているものとする。また、一点鎖線で示したグループが1つのFC Loopを構成しているものとする。
まず、複数の拡張DE31にて停電が発生した場合(S1)、BRT20の複数Port(すなわち、FC Loop)にてLIPが発生する。BRT20の処理能力限界のため、LIPの完了が間延びする(S2)。
LIP完了間延びの結果、LIP監視時間超えが検出される。ここでCM10は、LIP監視時間超えが検出された場合、同一BRTの複数PortでLIPが発生しているかを確認する(S3)。複数PortでLIPが発生しているため、拡張DE31で停電が発生している可能性があるため、CM10はLIP監視時間を延長する(S4)。しばらくしてLIPが完了する。
CM10は、ストレージシステム100を使用しているユーザから、停電が発生した拡張DE31に搭載されているDiskに対しデータのリード/ライトのアクセスがあった場合、当該Diskに対しアクセスを試みる。しかしながら、LIPは完了しているが、当該DiskのLoop IDが停電のため存在せず、アクセスは失敗する(S5)。
ここで、CM10は、DE31で停電が発生したと疑い、当該Diskが搭載されている拡張DE31のFCCがFCMAP上に存在するか確認する。CM10は、FCCが消失していることを確認した場合、DEで停電が発生していると判断する(S6)。
停電を検出したCM10は、アクセス可能なDEに搭載されているDiskにCache上のデータ、例えば、ユーザからのアクセスがライト要求であった場合、その書き込み内容のデータを退避する(S7)。尚、本実施の形態では、アクセス可能なDEを、上述の理由によりCM10と同一のラックに搭載されている蓋然性が高い基本DE30とし、CM10は、基本DE30内のDiskにCache上のデータを退避する。
次に、本実施の形態のCM10内の機能ブロックの一例を図2に示す。CM10は、初期化完了判定部1、初期化時間判定部2、時間延長部3、データバックアップ部4を備える。尚、これら各機能ブロックは、メモリ901内に予め保持されているファームウェア(ソフトウェア)が呼び出され、ファームウェアとCPU900、メモリ901等の各ハードウェア資源とが協働することで実現される。
初期化完了判定部1は、BRT20に接続されたFC Loopうちの少なくとも一つのFC Loopで、Diskそれぞれの識別情報を取得する処理であるLIPが実行された場合、LIPが完了しているか否かを判定する。
初期化時間判定部2は、初期化完了判定部1による判定結果が否である場合、初期化処理の実行時間が所定の時間を経過しているか否かを判定する。
時間延長部3は、初期化時間判定部2による判定結果が否であり、かつ、LIPがBRT20に接続されたループの複数で実行されている場合、上述の所定の時間を延長する。
また、データバックアップ部4は、LIPが完了した後に、識別情報が取得されなかったDiskに対するライトアクセスが発生し、そのライトアクセスが失敗した場合、そのライトアクセスのデータを、識別情報が取得されなかったDiskを搭載したDEとは別のDE内のDiskに保持させる。
尚、初期化完了判定部1、初期化時間判定部2、時間延長部3、データバックアップ部4の各機能は、上述のBackend制御モジュールの中に組み込まれてもよい。
次に、時間延長部3の動作の概要について説明する。
BRTの複数PortでLIPが発生し、一定時間経過してもLIPが完了せず時間監視超えが検出された場合、時間延長部3は後述するLIP発生状況確認BITMAP、およびLIP延長BITMAPの保持内容に基づきLIPの延長が必要であるか判断する。LIPの延長が必要であると時間延長部3が判断した場合、時間延長部3は、一定間隔でLIP完了の監視を行い、監視時間の延長を行う。
ここで、BRT20の各PortでLIPが発生した際の時間延長部3の動作の一例を図3に示し、説明する。
まず、任意のPort(図3の例ではPort0)でLIPが発生した場合、時間延長部3は、Port0に対するLIP時間監視を開始する(S11)。次いで、別のPort(図3の例ではPort1)でLIPが発生した場合、時間延長部3は、Port1に対するLIP時間監視を開始する(S12)。ここで、Port0のLIP監視時間超えが検出され、LIP発生状況確認BITMAP、およびLIP延長BITMAPの保持内容に基づいたLIP延長チェック(後述)によって時間延長部3が延長を要すると判断した場合(S13)、Port0のLIP時間監視が再度開始される(S14)。
再度、Port0のLIP監視時間超えが検出され、LIP延長チェックによって時間延長部3が延長を要すると判断した場合、Port0のLIP時間監視がさらに開始される(S15、S16)。
最後に、LIPが完了した場合、Port0のLIP監視延長が終了する(S17)。
LIP延長処理に使用するBITMAPについて、図4を参照しつつ説明する。本実施の形態では、LIP延長の処理のため、LIP発生状況確認BITMAP(図4(A)参照)、およびLIP延長BITMAP(図4(B)参照)の2つのBITMAPを用いる。以下、LIP発生状況確認BITMAP、LIP延長BITMAPについて説明する。尚、これらBITMAPはメモリ901に保持されるものとする。またこれらBITMAPは、上述のFCMAP内に組み込まれてもよい。
LIP発生状況確認BITMAPは、BRTの各PortでLIPが発生しているか否かを示すBITMAPである。各Bitの値は、1の場合「LIP中」であることを意味し、0の場合「LIP中以外」であることを意味する。LIP発生状況確認BITMAPは、システムの最大構成時のBRTのPort数(最大64)を管理するするため、8Byteすなわち64Bitのメモリ領域がメモリ901上に新たに設けられる。本領域は、各CM毎に保持される。
LIP発生状況確認BITMAPの形式を図4(A)に示す。LIPが発生した場合、該当Portに対応したBitが1に設定される。LIPが完了した場合、該当Portに対応したBitが0に設定される。
LIP延長BITMAPは、LIP延長が必要であるか否かをBRTごとに示すBITMAPである。各Bitの値は、1の場合「LIP延長必要」であることを意味し、0の場合「LIP延長不要」であることを意味する。LIP延長BITMAPは、システムの最大構成時のBRT数(最大8)を管理するため、1Byteすなわち8Bitのメモリ領域がメモリ901上に新たに設けられる。本領域は、各CM毎に保持される。
LIP延長BITMAPの形式を図4(B)に示す。LIP開始時にLIP発生状況確認BITMAPのフラグから、同一BRT配下の複数PortでLIPが発生しているかが確認される。その結果、同一BRT配下の複数PortにてLIPが発生していると判断された場合、該当BRTのLIP延長フラグが1に設定される。
尚、BRT配下で初回LIP(例えば、前回LIPが発生した時から所定期間が経過した後にLIPが発生した場合、そのLIPを初回LIPとする)が発生したタイミングで、当該BRTのLIP延長フラグが0に設定される。また、LIP監視時間超えが検出された場合、本BITMAPが参照され、LIP延長フラグが1に設定されていた場合、LIPは延長される。
ここで、あるBRT配下のPortにて、複数LIPが発生した場合の例を図4(C)に基づき説明する。尚、図4(C)は、横方向を時間軸とした図である。
あるBRT配下のPort、例えばPort0にてLIPが発生したとする(図4(C)の(1))。該当BRT配下のLIP発生状況確認BITMAPのフラグが確認され、該当BRT配下のPortでは初回LIPであると判断される。そのため、該当BRTのLIP延長BITMAPのフラグは0に設定される。
次に、上述のBRT配下の別のPort、例えばPort1にてLIPが発生したとする(図4(C)の(2))。ここで、該当BRT配下のLIP発生状況確認BITMAPのフラグが確認される。該当BRT配下のPort0で既にLIPが発生しているため、該当BRTのLIP延長BITMAPのフラグが1に設定される。
Port0に対する監視時間超えが検出された時(図4(C)の(3))、該当BRTのLIP延長BITMAPのフラグが参照される。LIP延長BITMAPのフラグが1に設定されているため、Port0に対するLIPの延長処理が実施される。Port1に対する監視時間超えが検出された時(図4(C)の(4))も同様である。
次に、CM10の動作を図5のフローチャートを参照しつつ説明する。
まず、DE31で停電が発生し、LIPが発生した場合(S21)、初期化時間判定部2は、LIPの時間監視すなわちLIPの実行時間が所定の時間経過したか否かの判定処理を行うためのLIP実行時間を計測する(S22)。ここで、時間延長部3は、LIP発生状況確認BITMAPに対し、該当BRT内のLIPが発生したPortに対応したBitを1に設定し(S23)、該当BRT配下で発生したLIPは初回LIPかを判定する(S24)。尚、時間延長部3は、LIP発生状況確認BITMAP上で、同一BRT内の他のBitに既に1が設定されているか否かを判定し、1が設定されていない場合に初回LIPであると判定し、1が設定されている場合に初回ではないものと判定する。
ここで、初回LIPである場合(S24、Yes)、時間延長部3は、LIP延長BITMAPの該当BRTに対応するBitに0を設定する(S25)。一方、初回LIPでない場合(S24、No)、時間延長部3は、LIP延長BITMAPの該当BRTに対応するBitに1を設定する(S26)。
初期化完了判定部1は、LIPが完了しているか否かを判定する(S27)。LIPが完了している場合(S27、Yes)、初期化時間判定部2は、LIPの時間監視すなわちS22で開始したLIP実行時間の計測を停止し(S34)、処理は終了する。
一方、LIPが完了していない場合(S27、No)、初期化時間判定部2は、LIP監視時間を超えたか否か、すなわちLIPの実行時間が予め設定された所定の時間を経過しているか否かを判定する(S28)。ここで、LIPの実行時間が監視時間を超えている場合(S28、Yes)、時間延長部3は、LIP監視時間の延長が必要か否かの判定を行う(S29)。尚、時間延長部3は、LIP延長BITMAPの該当BRTに対応するBitが1である場合は延長必要と判定し、0である場合は延長不要と判定する。
ここで、延長が不要と判定された場合(S29、No)、処理はそのまま終了する。一方、延長が必要と判定された場合(S29、Yes)、時間延長部3は、監視時間(所定の時間)を延長することで、LIP時間監視を再開する(S30)。
初期化完了判定部1は、再度LIPが完了しているか否かを判定する(S31)。LIPが完了している場合(S31、Yes)、初期化時間判定部2は、LIPの時間監視すなわちS22で開始したLIP実行時間の計測を停止し(S34)、処理は終了する。
一方、LIPが完了していない場合(S31、No)、初期化時間判定部2は、S28同様、LIP監視時間を超えたか否かを判定する(S32)。ここで、LIPの実行時間が監視時間を超えている場合(S32、Yes)、時間延長部3は、LIPの延長が予め定義された一定回数実施されたか否かを判定し(S33)、一定回数を超えている場合(S33、Yes)、処理が終了し、当該LIPはLIP Timeoutの扱いとなる。一方、一定回数を超えていない場合(S33、No)、時間延長部3は、S30の処理を再度実行する。
尚、S28の判定結果がNoである場合、S27の処理へ戻り、S32の判定結果がNoである場合、S31の処理へ戻る。本ループ中は、LIPの完了、またはLIP監視時間超えの割り込み待ち状態となる。
尚、LIPが完了し該当PortのDiskが消失している場合、データバックアップ部4は、図1のS7で示したようにバックアップを行う。すなわち、データバックアップ部4は、LIPが完了した後に、識別情報が取得されなかったDiskに対するライトアクセスが発生し、そのライトアクセスが失敗した場合、ライトアクセスのデータを、当該DEとは別のDEに搭載されたDiskに保持させる。尚、本実施の形態では、データバックアップ部4は、基本DE30に搭載されたDiskにデータを保持させるものとするが、この段階でアクセス可能なDiskであればいずれのDiskであってもよい。例えば、拡張DE31のうちで、バックアップ専用の特定の領域が確保されている場合や、バックアップ専用の外部の磁気ディスク装置が用意されている場合は、失敗したライトアクセスのデータはそれらの記憶領域に退避されてもよい。また、これら退避領域を、ユーザが指定するようにしてもよい。この場合、退避されたデータを本来書き込まれるべき正規の領域へ書き戻す必要があるため、いずれに退避したかをデータバックアップ部4はメモリ901に保持させる。
本実施の形態によって、拡張DE(ラック単位)で停電が発生した場合、停電をより正確に検出しユーザーデータ及び装置内制御情報の消失を防止することが可能である。
以上、本実施の形態によれば、以下の付記で示す技術的思想が開示されている。
(付記1) 複数の記憶装置と、
前記記憶装置を少なくとも一つ搭載する、複数の搭載装置と、
前記搭載装置が複数カスケード接続されることで成る、少なくとも2つのループと接続するルータ装置と、
前記ルータ装置に接続されたループのうちの少なくとも一つのループで、記憶装置それぞれの識別情報を取得する初期化処理が実行された場合、該初期化処理が完了しているか否かを判定する初期化完了判定部と、
前記初期化完了判定部による判定結果が否である場合、初期化処理の実行時間が所定の時間を経過しているか否かを判定する初期化時間判定部と、
前記初期化時間判定部による判定結果が否であり、かつ、初期化処理が前記ルータ装置に接続されたループの複数で実行されている場合、前記所定の時間を延長する時間延長部と、
を備えるストレージシステム。
(付記2) 付記1に記載のストレージシステムにおいて、
前記初期化処理が完了した後に、識別情報が取得されなかった記憶装置に対するライトアクセスが発生し、該ライトアクセスが失敗した場合、前記ライトアクセスのデータを、前記識別情報が取得されなかった記憶装置を搭載した搭載装置とは別の搭載装置内の記憶装置に保持させるデータバックアップ部を備えることを特徴とするストレージシステム。
(付記3) 付記1に記載のストレージシステムにおいて、
前記時間延長部は、初期化処理が前記ルータ装置に接続されたループの複数で実行されている場合、前記搭載装置に電源断が発生したと判断し、該電源断の検知を回避するために前記所定の時間を延長することを特徴とするストレージシステム。
(付記4) 記憶装置を少なくとも一つ搭載する搭載装置が複数カスケード接続されることで成る、複数のループのうちの少なくとも一つのループで、記憶装置それぞれの識別情報を取得する初期化処理が実行された場合、該初期化処理が完了しているか否かを判定する初期化完了判定部と、
前記初期化完了判定部による判定結果が否である場合、初期化処理の実行時間が所定の時間を経過しているか否かを判定する初期化時間判定部と、
前記初期化時間判定部による判定結果が否であり、かつ、初期化処理が複数のループで実行されている場合、前記所定の時間を延長する時間延長部と、
を備えるストレージ管理装置。
(付記5) 付記4に記載のストレージ管理装置において、さらに、
前記初期化処理が完了した後に、識別情報が取得されなかった記憶装置に対するライトアクセスが発生し、該ライトアクセスが失敗した場合、前記ライトアクセスのデータを、前記識別情報が取得されなかった記憶装置を搭載した搭載装置とは別の搭載装置内の記憶装置に保持させるデータバックアップ部を備えることを特徴とするストレージ管理装置。
(付記6) 付記4に記載のストレージ管理装置において、
前記時間延長部は、初期化処理が複数のループで実行されている場合、前記搭載装置に電源断が発生したと判断し、該電源断の検知を回避するために前記所定の時間を延長することを特徴とするストレージ管理装置。
(付記7) 記憶装置を少なくとも一つ搭載する搭載装置が複数カスケード接続されることで成る、複数のループのうちの少なくとも一つのループで、記憶装置それぞれの識別情報を取得する初期化処理が実行された場合、該初期化処理が完了しているか否かを判定する初期化完了判定ステップと、
前記初期化完了判定ステップによる判定結果が否である場合、初期化処理の実行時間が所定の時間を経過しているか否かを判定する初期化時間判定ステップと、
前記初期化時間判定ステップによる判定結果が否であり、かつ、初期化処理が複数のループで実行されている場合、前記所定の時間を延長する時間延長ステップと、
を実行するストレージ管理方法。
(付記8) 付記7に記載のストレージ管理方法において、さらに、
前記初期化処理が完了した後に、識別情報が取得されなかった記憶装置に対するライトアクセスが発生し、該ライトアクセスが失敗した場合、前記ライトアクセスのデータを、前記識別情報が取得されなかった記憶装置を搭載した搭載装置とは別の搭載装置内の記憶装置に保持させるデータバックアップステップを実行することを特徴とするストレージ管理方法。
(付記9) 付記7に記載のストレージ管理方法において、
前記時間延長ステップは、初期化処理が複数のループで実行されている場合、前記搭載装置に電源断が発生したと判断し、該電源断の検知を回避するために前記所定の時間を延長することを特徴とするストレージ管理方法。
本実施の形態に係るストレージシステムのハードウェア構成および動作の一例を示す図である。 本実施の形態に係るCMの機能ブロックの一例を示す図である。 本実施の形態に係る、BRT内で複数のLIPが発生した際の時間延長部の動作の一例を示す図である。 本実施の形態に係る、LIP発生状況確認BITMAP、LIP延長BITMAP、および複数LIPが発生した際の各BITMAPの扱いを説明するための図である。 本実施の形態に係る、CMの動作を説明するためのフローチャートである。 既存のストレージシステムの構成を示す図である。 BRTの特徴について説明するための図である。 DEの構成について説明するための図である。 既存のストレージシステムの拡張DEで停電が発生した際の問題点を説明するための図である。
符号の説明
1 初期化完了判定部、2 初期化時間判定部、3 時間延長部、4 データバックアップ部、10 CM、20 BRT、30 基本DE、31 拡張DE、100 ストレージシステム。

Claims (6)

  1. 複数の記憶装置と、
    前記記憶装置を少なくとも一つ搭載する、複数の搭載装置と、
    前記搭載装置が複数カスケード接続されることで成る、少なくとも2つのループと接続するルータ装置と、
    前記ルータ装置に接続されたループのうちの少なくとも一つのループで、記憶装置それぞれの識別情報を取得する初期化処理が実行された場合、該初期化処理が完了しているか否かを判定する初期化完了判定部と、
    前記初期化完了判定部による判定結果が否である場合、初期化処理の実行時間が所定の時間を経過しているか否かを判定する初期化時間判定部と、
    前記初期化時間判定部による判定結果が否であり、かつ、初期化処理が前記ルータ装置に接続されたループの複数で実行されている場合、前記所定の時間を延長する時間延長部と、
    を備えるストレージシステム。
  2. 請求項1に記載のストレージシステムにおいて、
    前記初期化処理が完了した後に、識別情報が取得されなかった記憶装置に対するライトアクセスが発生し、該ライトアクセスが失敗した場合、前記ライトアクセスのデータを、前記識別情報が取得されなかった記憶装置を搭載した搭載装置とは別の搭載装置内の記憶装置に保持させるデータバックアップ部を備えることを特徴とするストレージシステム。
  3. 請求項1に記載のストレージシステムにおいて、
    前記時間延長部は、初期化処理が前記ルータ装置に接続されたループの複数で実行されている場合、前記搭載装置に電源断が発生したと判断し、該電源断の検知を回避するために前記所定の時間を延長することを特徴とするストレージシステム。
  4. 記憶装置を少なくとも一つ搭載する搭載装置が複数カスケード接続されることで成る、複数のループのうちの少なくとも一つのループで、記憶装置それぞれの識別情報を取得する初期化処理が実行された場合、該初期化処理が完了しているか否かを判定する初期化完了判定部と、
    前記初期化完了判定部による判定結果が否である場合、初期化処理の実行時間が所定の時間を経過しているか否かを判定する初期化時間判定部と、
    前記初期化時間判定部による判定結果が否であり、かつ、初期化処理が複数のループで実行されている場合、前記所定の時間を延長する時間延長部と、
    を備えるストレージ管理装置。
  5. 請求項4に記載のストレージ管理装置において、
    前記初期化処理が完了した後に、識別情報が取得されなかった記憶装置に対するライトアクセスが発生し、該ライトアクセスが失敗した場合、前記ライトアクセスのデータを、前記識別情報が取得されなかった記憶装置を搭載した搭載装置とは別の搭載装置内の記憶装置に保持させるデータバックアップ部を備えることを特徴とするストレージ管理装置。
  6. 記憶装置を少なくとも一つ搭載する搭載装置が複数カスケード接続されることで成る、複数のループのうちの少なくとも一つのループで、記憶装置それぞれの識別情報を取得する初期化処理が実行された場合、該初期化処理が完了しているか否かを判定する初期化完了判定ステップと、
    前記初期化完了判定ステップによる判定結果が否である場合、初期化処理の実行時間が所定の時間を経過しているか否かを判定する初期化時間判定ステップと、
    前記初期化時間判定ステップによる判定結果が否であり、かつ、初期化処理が複数のループで実行されている場合、前記所定の時間を延長する時間延長ステップと、
    を実行するストレージ管理方法。
JP2008318080A 2008-12-15 2008-12-15 ストレージシステム、ストレージ管理装置、ストレージ管理方法 Active JP4620152B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008318080A JP4620152B2 (ja) 2008-12-15 2008-12-15 ストレージシステム、ストレージ管理装置、ストレージ管理方法
US12/631,191 US8234472B2 (en) 2008-12-15 2009-12-04 Storage system, storage managing device and storage managing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008318080A JP4620152B2 (ja) 2008-12-15 2008-12-15 ストレージシステム、ストレージ管理装置、ストレージ管理方法

Publications (2)

Publication Number Publication Date
JP2010140399A JP2010140399A (ja) 2010-06-24
JP4620152B2 true JP4620152B2 (ja) 2011-01-26

Family

ID=42241962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008318080A Active JP4620152B2 (ja) 2008-12-15 2008-12-15 ストレージシステム、ストレージ管理装置、ストレージ管理方法

Country Status (2)

Country Link
US (1) US8234472B2 (ja)
JP (1) JP4620152B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9830964B2 (en) * 2012-09-10 2017-11-28 Texas Instruments Incorporated Non-volatile array wakeup and backup sequencing control
KR20150047158A (ko) * 2013-10-24 2015-05-04 삼성전자주식회사 스트레스 관리 시스템 및 그 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000209231A (ja) * 1998-11-12 2000-07-28 Ricoh Co Ltd デバイス初期化方法,ネットワ―ク情報の自動割り当て方法,ネットワ―ク自動初期化方法,サ―ビス自動発見方法およびネットワ―ク
JP2007299079A (ja) * 2006-04-28 2007-11-15 Fujitsu Ltd ストレージ装置及びその障害回復方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5544347A (en) * 1990-09-24 1996-08-06 Emc Corporation Data storage system controlled remote data mirroring with respectively maintained data indices
US5889935A (en) * 1996-05-28 1999-03-30 Emc Corporation Disaster control features for remote data mirroring
JP2001086146A (ja) 1999-09-16 2001-03-30 Hitachi Ltd Fc_alシステムの制御方法
JP2001216206A (ja) * 2000-02-01 2001-08-10 Nec Corp ループ状インターフェースの障害解析方法及び障害解析機能を有するシステム
US7433300B1 (en) * 2003-03-28 2008-10-07 Cisco Technology, Inc. Synchronization of configuration data in storage-area networks
US8006056B2 (en) * 2004-01-30 2011-08-23 Hewlett-Packard Development Company, L.P. Storage system including capability to move a virtual storage device group without moving data
JP4747909B2 (ja) 2006-03-30 2011-08-17 日本電気株式会社 ファイバチャネルスイッチにおける障害装置の切り離し方法
JP4982304B2 (ja) * 2007-09-04 2012-07-25 株式会社日立製作所 電源障害の発生を把握するストレージシステム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000209231A (ja) * 1998-11-12 2000-07-28 Ricoh Co Ltd デバイス初期化方法,ネットワ―ク情報の自動割り当て方法,ネットワ―ク自動初期化方法,サ―ビス自動発見方法およびネットワ―ク
JP2007299079A (ja) * 2006-04-28 2007-11-15 Fujitsu Ltd ストレージ装置及びその障害回復方法

Also Published As

Publication number Publication date
US20100153668A1 (en) 2010-06-17
JP2010140399A (ja) 2010-06-24
US8234472B2 (en) 2012-07-31

Similar Documents

Publication Publication Date Title
TWI734890B (zh) 提供資料複製於跨光纖非揮發性記憶乙太網路固態硬碟之系統及方法
US7370147B2 (en) Disk array device and control method therefor
EP2088508B1 (en) Storage subsystem and control method thereof
US8402189B2 (en) Information processing apparatus and data transfer method
US8321622B2 (en) Storage system with multiple controllers and multiple processing paths
US8443237B2 (en) Storage apparatus and method for controlling the same using loopback diagnosis to detect failure
US8706946B2 (en) Extender storage pool system
JP2007072571A (ja) 計算機システム及び管理計算機ならびにアクセスパス管理方法
US8392756B2 (en) Storage apparatus and method of detecting power failure in storage apparatus
JP2005301442A (ja) ストレージ装置
JP4473325B2 (ja) 管理装置、ストレージシステム、記憶装置管理方法
WO2017167106A1 (zh) 存储系统
JP4818843B2 (ja) リモートコピーを行うストレージシステム
WO2013046248A1 (en) Storage system and its control method
US20010016919A1 (en) Storage system
WO2019056948A1 (zh) 存储介质的管理方法、装置及可读存储介质
WO2010140189A1 (en) Storage system and control methods for the same
US8065556B2 (en) Apparatus and method to manage redundant non-volatile storage backup in a multi-cluster data storage system
JP4516993B2 (ja) 仮想テープシステム
CN111240903A (zh) 数据恢复方法及相关设备
JP4620152B2 (ja) ストレージシステム、ストレージ管理装置、ストレージ管理方法
JP2007334764A (ja) Nasシステムおよびnasシステムの情報処理方法
US7486083B2 (en) Managing system stability
JP2009245076A (ja) コンピュータシステム
JP6194593B2 (ja) 冗長化システム、冗長化方法、記憶装置、及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101008

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101026

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101027

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131105

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4620152

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150