JP2005326935A - 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法 - Google Patents

仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法 Download PDF

Info

Publication number
JP2005326935A
JP2005326935A JP2004142179A JP2004142179A JP2005326935A JP 2005326935 A JP2005326935 A JP 2005326935A JP 2004142179 A JP2004142179 A JP 2004142179A JP 2004142179 A JP2004142179 A JP 2004142179A JP 2005326935 A JP2005326935 A JP 2005326935A
Authority
JP
Japan
Prior art keywords
storage
migration
external device
data
external
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004142179A
Other languages
English (en)
Inventor
Yasutomo Yamamoto
康友 山本
Kentetsu Eguchi
賢哲 江口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004142179A priority Critical patent/JP2005326935A/ja
Priority to US10/878,440 priority patent/US7337353B2/en
Priority to EP04018398A priority patent/EP1596303A3/en
Publication of JP2005326935A publication Critical patent/JP2005326935A/ja
Priority to US12/003,971 priority patent/US7603583B2/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0617Improving the reliability of storage systems in relation to availability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0635Configuration or reconfiguration of storage systems by changing the path, e.g. traffic rerouting, path reconfiguration

Abstract

【課題】
第一のストレージを接続し、第一のストレージ内デバイスを自装置内のデバイスとして仮想化する手段を有する第二のストレージにおいて、システム可用性を高める。
【解決手段】
仮想化ストレージもしくはストレージ管理サーバで、被仮想化ストレージの障害を検知した場合、管理サーバで当該障害による波及範囲を調べ、対処が必要なデバイスを特定し、当該デバイスの性能や信頼性などの属性に適応する移行先デバイスを決定し、仮想化ストレージに対してデバイス移行を指示する。仮想化ストレージでは、指示された被仮想化ストレージ内デバイスを、管理サーバより指定される自装置内デバイスもしくは別の被仮想化ストレージ内デバイスへ移行する。
【選択図】 図1

Description

本発明は、計算機システムにおいて計算機によって使用されるデータを格納するストレージを備えるストレージシステムに関する。特に、一台以上のストレージを接続し、接続したストレージ内のデバイスを、自装置のデバイスとして仮想化する手段を有するストレージを備えるストレージシステムにおける制御技術に関する。
近年、計算機で取り扱われるデータ量は飛躍的に増大し、これに応じてデータを格納するストレージの大容量化が進んでいる。その結果、システム管理に占めるストレージ管理コストが増加し、管理コストの低減がシステム運用上、重要課題となっている。
ストレージの容量を増やすため、計算機(以下、ホストと呼ぶ。)とストレージとを備えた既存の計算機システムに、新しいストレージを導入することがある。導入形態には、新しく大容量のストレージを導入し、古いストレージと置き換える方法と、古いストレージを利用しながら新しいストレージを併用する方法との2つの形態が考えられる。
新しいストレージに置き換える導入形態の場合、古いストレージ内の全データを、新しいストレージに移行する必要がある。しかも、通常は、ホストからの入出力を継続しながら、データを移行する必要がある。
ホストからの入出力を継続しながら、古いストレージのデータを新しいストレージへ移行する技術は、例えば、特許文献1に開示されている。
ここでは、新しいストレージに割り当てた第2デバイスに古いストレージの第1デバイスのデータを移行するとともに、ホストからのアクセス先を既存の第1デバイスから新たな第2デバイスに変更し、ホストからの既存の第1デバイスへの入出力要求を、新しいストレージで受け付ける。
移行中のリード要求に対しては、移行が完了した部分は新たな第2デバイスから読み上げ、移行が未完了な部分は既存の第1デバイスから読み上げる。ライト要求に対しては、第1デバイスと第2デバイスとに二重書きする。
古いストレージと新しいストレージとを併用する導入形態には、ホストに直接新旧両ストレージを接続する形態があるが、ホスト側での制御が複雑となる。
一方、例えば、特許文献2には、ホストから第二のストレージを介して第一のストレージのディスクにアクセスする方法が開示されている。
第一のストレージを第二のストレージへ接続し、第一のストレージのディスクに第二のストレージのディスクアドレスを割り当てて、ホストが第一のストレージのディスクも第二のストレージのディスク制御装置に接続されているディスクとして認識するよう構成されている。
第二のストレージは、ホストからの入出力要求を受信すると、アクセス対象のディスクが第一のストレージのディスクおよび第二のストレージ内部のディスクのいずれに対応しているかを判定し、判定結果に従ったアクセス先に入出力要求を振り分ける。
特開平10−508967号公報 特開平10−283272号公報
特許文献2に開示されている技術、すなわち、自身に接続するストレージのディスクを、ホストに自身のディスクとして認識させる技術、を応用することにより、性能、信頼性、価格などの属性の異なる複数のストレージを統合したストレージシステムを構築することができる。
例えば、計算機システムに新規ストレージを導入する際、新規導入する新型のストレージであって、上述の特許文献2に開示されている機能を有するストレージをホストに直結し、ユーザが既に所有している旧型のストレージをその新型のストレージに接続する構成とすれば、ユーザの既存資産を有効に活用することができ、システム導入コストを低減することができる。
また、計算機システムを構築する際、そのストレージシステムを、低コスト低機能なストレージ複数台が上述の特許文献2に開示されている機能を有する高コスト高機能高信頼なストレージに接続される構成とすれば、データの鮮度や価値に応じた最適なデータ配置が可能な記憶階層システムを実現することができる。このようなストレージシステムでは、低コスト低機能なストレージに、日々の業務で発生する取引情報やメールログなど、アクセス頻度は少ないが、監査等のために長期保存が義務付けられている大量のデータを、保存でき、ストレージ資源を有効に活用できる。
しかし、上記ストレージシステムでは、ユーザの既存資産である旧型のストレージや、大量のデータを低コストで保持することを目的とした低コストのストレージが混在する。比較的信頼性の低いそれらのストレージがストレージシステムおよび計算機システム全体の信頼性を低下させる可能性が高い。
また、ストレージシステムを複数のストレージを接続する構成とする場合、その接続は、ネットワークを介したものとなることがある。この場合、ネットワーク障害によるアクセスパス閉塞が発生し得る。
第一のストレージを接続し、第一のストレージ内のデバイスを自装置内のデバイスとして仮想化する手段を有する第二のストレージを備えるストレージシステムは、上記のように、性能、信頼性、価格などの属性の異なる複数のストレージを統合して構成されることが多い。従って、このようなストレージシステムにおいては、比較的信頼性の低いストレージの存在、および、ストレージ間を接続するネットワークの存在により、ストレージシステムおよびそのストレージシステムを備える計算機システムの可用性が上がらないことが問題となっている。
上記事情を鑑み、本発明は、第一のストレージを接続し、第一のストレージ内デバイスを自装置内のデバイスとして仮想化する手段を有する第二のストレージを有する計算機システムにおいて、計算機システムの可用性を高めることを目的とする。
上記目的を達成するため、本発明の計算機システムは、第一のストレージ、および、前記第一のストレージが提供する論理デバイス(以後、外部デバイスと呼ぶ。)と自身の物理デバイスとをホスト計算機に論理デバイスとして提供する第二のストレージを管理する管理サーバを備える。その管理サーバは、前記第二のストレージから受信した、前記外部デバイスの障害の予兆情報に基づいて、前記障害の影響範囲を移行元として特定する移行元決定手段と、前記移行元のデータ容量と予め定められた性能および信頼性レベルの評価とに基づいて、自身が管理する前記第一のストレージおよび前記第二のストレージの範囲で移行先を決定し、前記第二のストレージに前記移行元のデータを前記移行先に移行するよう指示するデータ移行指示手段と、を備えることを特徴とする。
本発明によれば、第一のストレージを接続し、第一のストレージ内デバイスを自装置内のデバイスとして仮想化する手段を有する第二のストレージを備える計算機システムにおいて、計算機システム可用性を高めることができる。
本発明の実施形態として、第1および第2の実施形態を説明する。
第1の実施形態の概略は以下のとおりである。
第1の実施形態の前提となるシステムは、外部ストレージ接続機能を有する第二のストレージに、一台以上の第一のストレージを外部ストレージとして接続してなるストレージシステムである。
ここで、上記第二のストレージが有する外部ストレージ接続機能とは、ホストからのアクセス要求を受信した第二のストレージが、そのアクセス要求の入出力対象のデバイスが第一のストレージに存在するデバイスか、第二のストレージ自身のデバイスか判断し、第一のストレージのデバイスである場合は、アクセス要求を第一のストレージに送信し、自身のデバイスである場合は、そのデバイスにアクセスする機能である。
第1の実施形態は、第一のストレージ内の、障害が発生する予兆のあるデバイスに格納されているデータを、その予兆を発見した時点で、他のデバイスに移行することにより、データ保全を図るものである。
ストレージを管理するために設けられたサーバ(以下、管理サーバと呼ぶ。)が、第一のストレージからの異常報告や、第二のストレージからの第一のストレージの異常を通報する警告に基づいて、第一のストレージに障害の予兆が発生したことを検知する。警告は、第一のストレージに対するアクセス時の応答などを監視することにより検出された第一のストレージの障害の兆候に基づいて、第二のストレージから発せられるものである。
管理サーバは、障害の予兆の検知後、障害の予兆のある第一のストレージ内で、障害が発生した場合に影響を受けるデバイスを特定し、移行対象のデバイスを決定するとともに、移行対象デバイスの属性に基づいて、移行先のデバイスを選定する。そして、第二のストレージに、データ移行を指示する。
第2の実施形態の概略は以下のとおりである。
第2の実施形態のストレージシステムは、第1の実施形態と同様に、一台以上の第一のストレージを、外部ストレージ接続機能を有する第二のストレージに接続して構成される。第2の実施形態では、第一のストレージは、複数のデバイスを用いて、RAID(Redundant Array of Independent Disk)を構成し、第二のストレージのディスクデバイスとしてホストへ提供する。
第2の実施形態では、第一の実施形態と同様に、障害発生前にデータ保全を図る機能に加え、実際に障害が発生したデバイスに格納されていたデータを回復し、他のデバイスに移行する。
第1の実施形態と同様に、管理サーバは、第一のストレージの異常報告を受信すると、その異常の波及範囲を特定し、移行元、移行先を決定してデータ移行を第二のストレージに指示する。さらに、管理サーバは、実際に障害が発生した報告を受けると、RAIDの特性を利用して障害が発生したデバイスに格納されているデータを回復し、回復したデータを、移行先として定めたデバイスに格納するよう、第二のストレージに指示する。
<第1の実施形態>
図1から図12を参照して、第1の実施形態を説明する。
図1は本発明の第1の実施形態が適用される計算機システムのハードウェア構成の一例を示す図である。
計算機システムは、1台以上のホスト計算機(以下、ホストと呼ぶ。)100と、管理サーバ110と、ファイバチャネルスイッチ120と、ストレージ130と、管理端末140と、外部ストレージ150aおよび150b(総称して外部ストレージ150と呼ぶ)とを備える。
ホスト100、ストレージ130および外部ストレージ150は各々ポート107,131,151を介してファイバチャネルスイッチ120のポート121に接続される。また、ホスト100、ストレージ130、外部ストレージ150、ファイバチャネルスイッチ120は、各々インタフェース制御部(I/F)106、138,157,123からIPネットワーク175を介して管理サーバ110に接続され、管理サーバ110で動作する図示しないストレージ管理ソフトウェアによって統合管理される。
なお、本実施形態では、ストレージ130は管理端末140を介して管理サーバ110に接続する。しかし、ストレージ130はIPネットワーク175に直接接続される構成であっても良い。
ホスト100は、アプリケーションを実行し、ストレージ130にアクセスする計算機で、CPU101とメモリ102と記憶装置103と入力装置104と出力装置105とインタフェース制御部106とポート107とを備える。
CPU101は、ディスクや光磁気ディスクなどの記憶装置103に格納されたオペレーティングシステムやアプリケーションプログラムなどのソフトウェアをメモリ102に読み上げ、実行することにより、所定の機能を達成する。
入出力装置104は、キーボードやマウスなどであり、ホスト管理者からの入力を受け付ける。出力装置105はディスプレイ等であり、CPU101に指示された情報を出力する。インタフェース制御部106はIPネットワーク175と接続するためのものであり、ポート107はファイバチャネルスイッチ120と接続するためのものである。
管理サーバ110は、本実施形態の計算機システム全体の運用・保守管理を行う計算機で、CPU111とメモリ112と記憶装置113と入力装置114と出力装置115とを備える計算機である。
入出力装置114は、キーボードやマウスなどであり、ストレージ管理者からの入力を受け付ける。出力装置115はディスプレイ等であり、CPU111に指示された情報を出力する。インタフェース制御部116はIPネットワーク175と接続するためのものである。
CPU111は、ディスクや光磁気ディスク等の記憶装置113に格納されたストレージ管理ソフトウェアなどをメモリ112に読み上げ、実行することにより、所定の機能を達成する。
管理サーバ110は、ストレージ管理ソフトウェアに従って、インタフェース制御部116およびIPネットワーク175を介して、計算機システム内の各機器から構成情報、リソース利用率、性能監視情報、障害ログなどを収集し、収集した情報を、出力装置115に出力してストレージ管理者に提示する。
また、管理サーバ110は、入力装置114を介してストレージ管理者から受信した運用・保守指示を、インタフェース制御部116を介して各機器に送信する。
ストレージ130は、外部ストレージ接続機能を備えるストレージであり、1つ以上のポート131と、1つ以上の制御プロセッサ132と、各々制御プロセッサ132に接続される1つ以上のメモリ133と、1つ以上のディスクキャッシュ134と、1つ以上の制御メモリ135と、1つ以上のポート136と、各々ポート136に接続される1台以上のディスク装置137と、インタフェース制御部138とを備える。
制御プロセッサ132は、ポート131から受信した入出力要求について、アクセス対象デバイスを特定し、特定されたデバイスに対応するディスク装置137または外部ストレージ150内のデバイスへの入出力要求を処理する。
アクセス対象のデバイスは、制御プロセッサ132が受信した入出力要求に含まれるポートIDおよびLUN(Logical Unit Number)から特定される。
本実施形態では、ポート131として、SCSI(Small Computer System Interface)を上位プロトコルとしたファイバチャネルインタフェースに対応したポートを想定している。しかし、SCSIを上位プロトコルとしたIPネットワークインタフェースなど、他のストレージ接続用ネットワークインタフェースに対応したポートであってもよい。
入出力要求に含まれるポートIDおよびLUNからのアクセス対象デバイスの特定は以下のようになされる。
本実施形態のストレージ130は、次のようなデバイス階層を有する。
ディスク装置137複数台によりディスクアレイが構成される。制御プロセッサ132は、このディスクアレイを物理デバイスとして管理する。さらに、制御プロセッサ132は、ストレージ130内の物理デバイスに、論理デバイスを割り当てる(即ち、制御プロセッサ132は物理デバイスと論理デバイスとを対応づける。)。
ここで、論理デバイスとは、各ポート131に割り当てられたLUNに対応付けられ、ストレージ130のデバイスとしてホスト100に提供されるデバイスである。論理デバイスはストレージ130内で管理され、その番号はストレージ130毎に独立に管理される。ホスト100が認識するのはストレージ130の論理デバイスである。ホスト100は、論理デバイスに対応するポート131のLUNを用いて、ストレージ130に格納されているデータにアクセスする。
本実施形態のストレージ130は、さらに、外部ストレージ150のデバイスを自装置のデバイスとして仮想化する機能を有する。外部ストレージ150がストレージ130に提供する論理デバイス(以後、外部デバイスと呼ぶ。)は、ストレージ130のデバイスとして仮想化され、ホスト100に提供される。ストレージ130内で、外部デバイスは、ストレージ130の物理デバイスと同様に、その1つ以上をストレージ130の論理デバイスに対応づけられ、管理される。
以上のデバイス階層を実現するため、制御プロセッサ132は、論理デバイス、物理デバイス、ディスク装置137、外部デバイス、外部ストレージ150の物理デバイス間それぞれの対応関係を管理する。本実施形態では、これらの対応関係は、制御メモリ135に保持される。
制御プロセッサ132は、管理している対応関係に基づいて、論理デバイスに対するアクセス要求を、ディスク装置137内の自装置のデバイスまたは外部ストレージ装置の論理デバイスへのアクセス要求に変換する。
なお、本実施形態におけるストレージ130は、複数のディスク装置137をまとめて1つまたは複数の物理デバイスを定義し(即ち複数のディスク装置137をまとめて1つ又は複数の物理デバイスと対応付け)、1つの物理デバイスに1つの論理デバイスを割り当てて、ホスト100に提供する。しかし、個々のディスク装置137を1つの物理デバイスおよび1つの論理デバイスとしてホスト100に提供してもよい。
制御プロセッサ132は、デバイスに対する入出力処理以外にも、データ複製やデータ再配置など、デバイス間のデータ連携を実現する各種処理を実行する。
さらに、制御プロセッサ132は、インタフェース制御部138を介して接続される管理端末140に、ストレージ管理者へ提示する構成情報を送信し、管理者から管理端末140に入力された保守・運用指示を管理端末140から受信し、受信した指示に従い、ストレージ130の構成変更などを行う。
以上の制御プロセッサ132の機能は、メモリ133に格納されたプログラムを実行することにより実現される。
ディスクキャッシュ134は、ホスト100からのアクセス要求に対する処理速度を高めるため、ディスク装置137から頻繁に読み出されるデータを予め格納するとともに、ホスト100から受信したライトデータを一時的に格納する。
ディスクキャッシュ134を用いたライトアフタを行う場合、ディスクキャッシュ134に格納されているライトデータがディスク装置137に書き込まれる前に消失することを防止するために、ディスクキャッシュ134をバッテリバックアップなどにより不揮発メモリとする、または、媒体障害への耐性向上のため二重化するなど、ディスクキャッシュ134の可用性を向上させておくことが望ましい。
ライトアフタとは、ホスト100から受信したライトデータがディスクキャッシュ134に格納された後、ディスク装置137に実際に書き込まれる前にホスト100に対しライト要求に対する応答を返す処理である。
制御メモリ135は、前述のデバイス階層を実現するための各デバイス間の対応関係および各デバイスの属性、それらを管理するための制御情報、ディスクキャッシュ134上に保持したディスク反映済み又は未反映データを管理するための制御情報などを格納する。制御メモリ135に格納されている制御情報が消失すると、ホスト100からディスク装置137に格納されているデータへアクセスできなくなるため、制御メモリ135は、バッテリバックアップなどにより不揮発メモリとしたり、媒体障害への耐性向上のため二重化するなどし、高可用化のための構成を有することが望ましい。
ストレージ130内の各構成は、図1に示すとおり、内部結合網で接続される。この内部結合網により、各構成間でのデータ、制御情報、及び構成情報の送受信を行い、制御プロセッサ132同士が、ストレージ130の構成情報を共有、管理することができる。なお、可用性向上の観点から内部結合網も多重化されていることが望ましい。
管理端末140は、CPU142、メモリ143、記憶装置144、ストレージ130に接続されるインタフェース制御部141、IPネットワーク175に接続されるインタフェース制御部147、ストレージ管理者からの入力を受け付ける入力装置145、および、ストレージ管理者にストレージ130の構成情報や管理情報を出力するディスプレイ等の出力装置146を備える。
CPU142は、記憶装置144に格納されているストレージ管理プログラムをメモリ143に読み出して、実行することにより、構成情報の参照、構成変更の指示、特定機能の動作指示などを行う。
管理端末140は、ストレージ130の保守運用に関して、ストレージ管理者もしくは管理サーバ110とストレージ130との間のインタフェースとなる。なお、管理端末140を省略し、ストレージ130を直接管理サーバ110へ接続し、ストレージ130を管理サーバ110で動作する管理ソフトウェアを用いて管理してもよい。
次に、本実施形態のストレージ130および管理サーバ110のソフトウェア構成について説明する。
図2(a)は、ストレージ130の制御メモリ135およびメモリ133に格納される制御情報およびストレージ制御処理のためのプログラムの一例を示したソフトウェア構成図である。
制御メモリ135には、論理デバイス管理情報201と物理デバイス管理情報202と外部デバイス管理情報203とLUパス管理情報204とキャッシュ管理情報205とが格納される。これらの制御情報は、情報消失を防ぐため本実施形態では制御メモリ135に格納されている。
制御メモリ135に格納される制御情報は、制御プロセッサ132から参照・更新可能である。しかし、制御プロセッサ132から制御メモリ135へのアクセスは、内部結合網を介するものとなる。本実施形態では、処理性能向上のため、各制御プロセッサ132で実行される処理に必要な制御情報の複製をデバイス管理情報の複製211としてメモリ133に保持する。デバイス管理情報の複製211として保持されるのは、論理デバイス管理情報201と物理デバイス管理情報202と外部デバイス管理情報203とLUパス管理情報204である。
メモリ133には、デバイス管理情報の複製211に加え、入出力要求処理プログラム221と、外部デバイス監視処理プログラム222と、外部デバイス移行処理プログラム223とが格納される。
ストレージ130のデバイス管理情報は、制御端末140や管理サーバ110にも送信され、保持される。
管理サーバ110もしくは管理端末140から、ストレージ管理ソフトウェアに従って、もしくはストレージ管理者からの指示を受けて、ストレージ130の構成が変更された場合、または、ストレージ130の構成が障害・自動交替などによって変化した場合、制御プロセッサ132のうちの一つが制御メモリ135内の該当するデバイス管理情報を更新する。
そして、デバイス管理情報を更新した制御プロセッサ132は、当該デバイス管理情報を更新した旨を、他の制御プロセッサ132、管理端末140、管理サーバ110に通知する。
図2(b)は、管理サーバ110のメモリ112に格納される制御情報およびストレージ制御処理のためのプログラムの一例を示したソフトウェア構成図である。
メモリ112には、ストレージ130や外部ストレージ150から収集したデバイス管理情報の複製231、ストレージ130および外部ストレージ150の属性を示すストレージ管理情報232が格納される。これらの情報はデータ消失を避けるために、管理サーバ110に搭載した記憶装置113に保持してもよい。
さらにメモリ112には、ストレージ監視処理プログラム241、外部デバイス移行指示処理プログラム242が格納される。
以下、それぞれの制御情報について説明する。
図3に論理デバイス管理情報201の一例を示す。
論理デバイス管理情報201には、各論理デバイスの構成情報が格納される。本実施形態では、論理デバイス管理情報201には、論理デバイスごとに、論理デバイス番号31、サイズ32、対応物理/外部デバイス番号33、デバイス状態34、ポート番号/ターゲットID/LUN35、接続ホスト名36、移行中物理/外部デバイス番号37、データ移行進捗ポインタ38、データ移行中フラグ39からなる情報組が保持される。
論理デバイス番号31には、論理デバイスを識別するために制御プロセッサ132が各論理デバイスに一意に割り当てた番号が格納される。
サイズ32には、論理デバイス番号31により特定される論理デバイスの容量が格納される。
対応物理/外部デバイス番号33には、本論理デバイスに対応づけられている物理デバイス又は外部デバイスの番号が格納される。本実施形態では、それぞれの管理情報である物理デバイス管理情報202又は外部デバイス管理情報203に格納される、物理デバイス番号51または外部デバイス番号61が格納される。これらの詳細は後述する。
本実施形態では、論理デバイスと物理/外部デバイスとは1対1対応とする。このため、対応物理/外部デバイス番号33には、対応する物理デバイスまたは外部デバイスの番号が1つ格納される。複数の物理/外部デバイスを結合して一つの論理デバイスを形成する場合には、論理デバイス管理情報201に各論理デバイスが対応する物理/外部デバイスの番号リストとその数を格納するエントリが必要となる。また、論理デバイスが未定義の場合、対応物理/外部デバイス番号33には無効値が設定される。
デバイス状態34には、論理デバイスの状態を示す情報が設定される。設定される状態には、「オンライン」、「オフライン」、「未実装」、「障害オフライン」がある。「オンライン」は、その論理デバイスが正常に稼動し、ホスト100からアクセスできる状態であることを示す。「オフライン」は、その論理デバイスは定義され、正常に稼動しているが、LUパスが未定義であるなどの理由で、ホスト100からはアクセスできない状態にあることを示す。「未実装」は、その論理デバイスが定義されていないためホスト100からアクセスできない状態にあることを示す。「障害オフライン」は、その論理デバイスに障害が発生してホスト100からアクセスできないことを示す。
デバイス状態34の初期値は「未実装」であり、論理デバイスが定義されると「オフライン」に変更され、更にLUパスが定義されると「オンライン」に変更される。
ポート番号/ターゲットID/LUN35には、ポート番号と、ターゲットIDと、LUNとが格納される。
エントリ35に格納されるポート番号は、その論理デバイスがLUN定義されているポート131の識別情報である。ポートの識別情報とは、各ポート131に割り振られているストレージ130内で一意に定まる番号である。エントリ35には、その論理デバイスが複数のポート131のうちどのポートに接続されているかを表す情報、すなわち、その論理デバイスにアクセスするために用いられるポート131の番号が設定される。
エントリ35に格納されるターゲットIDとLUNは、その論理デバイスを識別するための識別子である。本実施形態においては、論理デバイスを識別するための識別子として、SCSI上でホスト100からデバイスをアクセスする場合に用いられるSCSI−ID、とLUNとが用いられるため、これらが格納される。
エントリ35は、その論理デバイスに対するLUパス定義が実行された際に、上記各値が設定される。
接続ホスト名36は、その論理デバイスへのアクセスが許可されているホスト100を識別するホスト名である。ホスト名としては、ホスト100のポート107に付与されたWWN(World Wide Name)など、ホスト100もしくはポート107を一意に識別可能な値であれば何を用いてもよい。エントリ36は、ストレージ管理者によって論理デバイス定義時に設定される。
移行中物理/外部デバイス番号37には、データ移行中(後述のデータ移行中フラグ39がOnであるとき)、その論理デバイスが割り当てられた物理/外部デバイスの移行先の物理/外部デバイス番号が保持される。
データ移行進捗ポインタ38は、データ移行処理が未完了な領域の先頭アドレスを示す情報であり、データ移行の進行に伴い、更新される。
データ移行中フラグ39は、初期値がOffで、On設定されるとその論理デバイスが割り当てられた物理/外部デバイスを別の物理/外部デバイスへデータ移行中であることを示す。データ移行中フラグ39がOnの場合のみ、移行中物理/外部デバイス番号37とデータ移行中進捗ポインタ38とは有効となる。
図4にLUパス管理情報204の一例を示す。LUパス管理情報204は、ストレージ130内の各ポート131について、各ポートに定義されている有効なLUN分の情報を保持する。
ターゲットID/LUN41には、ポート131に定義された(割り当てられた)LUNが格納される。対応論理デバイス番号42には、そのLUNが割り当てられている論理デバイスの番号が格納される。接続ホスト名43には、そのポート131に定義されているLUNに対してアクセスを許可されているホスト100を示す情報が格納される。ホスト100を示す情報としては、例えば、ホスト100のポート107に付与されているWWNが用いられる。
一つの論理デバイスに対して複数のポート131のLUNが定義され(割り当てられ)、複数のポート131から当該論理デバイスにアクセスできる場合がある。この場合は、当該複数のポート131のLUN各々に関するLUパス管理情報204の接続ホスト名43の和集合が、当該論理デバイスに関する論理デバイス管理情報201の接続ホスト名36に保持される。
図5に、ディスク装置137により構成される物理デバイスを管理するための物理デバイス管理情報202の一例を示す。
各ストレージ130は、自装置内に存在する物理デバイス毎に、物理デバイス管理情報202として、物理デバイス番号51、サイズ52、対応論理デバイス番号53、デバイス状態54、RAID構成(RAIDレベル、データ/パリティ数)55、ストライプサイズ56、ディスク番号リスト57、ディスク内開始オフセット58、ディスク内サイズ59とからなる情報組を保持する。
物理デバイス番号51には、物理デバイスを識別するための識別番号が登録される。サイズ52には、物理デバイス番号51により特定される物理デバイスの容量が格納される。対応論理デバイス番号53には、当該物理デバイスに対応付けられている論理デバイス番号が格納される。対応論理デバイス番号53は、その論理デバイスが定義されることを契機に格納される。その物理デバイスが論理デバイスへ割り当てられていない場合、対応論理デバイス番号53には無効値が設定される。
デバイス状態54には、その物理デバイスの状態を示す情報が設定される。設定される状態には、「オンライン」、「オフライン」、「未実装」、「障害オフライン」がある。「オンライン」は、その物理デバイスが正常に稼動し、論理デバイスに割り当てられている状態であることを示す。「オフライン」は、その物理デバイスは定義され、正常に稼動しているが、論理デバイスに未割り当てであることを示す。「未実装」は、その物理デバイスがディスク装置137上に定義されていない状態にあることを示す。「障害オフライン」は、その物理デバイスに障害が発生して論理デバイスに割り当てられないことを示す。
なお、本実施形態では、簡単のため、物理デバイスは製品の工場出荷時にあらかじめディスク装置137上に作成されているものとする。このため、利用可能な物理デバイスについてはデバイス状態53の初期値は「オフライン」状態、その他は「未実装」状態となる。そして、当該物理デバイスに論理デバイスが定義された契機で「オンライン」状態に変更される。
RAID構成55には、その物理デバイスが割り当てられたディスク装置137のRAIDレベル、データディスクとパリティディスク数などRAID構成に関連する情報が保持される。ストライプサイズ56には、RAIDにおけるデータ分割単位(ストライプ)長が保持される。ディスク番号リスト57には、その物理デバイスが割り当てられたRAIDを構成する複数のディスク装置137各々の識別番号が保持される。このディスク装置137の識別番号は、ストレージ130内で各ディスク装置137を一意に識別するために付与された値である。
ディスク内開始オフセット58とディスク内サイズ59とには、その物理デバイスが各ディスク装置137内のどの領域に割り当てられているかを示す情報が格納される。本実施例では簡単のため、全物理デバイスについて、RAIDを構成する各ディスク装置137内のオフセットとサイズとを統一させる。
図6に、ストレージ130に接続された外部ストレージ150がストレージ130に提供する外部デバイスを管理するための、外部デバイス管理情報203の一例を示す。
ストレージ130は、外部デバイス毎に、外部デバイス管理情報203として、外部デバイス番号61、サイズ62、対応論理デバイス番号63、デバイス状態64、ストレージ識別情報65、外部ストレージ内デバイス番号66、イニシエータポート番号リスト67、ターゲットポートID/ターゲットID/LUNリスト68からなる情報組を保持する。
外部デバイス番号61には、制御プロセッサ132によりその外部デバイスに対して、ストレージ130内で一意に割り当てられた値が格納される。サイズ62には、外部デバイス番号61により特定される外部デバイスの容量が格納される。対応論理デバイス番号63には、その外部デバイスが対応付けられているストレージ130内の論理デバイスの番号が登録される。
デバイス状態64には、その外部デバイスの状態を示す情報が設定される。設定される各状態およびその意味は、物理デバイス管理情報202のデバイス状態54と同じである。ストレージ130は初期状態では外部ストレージ150を接続していないため、デバイス状態64の初期値は「未実装」となる。
ストレージ識別情報65には、その外部デバイスを搭載する外部ストレージ150の識別情報を保持する。識別情報としては、外部ストレージ150が一意に定まる値であればよい。例えば、ストレージ150のベンダ識別情報と各ベンダが一意に割り振る製造シリアル番号との組み合わせ、などが考えられる。
外部ストレージ内デバイス番号66には、その外部デバイスが搭載されている外部ストレージ150が、その外部デバイスに割り振った識別番号が格納される。本実施形態では、外部デバイスは外部ストレージ150の論理デバイスであるため、外部ストレージ内デバイス番号66には、外部ストレージ150が自身の定義した論理デバイスを識別するために付与した論理デバイス番号が格納される。
イニシエータポート番号リスト67には、その外部デバイスへアクセス可能なストレージ130のポート131の識別番号が登録される。複数のポート131からその外部デバイスへアクセスできる場合には、アクセス可能なポート識別番号が全て登録される。
ターゲットポートID/ターゲットID/LUNリスト68には、その外部デバイスが外部ストレージ150の1つ以上のポート151にLUN定義されている場合、それらのポート151のポートIDおよびその外部デバイスが割り当てられたターゲットID/LUNが1つ又は複数個保持される。ストレージ装置130の制御プロセッサ132が、外部デバイスにアクセスする場合(制御プロセッサがポート131から外部デバイスに対する入出力要求を送信する場合)は、その外部デバイスが属する外部ストレージ150によってその外部デバイスに割り当てられたターゲットID及びLUNが、その外部デバイスを識別するための情報として用いられる。
本実施形態では、ストレージ130は上記の4つのデバイス管理情報(論理デバイス管理情報201、物理デバイス管理情報202、外部デバイス管理情報203、LUパス管理情報204)を用いて、デバイスを管理する。
ストレージ130は、工場出荷時に各ディスク装置137に物理デバイスが定義されているものとする。また、ユーザ又はストレージ管理者はストレージ130導入時にストレージ130に接続した外部ストレージ150の論理デバイスを外部デバイスとして定義し、物理デバイスおよび外部デバイス上に論理デバイスを定義し、定義した論理デバイスについて各ポート131にLUNを定義する。
図7に、管理サーバ110が有するストレージ管理情報232の一例を示す。
ストレージ管理情報232には、管理サーバ110が管理するストレージ130および外部ストレージ150を管理するための情報が保持される。以下、ストレージ管理情報232の説明において、特にストレージ130および外部ストレージ150を区別する必要が無い場合は、ストレージで代表する。また、ストレージの構成要素であるディスク装置137、156、制御プロセッサ132、152についても、同様に、ディスク装置、制御プロセッサで代表する。
ストレージ管理情報232には、ストレージ毎に、ストレージ番号71、ストレージネーム72、ポートネームリスト73、性能/信頼性レベル74、総容量75、空き容量76からなる情報組が保持される。
ストレージ番号71には、管理サーバ110が各ストレージに割り当てた、システム内で一意に定まる番号が格納される。
ストレージネーム72には、各ストレージを特定するための識別子を示す情報が登録される。識別子としては、ファイバチャネルのプラットホームWWN、または、各ストレージが有するベンダ識別子と製品番号との組み合せなどが用いられる。
ポートネームリスト73には、各ストレージが有するポートに付加されたWWNが格納される。ホスト100は、ポートネームリスト73に格納された各ストレージ130のポートWWNを用いて、各ストレージ130内のデバイスにアクセスする際に利用するポートを特定する。
性能/信頼性レベル74には、各ストレージの性能および信頼性を、計算機システムで統一された基準により評価した値が保持される。
性能を評価する指標には、各ストレージに搭載されたディスク装置のシーク速度やディスク回転速度などの性能値、ディスク装置の記憶容量、各ストレージ内で構成されるRAIDレベル、制御プロセッサとディスク装置間の接続線の通信帯域、ポートの通信帯域、通信線の数、ディスクキャッシュの記憶容量、ストレージ全体で見た性能公称値などがある。
ストレージによっては、異なる属性を持つディスク装置や、異なる属性を持つRAID構成が内部に混在し、1つのストレージ内で、複数の性能レベルを有する場合がある。しかし、本実施形態では、簡単のため、性能レベルは、ストレージ毎に一のレベルとし、ストレージ単位で管理できるものとする。
また、信頼性を評価する指標には、各ストレージが有するディスク装置、制御プロセッサ等の構成要素の冗長性、各ストレージが利用するRAIDレベル、利用可能な交替パス数等の、製品仕様上の各種構成条件がある。また、各ストレージが有する機能、例えば、各ストレージが提供する、論理デバイスの複製、退避などといった機能の有無なども信頼性の評価指標として用いることができる。
信頼性レベルについても、ストレージによっては信頼性レベルの異なる記憶領域を内部に混在することが可能であるが、本実施形態では、説明を簡単にするため、ストレージごとに一の信頼性レベルを有するものとし、ストレージ単位で管理できる構成とする。
なお、本実施形態では、性能/信頼性レベルを最高5から最低1までの5段階の数値で管理する。各ストレージのレベル値は、各ストレージのカタログ値や機器導入時のテスト結果などから、ストレージ管理者が決定し、設定するものとする。
総容量75には、各ストレージが利用可能な記憶領域の総量を示す情報が登録される。利用可能な記憶領域の総量は、各ストレージが有するディスク装置の記憶容量、数、および、各ストレージ内で構成されるRAIDレベルによって決定される。本実施形態では、利用可能な物理デバイスはあらかじめ設定されていると仮定し、総容量75には、利用可能な物理デバイスの総容量が登録される。
空き容量76には、各ストレージが有する物理デバイスのうち、未だ論理デバイスが定義されていない物理デバイスの総量を示す情報が登録される。本実施形態では、空き容量76には、状態が「オフライン」である物理デバイスの記憶容量の総量を示す情報が登録される。なお、状態が「未実装」である物理デバイスはホスト100が利用出来ないため、その容量は考慮されない。
なお、ユーザやストレージ管理者からの指示に応じて、管理サーバ110が要求された物理デバイスを定義する実施形態の場合は、空き容量76には、各ストレージに搭載されるディスク装置の未使用領域の総量を示す情報が登録される。
次に、再び図2に戻り、ストレージ130や管理サーバ110のメモリ133や112に格納されているプログラムについて説明する。これらのプログラムは、各部の制御プロセッサやCPUにより実行される。
ストレージ130のメモリ133に格納されている入出力要求処理プログラム221、外部デバイス監視処理プログラム222、外部デバイス移行処理プログラム223、および、管理サーバ110のメモリ112に格納されているストレージ監視処理プログラム241、外部デバイス移行指示処理プログラム242について説明する
入出力要求処理プログラム221は、論理デバイスへの入出力処理を実現する。入出力要求処理プログラム221は、入出力処理時に外部デバイスの異常(外部デバイスに障害が発生する予兆となる現象)を検知した場合、管理サーバ110へ通報を行う。
外部デバイス監視処理プログラム222は、外部デバイスを周期的に監視し、外部デバイスの異常を検知した場合、管理サーバ110へ通報を行う。
外部デバイス移行処理プログラム223は、管理サーバ110の指示に従い、特定の外部デバイスのデータを別のデバイスへ移行する処理を行う。
ストレージ監視処理プログラム241は、ストレージ130および外部ストレージ150から、外部デバイスの異常を報じる警告や障害報告を受信し、受信した報告等に応じて外部デバイスの移行計画を立て、ストレージ130に外部デバイスの移行を指示する。
外部デバイス移行指示処理プログラム242は、ストレージ監視処理プログラム241において、移行すべき外部デバイスが特定された場合、その移行先を決定する。
これらのプログラムを用いて各部で動作するストレージ制御処理について、以下に説明する。
外部デバイスの異常を検知して行われるデータの移行指示は、ストレージ130の入出力要求処理プログラム221および/または外部デバイス監視処理プログラム222と、管理サーバ110のストレージ監視処理プログラム241との連携によりなされる。
入出力要求処理プログラム221により実現される、入出力要求処理時の外部デバイスの異常を検知する処理について説明する。
図8は、入出力要求処理プログラム221により実現される入出力要求処理時の外部デバイスの異常を検知する処理の処理フローの一例を示す図である。
制御プロセッサ132は、入出力要求処理プログラム221に従って、各ポート131においてホスト100からストレージ130の論理デバイスに対して受け取った入出力要求について、その論理デバイスに対応する物理デバイス又は外部デバイスを特定し、物理デバイスに対する入出力処理もしくは、外部デバイスに対応した外部ストレージ150への入出力要求送信を行う。
本実施形態では、制御プロセッサ132は、ファイバチャネルのコマンドフレームを受信すると(ステップ801)、LUパス管理情報204と論理デバイス管理情報201とを参照して、受信したフレームに含まれるLUNからフレームのアクセス対象である論理デバイス番号とその論理デバイスが対応する物理デバイス又は外部デバイス番号とを取得する(ステップ802)。
取得した論理デバイスがストレージ130内の物理デバイスに対応する場合、制御プロセッサ132は、物理デバイスが格納されるディスク装置137に対し、ディスクキャッシュ134を用いたデータ入出力処理を行い、入出力要求処理を完了する(ステップ803)。
一方、その論理デバイスが外部デバイスである場合、制御プロセッサ132はポート131を介して、その外部デバイスに対し、入出力処理を行う(ステップ804)。外部デバイスに対する入出力要求は、ホスト100が、ストレージ130が提供する論理デバイスに対して行う入出力要求と基本的には同様の処理である。
外部デバイスへの入出力処理中に、アクセス障害または性能低下などの外部デバイスの異常を検知すると(ステップ805)、制御プロセッサ132は、管理サーバ110に対して、外部デバイスの異常を検知したことを警告する(ステップ806)。なお、警告には、アクセス障害または性能障害が発生したことを特定可能な情報が含まれていればよい。さらに、入出力処理対象の外部デバイスを特定する情報と、異常と判断した根拠を示す情報とが含まれていてもよい。
外部デバイスの異常を検知しない場合、通常の入出力処理を進める。
本実施形態におけるアクセス障害または性能低下の検知は、以下のように行われる。
アクセス障害の検知は、送出した入出力要求に対する応答により判断され、検知される。s
外部デバイスへのアクセス障害は、ストレージ130のポート131から外部ストレージ150のポート151へ到達するネットワークで障害(ケーブル断線、抜去、スイッチ障害、など)がある場合、外部ストレージ150のポート151や制御プロセッサ152などに障害がある場合などに発生する。
これらのアクセス障害は、これにより特定ポート151を介したアクセスが不可となるため、制御プロセッサ132から見て外部デバイスに送信した入出力要求がタイムアウトになることで検出される。入出力要求がタイムアウトになったことを検知した制御プロセッサ132は、通常のストレージ内部でのディスク装置に対する場合と同様に、交替パス処理を実行する。
まず、制御プロセッサ132は、特定ポート151を用いた入出力要求がタイムアウトになると、当該ポート151を用いた外部ストレージ150への経路の状態を確認する。
経路状態が正常であれば、同じ経路で規定回数入出力要求を再送し、その全てが成功しなかった場合にはじめて交替ポートへ切り替えて、入出力要求を再送する。経路状態が正常でない場合には、当該経路での再試行はスキップし、最初から交替ポートへ切り替えて入出力要求を再送する。
そして、交替ポートからの入出力要求が無事処理されたら、制御プロセッサ132は、外部デバイスのアクセス障害が発生している旨を示す警告メッセージを管理サーバ110に送信する。
以上により、ネットワークの状態変化通知を受信したことを契機に、既にリンク確立(ファイバチャネルではノードポートログイン)済みであった外部ストレージ150の全ポート151に対するリンクの再確認の結果、リンクが途絶えている場合や、外部デバイスへの入出力処理で特定ポート151を用いた経路について規定回数を超えるタイムアウトが発生した場合などに、経路状態は、閉塞状態に変更される。
また、全ての交替ポートで入出力要求が失敗した場合、本実施形態では当該外部デバイスへの入出力は不可となり、データが失われる。
性能低下は、外部デバイスに対する入出力要求の応答性やスループットの低下により検知される。制御プロセッサ132は、入出力要求を送出する毎に、その要求に対する応答時間およびスループットの情報を取得する。そして、外部ストレージ150毎に、予め保持している、平均的な応答時間やスループットと比較し、その乖離が大きい場合、異常が発生したものと判断する。異常発生と判断する乖離の閾値も、平均的な応答時間やスループットの情報とともに、ストレージ130のメモリ133等に予め保持しておく。
応答性やスループットの乖離があったために、異常発生と判断した場合は、その根拠(応答性またはスループット)を示す情報を警告に含める。
応答性やスループットの悪化は、例えば、ディスクキャッシュ154の片面閉塞といった異常により発生する。通常のライト処理では、外部ストレージ150のディスクキャッシュ154に二重に書込みが完了した時点で、完了報告の応答が送出される。しかし、二重化してデータを書き込むディスクキャッシュ154の一方が閉塞した場合、直接ディスク装置156に書込みが完了して始めて完了報告の応答が送出されるライトスルーとなる。ライトスルーでは、ライト性能が極端に低下し、応答性やスループットの悪化といった現象が発生する。
アクセス障害および性能低下として検出される事象は、その外部デバイスへのアクセスを保障するネットワークやプロセッサなどの冗長性が低下していることを意味する。従って、その外部デバイスが保持しているデータを保障するため、早急に冗長性を回復させるか、または、その外部デバイスが保持しているデータを他のデバイスへ退避(移行)させる必要がある。
異常を検知した制御プロセッサ132は、管理サーバ110に対して、その外部デバイスの異常を警告するメッセージもしくは信号を送信し、管理サーバ110に異常の発生を認識させる。
次に、外部デバイス監視処理プログラム222による外部デバイスの異常を検出する処理を説明する。外部デバイス監視処理プログラム222に従って、制御プロセッサ132は、外部デバイスの稼動状態を周期的に監視する。
ホスト100からある程度の頻度でアクセスされる外部デバイスは、入出力要求処理プログラム221に従って、入出力処理時にその障害発生を検知可能である。しかし、アーカイブデータを格納した外部デバイスなど、そのデバイスへのアクセスがほとんど発生しないデバイスなどの場合は、ホスト100からのアクセス以外の契機でその外部デバイスの状態の監視が必要となる。このため、外部デバイス監視処理プログラム222に従った外部デバイスの監視処理が設けられている。
図9は、外部デバイス監視処理プログラム222による外部デバイスの異常を検出するための処理フローの一例である。
制御プロセッサ132は、予め定められた頻度で外部デバイス監視処理プログラム222を周期的に起動する。起動頻度は、ホスト100からの入出力要求を阻害しない程度に定めておく。
外部デバイス監視処理プログラム222に従って、制御プロセッサ132は、外部デバイス管理情報203において管理する全ての外部デバイスの中から、入出力を試行する外部デバイスを決定し(ステップ901)、決定した外部デバイスに対して、テストI/O(例えば、リード処理)を実行する(ステップ902)。
本ステップにおいて試行する外部デバイスは、ホスト100からの最終アクセス時からの経過時間などに基づいて、その都度決定される。決定方法はこれに限られない。また、本実施形態では一回の起動で、外部デバイス一つに対し、入出力を試行するが、複数の外部デバイスに対して行ってもかまわない。
決定された外部デバイスに対する入出力試行において、その外部デバイスの異常を検知した場合(ステップ903)、制御プロセッサ132は、管理サーバ110に対してその外部デバイスの異常を警告する(ステップ904)。異常の検知方法、警告内容については、入出力要求処理の処理フローのステップ805と同じであるので説明は省略する。
このように、制御プロセッサ132は、管理下の外部デバイスへのアクセスを阻害する可能性がある異常を検知すると、その旨を管理サーバ110へ警告する。管理サーバ110では、仮想化ストレージであるストレージ130からの外部デバイスの異常警告、および/または、管理下にあるストレージ(被仮想化ストレージである外部ストレージ150)からの障害発生報告に基づいて、外部デバイスの移行処理を実施する。
ストレージ130から外部デバイスに異常が発生したことを示す警告(以後、異常警告と呼ぶ。)を、および/または、管理下にあるストレージ(外部ストレージ150)から障害発生報告を、受信した管理サーバ110側の処理について説明する。
図10は、管理サーバ110で実行されるストレージ監視処理プログラム241による処理のフロー図の一例である。CPU111は、ストレージ監視処理プログラム241を実行することにより、以下の処理を実現する。
CPU111は、ストレージ130から異常警告を、および/または、外部ストレージ150から障害発生報告を受信する(ステップ1001)。
CPU111は、受信した異常警告および/または障害報告を解析する(ステップ1002)。
CPU111は、受信した異常警告および/または障害報告に格納された情報に従って、影響を被る外部デバイスを判定するとともに、影響を被ると判断された論理デバイスについてデータ移行の必要性を判定し、移行対象となる外部デバイスの範囲(論理デバイス群)を決定する(ステップ1003)。
ここでは、CPU111は、異常警告を受信すると、その異常警告に格納されている外部デバイスの情報、異常の内容(アクセス障害、応答性またはスループットの低下)を抽出する。抽出した外部デバイスの情報および異常の内容を元に、その外部デバイスを備える外部ストレージ150にアクセスし、既存の技術を用いて、障害の発生箇所、障害の程度などについて詳細を調査する。
障害報告を受信した場合は、その障害報告に格納されている情報により、障害発生箇所、障害の程度等を認識する。
障害の発生箇所とは、例えば、障害を報告してきた外部ストレージ150のFAN、電源、ディスクキャッシュ、ポート、ディスク装置などの部位のことであり、障害の程度とは、障害発生の結果、その部位が使えなくなったのか、一時的な障害で外部ストレージの構成情報上は既に正常に復帰しているのか、といったレベルであり、障害の種別情報から判定できる。なお、後者の場合は、正常状態へ復帰しているため、当該外部デバイスに対する対応処理は不要となる。
CPU111は、異常と警告された、および/または、障害を報告してきた外部ストレージ150から、デバイス情報を含む最新の構成情報を取り込み、今回の障害により可用性が低下する論理デバイス群を特定する。
例えば、障害発生部位がFANや電源で、交替分のFANや電源が残り少ない場合、そのストレージに搭載された全ての論理デバイスの可用性が低下する。この場合、CPU111は、全ての論理デバイスを可用性が低下する範囲と決定する。
また、ディスクキャッシュ154の二重化されたメモリの一方が障害により閉塞した場合は、異常ありと警告されたおよび/または障害を報告してきた外部ストレージ150の全論理デバイスの可用性および性能レベルが著しく低下することが予想される。この場合も、CPU111は、その外部ストレージ150の全ての論理デバイスを可用性が低下する範囲と決定する。
また、特定のディスク装置156で障害が発生し、そのディスク装置156が属するRAIDグループの冗長性が損なわれている場合であって、そのディスク装置156を備える外部ストレージ150内に交替用のディスク装置156が残っていない場合には、そのRAIDグループに対応する論理デバイス群の可用性が低下したことになる。この場合、CPU111は、障害が発生したディスク装置156が属するRAIDグループに対応する論理デバイス群を、可用性が低下する範囲と決定する。
影響を被る論理デバイス群を特定すると、CPU111は、デバイス管理情報の複製231内の外部デバイス管理情報を用いて、報告された障害で影響を被る論理デバイス群に、別のストレージの外部デバイスとして管理されているものがないかを調べる。
移行対象の外部デバイス群が決定されると、CPU111は、外部デバイス移行指示処理プログラム242に従って、ストレージ130に、移行対象の外部デバイス内のデータの移行を指示する(ステップ1004)。
ストレージ130による外部デバイスの移行(データ移行)が完了し、ストレージ130から移行完了通知を受信すると、CPU111はストレージ130の更新されたデバイス構成情報(論理デバイス管理情報201、物理デバイス管理情報202、外部デバイス管理情報203、LUパス管理情報204)を、デバイス管理情報の複製231としてメモリ112へ取り込み、処理を完了する(ステップ1005)。
次に、上記のステップ1004の、外部デバイス移行指示処理プログラム242に従った処理について、その詳細を説明する。
図11は、外部デバイス移行指示処理プログラム242に従って、管理サーバ110のCPU111が実現する処理の処理フローの一例である。
ストレージ監視処理プログラム241に従ってデバイスを移行する必要のある外部デバイスが決定されると、CPU111は、それらの外部デバイスを移行元とし、移行先のデバイスを決定し、ストレージ130に外部デバイス移行指示(データ移行の指示)を行う。
まず、CPU111は、移行元デバイスの性能や信頼性レベルなどの属性を、ストレージ管理情報232などを参照して確認する(ステップ1101)。
CPU111は、移行元デバイスである外部デバイスを仮想化して管理するストレージ130の管理下にある外部ストレージ150a、150bもしくはストレージ130内の物理デバイスに未使用、すなわち論理デバイスを割り当てていないものでかつ移行元デバイスと同じかそれを上回る性能/信頼性レベルなどの属性を有するもの(空きデバイス)の有無を調べる(ステップ1102)。
空きデバイス調査には、管理サーバ110がメモリ112に持つ各ストレージのデバイス管理情報の複製231およびストレージ管理情報232が用いられる。
ストレージ130管理下に未使用でかつ条件を満たす空きデバイスが存在する場合、CPU111は、そのデバイスをデータの移行先と決定する(ステップ1105)。移行先が決定すると、CPU111は、ストレージ130に、外部デバイス移行指示を送信する(ステップ1106)。外部デバイス移行指示には、移行元および移行先を指定する情報が含まれる。本実施形態では、外部デバイスの外部デバイス番号61が用いられる。なお、移行先がストレージ130のデバイスの場合は、外部デバイス番号61の替わりに物理デバイス番号51が用いられる。
一方、空きデバイスが存在しない場合は、CPU111は、管理サーバ110の管理下でかつストレージ130の仮想化制御外のストレージを対象に、条件を満たす空きデバイスの有無を調査する(ステップ1103)。
ここで条件を満たす空きデバイスが見つかった場合、CPU111は、ストレージ130に指示して、そのデバイスを外部デバイスとして登録させる(ステップ1104)。
ステップ1104において行われる処理は、システム構築時に行われる、ストレージ130に接続した他の外部ストレージ150の論理デバイスを外部デバイスとして登録する処理と同様である。
具体的には、制御プロセッサ132が、対象の外部ストレージ150に対してInquiryなどの問い合わせを発行し、外部デバイス管理情報203へ登録する。その後、管理サーバ110において、対象の外部ストレージの論理デバイスをストレージ130の外部デバイスとして対応付けて、デバイス管理情報の複製231を更新する。
CPU111は、ステップ1104において登録された外部デバイスを移行先と決定し(ステップ1105)、ストレージ130に、外部デバイス移行指示を行う(ステップ1106)。
一方、ステップ1103の調査で条件を満たす空きデバイスが見つからなかった場合には、ステップ1102の調査範囲、すなわち、ストレージ130の仮想化制御下において、性能/信頼性レベルを満たさないが、移行元デバイス分の容量を有する空きデバイスの有無を再チェックする(ステップ1107)。これは、障害が発見されたデバイスにデータを保持しておくのを避けるためである。
容量の条件のみを満たす空きデバイスが見つかった場合、CPU111は、そのデバイスを移行先と決定し(ステップ1105)、ストレージ130に、外部デバイス移行指示を行う(ステップ1106)。
空きデバイスが見つからない場合は、次にステップ1103の調査範囲、すなわち、管理サーバ110の管理下でありかつ、ストレージ130の仮想化制御外において、性能/信頼性レベルを満たさないが容量要件を満たす空きデバイスの有無を再チェックする(ステップ1108)。
空きデバイスが見つかった場合、CPU111は、ストレージ130に指示して、その空きデバイスを外部デバイスとして登録させ(ステップ1104)、そのデバイスを移行先と決定し(ステップ1105)、ストレージ130に、外部デバイス移行指示を行う(ステップ1106)。
ステップ1108においても、空きデバイスを見つけられない場合、移行元外部デバイスの移行ができないことを、出力装置115などに表示することにより、ストレージ管理者に提示し、処理を中断する(ステップ1109)。
次に、管理サーバ110から、外部デバイス移行指示を受けた際のストレージ130の処理について説明する。
図12は、制御プロセッサ132が、外部デバイス移行処理プログラム223に従って実行する外部デバイス移行処理の処理フローの一例である。
外部デバイス移行処理は、管理サーバ110から指定された移行元外部デバイスのデータを、移行先のデバイス(外部デバイスもしくはストレージ130の物理デバイス)へ移行する処理である。
管理サーバ110から外部デバイス移行指示を受領すると、制御プロセッサ132は、移行元の外部デバイスに対応した論理デバイスの論理デバイス管理情報201に、デバイス移行状態を登録する(ステップ1201)。
ここでは、制御プロセッサ132は、移行中物理/外部デバイス番号37に移行先である外部デバイス番号61または物理デバイス番号51を設定し、データ移行進捗ポインタ38を0に初期化し、データ移行中フラグ39にOnを設定する。
制御プロセッサ132は、外部デバイス移行処理プログラム223に従って、データ移行進捗ポインタ38に従い、移行元外部デバイスから移行先物理/外部デバイスへデバイスの先頭から末尾まで順次データ移行を実行する(ステップ1202)。
本実施形態では、制御プロセッサ132は、ホスト100からの入出力を受付ながらこの外部デバイス移行処理を実行する。データ移行中に、移行元の外部デバイスに対応する論理デバイスへホスト100から入出力要求があった場合、制御プロセッサ132は、論理デバイス管理情報201のデータ移行進捗ポインタ38により、アクセス対象データが移行済みか否かを判定する。移行処理が未完了と判定された領域についての入出力に対しては、移行元/移行先デバイスの両領域に二重書きするなどの制御を行う。
移行元外部デバイスの末尾までデータ移行が完了すると、制御プロセッサ132は、データ移行に係る論理デバイス、物理デバイス、外部デバイスの、それぞれ、論理デバイス管理情報201、外部デバイス管理情報203、物理デバイス管理情報202を更新する(ステップ1203)。
すなわち、これらの管理情報に、データ移行後の論理デバイスと、外部デバイスまたは物理デバイスとの対応関係を格納する。
ここでは、論理デバイス管理情報201の対応物理/外部デバイス番号33に移行先の外部/物理デバイス番号を設定し、データ移行中フラグ29をOffに設定する。
移行先が物理デバイスの場合、物理デバイス管理情報202の対応論理デバイス番号53に、対応物理/外部デバイス番号33に移行先の外部/物理デバイス番号を設定した論理デバイスの番号を設定し、デバイス状態54を「オンライン」に設定する。
移行先が外部デバイスの場合、外部デバイス管理情報203の対応論理デバイス番号63に、対応物理/外部デバイス番号33に移行先の外部/物理デバイス番号を設定した論理デバイスの番号を設定し、デバイス状態64を「オンライン」に設定する。
また、移行元の外部デバイスの外部デバイス管理情報203の対応論理デバイス番号63に、無効値を設定し、デバイス状態64を「オフライン」に設定する。
各管理情報の更新が終了すると、制御プロセッサ132は、管理サーバに外部デバイス移行処理が完了したことを通知する(ステップ1204)。
以上説明したように、本実施形態によれば、外部ストレージ接続機能を有するストレージにおいて、外部ストレージのデバイスで発生した障害の予兆である異常を検知し、影響範囲を特定し、データ移行を行うなどの適切な制御を行うことができる。
従って、本実施形態によれば、外部ストレージ接続機能を有するストレージと、そのストレージに接続されたストレージからなるストレージシステムを有する計算機システムにおいて、外部ストレージが、比較的信頼性の低いストレージ装置であっても、システム全体の可用性を高めることができる。
新しいストレージを導入してストレージシステム全体の容量を増やす場合、既存ストレージのデバイスが保持している全データを新規ストレージに移行して置き換える場合は、新規導入ストレージに既存ストレージデバイス分の容量を具備する必要があり、ストレージ導入コストを押し上げてしまう。また、既存のストレージと新規ストレージとの両者をホストに直結すると、ホスト側の制御は複雑になる。
本実施形態によれば、ホストからのアクセス態様は変更せずに、新規のストレージを導入するとともに、既存のストレージを有効に活用可能な計算機システムを構築することができる。これにより、機器導入コストを低減することができる。
<第2の実施形態>
次に第2の実施形態について説明する。ここでは、第1の実施形態と異なる構成についてのみ説明する。
本実施形態が適用される計算機システムのハードウェア構成は、図1に示す第1の実施形態と同様である。本実施形態では、図に示した1つ以上の外部ストレージ150の論理デバイスを複数を集めて、RAIDグループを構成する。本実施形態では、このRAIDグループに論理デバイスを定義する。簡単のため、論理デバイスとRAIDグループの対応は1対1とする。
外部ストレージ150の論理デバイスでRAIDグループを構成することにより、本実施形態では、外部デバイスのデータ保護方法として、第1の実施形態において説明したデータ移行と、外部デバイスがアクセス不可になってからRAIDを構成する他デバイスにより行うデータ回復の2種類の方法が可能となる。
本実施形態では、外部ストレージ150の論理デバイスでRAIDグループを構成することにより、論理デバイス管理情報201として保持されるデータが第1の実施形態とは異なる。
図14に論理デバイス管理情報201の構成例を示す。
本実施形態の論理デバイス管理情報201は、論理デバイスごとに、論理デバイス番号1401、サイズ1402、対応物理/外部デバイス番号1403、デバイス状態1404、RAID構成(RAIDレベル、データ/パリティ数)1405、ストライプサイズ1406、物理/外部デバイス番号リスト1407、移行/回復元 物理/論理デバイス番号および移行/回復先 物理/論理デバイス番号1408、データ移行/回復進捗ポインタ1409、データ移行/回復中フラグ1410を備える。
論理デバイス番号1401には、論理デバイスを識別するための識別番号が登録される。サイズ1402には、論理デバイス番号1401により特定される論理デバイスの容量が格納される。
対応物理/外部デバイス番号1403には、この論理デバイスが対応付けられている物理/外部デバイス番号が格納される。本番号は、論理デバイスが定義されることを契機に格納される。この論理デバイスが物理/外部デバイスへ割り当てられていない場合、対応物理/外部デバイス番号1403には無効値が設定される。
デバイス状態1404には、第1の実施形態と同様、この論理デバイスの状態を示す情報が設定される。
RAID構成1405には、この論理デバイスが割り当てられた物理/外部デバイスで構成するRAIDグループのRAIDレベル、データディスクとパリティディスク数などRAID構成に関連する情報が保持される。同じように、ストライプサイズ1406には、RAIDにおけるデータ分割単位(ストライプ)長が保持される。物理/外部デバイス番号リスト1407には、この論理デバイスが割り当てられたRAIDを構成する複数の物理/外部デバイス各々の識別番号が保持される。
本実施形態では、データ回復の処理も行われるため、データ移行/回復中フラグ1410の取りうる値は、「データ移行中」と「データ回復中」と「Off」の3値である。外部デバイスのデータを別の物理/外部デバイスへ移行する場合は「データ移行中」を設定し、アクセス不可になった外部デバイスを回復する場合には「データ回復中」を設定する。
移行/回復元 物理/論理デバイス番号および移行/回復先 物理/論理デバイス番号1408には、障害などの理由により、他の外部/物理デバイスへデータ移行もしくは回復処理がなされている場合に、移行/回復元である外部/物理デバイス番号と、移行/回復先である外部/物理デバイス番号とが設定される。データ移行/回復進捗ポインタ1409は、データ移行または回復の処理が未完了な領域の先頭アドレスを示す情報が格納される。データ移行または回復の処理の進行に伴い、更新される。
データ移行/回復処理の開始時には、エントリ1408の設定、エントリ1409の初期化、エントリ1410に「回復中」又は「移行中」を示す値の設定が行われる。
本実施形態では、ストレージ130は、第1の実施形態同様、4つのデバイス管理情報でデバイス階層を管理する。論理デバイスは、事前に定義されている物理デバイスと、ユーザもしくはストレージ管理者が定義した外部デバイスとを複数組み合わせて定義される。定義された論理デバイスについて各ポート131にLUNが定義される。
本実施形態では、外部デバイスおよび物理デバイスを複数集めてRAIDを構成する。第1の実施形態と同様に外部デバイスへのアクセスを支える構成要素の可用性低下を検知し、外部デバイスの障害を予見し、予防のため事前にデータ移行をするだけでなく、外部デバイスや物理デバイスの一つがアクセス不可に陥った後で、RAIDを構成する他の物理/外部デバイスから、アクセス不可となった外部デバイスの情報を回復することができる。
物理/外部デバイスがアクセス不可に陥ったことは、第1の実施形態も備える、外部デバイス監視処理プログラム222、入出力要求処理プログラム221に従った外部デバイスの異常の検知処理により検出可能である。また、管理サーバの既存の機能により得られる外部ストレージ150からの障害報告によっても検出可能である。
本実施形態では、これらのプログラムに従って検出されたアクセス不可に陥った外部デバイスや物理デバイスについて、回復処理を行うため、ストレージ130は、外部デバイス回復処理プログラム(不図示)を、管理サーバ110は、外部デバイス回復指示処理プログラム(不図示)を、それぞれ、メモリ133およびメモリ112にさらに備える。
外部デバイス回復処理プログラムは、制御プロセッサ132により実行され、外部デバイス回復指示処理プログラムは、CPU111により実行され、それぞれ、機能を実現する。
入出力処理プログラム221、外部デバイス監視処理プログラム222、ストレージ監視処理プログラム241によって実現される機能は、第1の実施形態と同様であるため、ここでは、説明を省略する。
本実施形態の管理サーバ110は、外部デバイス回復指示処理プログラムに従って、回復データを格納する回復先デバイス(物理/外部デバイス)を決定し、ストレージ130にデータ回復を指示する。外部デバイス回復指示処理プログラムの処理フローは、第1の実施形態で説明した外部デバイス移行指示処理プログラム242による処理フローにおいて、移行指示を回復指示と、移行元/先デバイスを回復元/先デバイスと、読み替えると、他は同様であるため、説明は省略する。
図13に、本実施形態における、制御プロセッサ132で実行される外部デバイス回復処理プログラムに従った、外部デバイス回復処理の処理フローの一例を示す。
管理サーバ110から外部デバイス回復指示を受けた制御プロセッサ132は、外部デバイス回復処理プログラムに従って、外部デバイス回復処理を実行する。
制御プロセッサ132は、回復指示を受けた論理デバイスの管理情報に回復中を示す情報を登録する(ステップ1301)。このとき、この論理デバイスの論理デバイス管理情報201、回復元および回復先の外部デバイス管理情報203、回復元および回復先の物理デバイス管理情報202を更新し、論理デバイスとの対応を入れ替える。
制御プロセッサ132は、回復元外部デバイスが属する論理デバイスが定義された他の外部/物理デバイスからデータを回復し、先頭アドレスから順に回復先外部/物理デバイスへデータを格納していく(ステップ1302)。
デバイス末尾までデータ回復が完了すると、制御プロセッサ132は、論理デバイスの処理状態を示すデータ移行/回復中フラグ1410をOffに設定し(ステップ1303)、回復処理完了を管理サーバ110に報告する(ステップ1304)。
以上説明したように、本実施形態によれば、第1の実施形態同様、外部デバイスの障害を予見し、予防措置として、そのデバイス内のデータを移行できるだけでなく、実際に障害が発生し、アクセス不可となった後に、その外部デバイス内のデータを回復することができる。
従って、本実施形態の構成により、第二のストレージが自装置に接続する第一のストレージ内のデバイスも自装置のデバイスとして仮想化してホストに提供する計算機システムにおいて、第一のストレージのデバイスに関連する障害の管理および対処を実現することができ、計算機システム全体の可用性を高めることができる。
なお、本発明は、上記の2つの実施形態に限定されず、数々の変形が可能である。
上記2つの実施形態では、管理サーバ110が、外部デバイスの移行の是非を、ストレージ毎に保持した性能/信頼性レベル、障害の発生部位、旨発生した障害のレベルに基づいて決定している。
しかし、上記決定基準に加えて、論理デバイス毎に必要となる信頼性レベルを事前にユーザもしくはストレージ管理者が定義し、その信頼性レベルに応じて外部デバイスの障害対応を決定するようにしてもよい。
例えば、障害によりアクセス不可が予想される外部デバイスのデバイス移行の是非を、その外部デバイスに定義された(要求されている)論理デバイスの信頼性レベルに基づいて決定する。すなわち、要求されている信頼性レベルが高い場合は、即時他の外部/物理デバイスへの移行処理を行い、要求されている信頼性レベルが低い場合は、移行処理を行わず、ストレージ管理者へ障害報告を行い、ストレージ管理者からの指示を待つ。
また、上記2つの実施形態では、異常が検知された外部デバイスを、その外部デバイスに定義されている性能/信頼性レベルを満たす外部デバイスまたはストレージ130内の物理デバイスを選定することを優先し、移行先/回復先デバイスを決定している。しかし、移行完了までの時間短縮を重視し、まず、容量の条件のみストレージ130内の空きデバイスを選定して移行した後、性能/信頼性レベルに見合った他のデバイスに移行するよう構成してもよい。
また、第2の実施形態では、RAIDを構成する外部デバイスの一つが障害でアクセス不可になった場合、アクセス不可になった外部デバイス内のデータのみを他の物理/外部デバイスへ回復する場合を例にあげて説明した。
しかし、RAIDを構成する別のデバイスが、アクセス不可となった外部デバイスと同じ外部ストレージ150にある場合などは、RAID内の他の複数のデバイスがデータ移行の対象となる可能性がある。その場合、外部デバイス移行指示処理プログラム242は、障害が発生した外部デバイスに対する回復先デバイスと、障害が発生した外部デバイス以外で移行対象となった外部デバイスとについて移行先デバイスを選定し、ストレージ130に対して、デバイスの回復指示および移行指示を行う。ストレージ130では、RAIDを構成する物理/外部デバイスのデータを読み出し、回復先デバイスへのデータの回復を行う処理と並行して、読み出した移行対象外部デバイスのデータを移行先デバイスへ移行する。
図1は、第1の実施形態が適用される計算機システムのハードウェア構成の一例を示す図である。 図2(a)は、第1の実施形態の、ストレージの制御メモリおよびメモリに格納される制御情報およびストレージ制御処理のためのプログラムの一例を示す図である。図2(b)は、第1の実施形態の管理サーバのメモリに格納される制御情報およびストレージ制御処理のためのプログラムの一例を示す図である。 図3は、第1の実施形態の論理デバイス管理情報の一例を示す図である。 図4は、第1の実施形態のLUパス管理情報の一例を示す図である。 図5は、第1の実施形態の物理デバイス管理情報の一例を示す図である。 図6は、第1の実施形態の外部デバイス管理情報の一例を示す図である。 図7は、第1の実施形態のストレージ管理情報の一例を示す図である。 図8は、第1の実施形態の入出力要求処理プログラムによる処理のフローである。 図9は、第1の実施形態の外部デバイス監視処理プログラムによる処理のフローである。 図10は、第1の実施形態のストレージ監視処理プログラムによる処理のフローである。 図11は、第1の実施形態の外部デバイス移行指示処理プログラムによる処理のフローである。 図12は、第1の実施形態の外部デバイス移行処理プログラムによる処理のフローである。 図13は、第2の実施形態の外部デバイス回復処理プログラムによる処理のフローである。 図14は、第2の実施形態の論理デバイス管理情報の一例を示す図である。
符号の説明
100…ホスト、110…管理サーバ、120…ファイバチャネルスイッチ、130…ストレージ、140…管理端末、150…外部ストレージ、175…IPネットワーク、201…論理デバイス管理情報、202…物理デバイス管理情報、203…外部デバイス管理情報、204…LUパス管理情報、205…キャッシュ管理情報、206…仮想デバイス管理情報、221…入出力要求処理、222…外部デバイス監視処理、223…外部デバイス移行処理、241…ストレージ監視処理、242…外部デバイス移行指示処理、101…CPU、102…メモリ、103…記憶装置、104…入力装置、105…出力装置、106…I/F、107…ポート、121…ポート、123…I/F、111…CPU、112…メモリ、113…記憶装置、114…入力装置、115…出力装置、116…I/F、131…ポート、132…制御プロセッサ、133…メモリ、134…ディスクキャッシュ、135…制御メモリ、136…ポート、137…ディスク、138…I/F、141…I/F、142…CPU、143…メモリ、144…記憶装置、145…入力装置、146…出力装置、147…I/F、151…ポート、152…制御プロセッサ、153…メモリ、154…ディスクキャッシュ、155…ポート、156…ディスク、157…I/F

Claims (20)

  1. 第一のストレージ、および、前記第一のストレージが提供する論理デバイス(以後、外部デバイスと呼ぶ。)と自身の物理デバイスとをホスト計算機に論理デバイスとして提供する第二のストレージを管理する管理サーバであって、
    前記第二のストレージから受信した、前記外部デバイスの障害の予兆情報に基づいて、前記障害の影響範囲を移行元として特定する移行元決定手段と、
    前記移行元のデータ容量と予め定められた性能および信頼性レベルの評価とに基づいて、自身が管理する前記第一のストレージおよび前記第二のストレージの範囲で移行先を決定し、前記第二のストレージに前記移行元のデータを前記移行先に移行するよう指示するデータ移行指示手段と、
    を備えることを特徴とする管理サーバ。
  2. 請求項1記載の管理サーバであって、
    前記データ移行指示手段は、
    前記移行元のデータ容量と前記予め定められた性能および信頼性レベルの評価との両条件を満たすデバイスを、前記範囲内で抽出し、当該デバイスを移行先と決定し、
    前記範囲内で、前記両条件を満たすデバイスを抽出できなかった場合、少なくとも前記データ容量を満たすデバイスを当該範囲内で抽出し、当該デバイスを移行先と決定し、
    前記範囲内で、少なくとも前記データ容量を満たすデバイスを抽出できなかった場合、前記範囲外でありかつ当該管理サーバの管理下である第二の範囲において、前記データ容量と前記性能および信頼性レベルの評価との両条件を満たすデバイスを抽出し、当該デバイスを移行先と決定するとともに、当該移行先として決定したデバイスを、前記第二のストレージの外部デバイスとして登録する指示を前記第二のストレージに送出し、
    前記第二の範囲内で、前記両条件を満たすデバイスを抽出できなかった場合、少なくとも前記データ容量を満たすデバイスを当該範囲内で抽出し、当該デバイスを移行先と決定するとともに、当該移行先として決定したデバイスを、前記第二のストレージの外部デバイスとして登録する指示を前記第二のストレージに送出し、
    前記第二の範囲内で、少なくとも前記データ容量を満たすデバイスを抽出できなかった場合、自身が備える出力装置に、データ移行不可を示す表示を行うこと
    を特徴とする管理サーバ。
  3. 外部のストレージの論理デバイス(以後、外部デバイスと呼ぶ。)を自身のストレージのデバイスとして仮想化してホストに提供する手段を備えるストレージであって、
    自身が保持する物理デバイスおよび前記外部デバイスを、前記ホストに提供する論理デバイスと対応付けてデバイス構成情報として管理する論理デバイス管理手段と、
    前記ホストから入出力要求を受信すると、前記デバイス構成情報に基づいて前記物理デバイスまたは前記外部デバイスへの入出力処理に変換し、前記変換結果に従って入出力処理を行う入出力処理手段と、
    前記入出力処理手段による外部デバイスへの入出力処理中に、当該外部デバイスへのアクセス障害または性能低下の有無を判別する異常検知手段と、
    前記異常検知手段において、アクセス障害または/および性能低下を検出した場合、自身および前記外部ストレージを管理する管理サーバに向けて検出した異常とアクセス対象外部デバイスとを通知する通知手段と、
    前記管理サーバから移行元および移行先を特定したデータ移行の指示を受け付けると、当該指示に従って前記移行元のデータを前記移行先に移行するデータ移行を行うデータ移行手段と、を備え、
    前記論理デバイス管理手段は、
    前記データ移行が完了した後、移行後の物理デバイスおよび外部デバイスと、前記論理デバイスとの対応付けに従って、前記デバイス構成情報を更新すること
    を特徴とするストレージ。
  4. 請求項3記載のストレージであって、
    予め定めた周期でアクセス対象となる前記外部デバイスを決定し、当該外部デバイスに入出力処理を実行する外部デバイス監視手段をさらに備えること
    を特徴とするストレージ。
  5. 第一のストレージと、前記第一のストレージとホストとの間に介在する第二のストレージとを備えるストレージシステムであって、
    前記第一のストレージは、
    自身が備える物理デバイスを前記第二のストレージに論理デバイス(以後、外部デバイスと呼ぶ。)として提供する外部デバイス提供手段を備え、
    前記第二のストレージは、
    自身が備える物理デバイスおよび前記外部デバイスとを前記ホストに提供する論理デバイスと対応付けてデバイス構成情報として管理する論理デバイス管理手段と、
    前記ホストから入出力要求を受信すると、前記デバイス構成情報に基づいて前記物理デバイスまたは前記外部デバイスへの入出力処理に変換し、前記変換結果に従って入出力処理を行う入出力処理手段と、
    前記入出力処理手段による外部デバイスへの入出力処理中に、当該外部デバイスへのアクセス障害または性能低下の有無を判別する異常検知手段と、
    前記異常検知手段において、アクセス障害または/および性能低下を検出した場合、自身および前記第一のストレージを管理する管理サーバに向けて検出した異常とアクセス対象外部デバイスとを通知する通知手段と、
    前記管理サーバから移行元および移行先を特定し、データ移行の指示を受け付けると、当該指示に従って前記移行元のデータを前記移行先に移行するデータ移行を行うデータ移行手段と、を備え、
    前記論理デバイス管理手段は、
    前記データ移行が完了した後、移行後の物理デバイスおよび外部デバイスと、前記論理デバイスとの対応付けに従って、前記デバイス構成情報を更新すること
    を特徴とするストレージシステム。
  6. 1以上の第一のストレージと、第二のストレージと、前記第一のストレージおよび前記第二のストレージに接続する管理サーバとを備える計算機システムであって、
    前記第一のストレージは、
    自身が備える物理デバイスを前記第二のストレージに論理デバイス(以後、外部デバイスと呼ぶ。)として提供する外部デバイス提供手段を備え、
    前記第二のストレージは、
    自身が備える物理デバイスおよび前記外部デバイスとを前記ホストに提供する論理デバイスと対応付けてデバイス構成情報として管理する論理デバイス管理手段と、
    前記外部デバイスを監視する監視手段と、
    前記監視手段において、障害の予兆を検出すると、前記管理サーバに通知する通知手段と、
    前記管理サーバから受け付けたデータ移行指示に従ってデータを移行し、前記デバイス構成情報を更新するデータ移行手段と、を備え、
    前記管理サーバは、
    前記通知に基づいて、データ移行範囲および移行先を決定し、前記第二のストレージに移行範囲および移行先とともに、前記データ移行範囲のデータを前記移行先に移行するデータ移行の指示を行うデータ移行指示手段を備えること
    を特徴とする計算機システム。
  7. 1以上の第一のストレージと、第二のストレージと、前記第一のストレージおよび前記第二のストレージに接続する管理サーバとを備える計算機システムであって、
    前記第一のストレージは、
    自身が備える物理デバイスを前記第二のストレージに論理デバイス(以後、外部デバイスと呼ぶ。)として提供する外部デバイス提供手段を備え、
    前記第二のストレージは、
    自身が備える物理デバイスおよび前記外部デバイスとを前記ホストに提供する論理デバイスと対応付けてデバイス構成情報として管理する論理デバイス管理手段と、
    前記ホストから入出力要求を受信すると、前記デバイス構成情報に基づいて前記物理デバイスまたは前記外部デバイスへの入出力処理に変換し、前記変換結果に従って入出力処理を行う入出力処理手段と、
    前記入出力処理手段による外部デバイスへの入出力処理中に、当該外部デバイスへのアクセス障害または性能低下の有無を判別する異常検知手段と、
    前記異常検知手段において、アクセス障害または/および性能低下を検出した場合、自身および前記第一のストレージを管理する管理サーバに向けて検出した異常とアクセス対象外部デバイスとを通知する通知手段と、
    前記管理サーバから移行元および移行先を特定したデータ移行の指示を受け付けると、当該指示に従って前記移行元のデータを前記移行先に移行するデータ移行を行うデータ移行手段と、を備え、
    前記論理デバイス管理手段は、
    前記データ移行が完了した後、移行後の物理デバイスおよび外部デバイスと、前記論理デバイスとの対応付けに従って、前記デバイス構成情報を更新し、
    前記管理サーバは、
    前記第二のストレージから受信した、前記検出した異常と前記アクセス対象外部デバイスとの情報に基づいて、当該異常により障害が発生する可能性のある範囲を移行元として特定する移行元決定手段と、
    前記移行元のデータ容量と予め定められた性能および信頼性レベルの評価とに基づいて、自身に接続する前記第一のストレージおよび前記第二のストレージの範囲で移行先を決定し、前記第二のストレージに前記移行元および前記移行先を特定しデータ移行を指示するデータ移行指示手段と、を備えること
    を特徴とする計算機システム。
  8. 請求項7記載の計算機システムであって、
    前記第二のストレージは、
    予め定めた周期でアクセス対象となる前記外部デバイスを決定し、当該外部デバイスに入出力処理を実行する外部デバイス監視手段をさらに備えること
    を特徴とする計算機システム。
  9. 1以上の第一のストレージと、第二のストレージと、前記第一のストレージおよび前記第二のストレージに接続する管理サーバとを備える計算機システムであって、
    前記第一のストレージは、自身が備える物理デバイスを前記第二のストレージに論理デバイス(以後、外部デバイスと呼ぶ。)として提供する外部デバイス提供手段を備え、
    前記第二のストレージは、
    自身が備える物理デバイスと前記外部デバイスとを論理デバイスとしてホストに提供する論理デバイス提供手段と、
    前記外部デバイスの状態を監視し、障害発生の予兆を検出した場合、前記管理サーバに、検出した予兆の内容と監視対象の外部デバイスとを通知する通知手段と、
    前記ホストに提供する論理デバイスに対応する物理デバイスおよび外部デバイス(以後、第二のストレージ管理下のデバイスと呼ぶ。)内で、前記管理サーバからの指示に従ってデータの移行を行うデータ移行手段とを備え、
    前記管理サーバは、
    前記通知手段から前記通知を受信すると、受信した通知内容を解析し、当該通知に含まれる障害が発生した場合に影響を受ける外部デバイスを特定して移行元として決定する解析手段と、
    前記移行元の外部デバイスのデータの移行先を決定し、前記第二のストレージに、前記移行元のデータを前記移行先に移行する指示を与えるデータ移行指示手段と、を備え、
    前記データ移行指示手段は、
    前記解析手段が決定した移行元の外部デバイスの容量を確認し、当該容量を満たす移行先を、前記第二のストレージ管理下のデバイスのうち前記障害の予兆が発生した際にアクセス対象であった外部デバイス以外のデバイスの中から選択し、前記移行先として決定すること
    を特徴とする計算機システム。
  10. 請求項9記載の計算機システムであって、
    前記外部デバイス提供手段が提供する外部デバイスは、前記第一のストレージが備える物理デバイスにより構成されたRAIDグループからなり、
    前記通知手段は、前記障害発生の予兆に加え、障害発生そのものを通知し、
    前記解析手段は、前記通知手段から障害発生の通知を受信すると、受信した通知を解析し、当該障害が発生した外部デバイスが属するRAIDグループを特定し、当該RAIDグループを構成する他のデバイスが保持するデータを用いて前記障害が発生した外部デバイスのデータを回復するとともに、当該回復したデータを前記移行元として決定すること
    を特徴とする計算機システム。
  11. 請求項9または10記載の計算機システムであって、
    前記データ移行指示手段は、
    移行先を決定する際、前記解析手段が決定した移行元の外部デバイスが属する第二のストレージに予め与えられた性能および信頼性レベルの評価を確認し、前記容量に加えて前記性能および信頼性レベルの評価を満たす移行先を、前記第二のストレージ管理下のデバイスのうち前記障害の予兆の発生したデバイス以外のデバイスの中から選択し、移行先として決定すること
    を特徴とする計算機システム。
  12. 請求項11記載の計算機システムであって、
    前記管理サーバに接続される第三のストレージをさらに備え、
    前記データ移行指示手段は、
    移行先を決定する際、前記容量または前記性能および信頼性レベルの評価を満たす移行先が前記第二のストレージ管理下のデバイス内にない場合、前記第三のストレージ内から前記容量または前記性能および信頼性レベルの内少なくとも前記容量を満たすデバイスを選択し、移行先として決定するとともに、前記第二のストレージに、前記移行先として決定したデバイスを、外部デバイスとして前記第二のストレージに登録するよう指示すること
    を特徴とする計算機システム。
  13. 請求項9、10、11または12記載の計算機システムであって、
    前記第二のストレージは、
    前記第二のストレージ管理下のデバイスと、前記ホストに提供する論理デバイスとを対応付けてデバイス構成情報として管理する構成情報管理手段をさらに備え、
    前記データ移行手段は、
    データ移行を行った後、前記デバイス構成情報を、移行後の対応関係に従って更新すること
    を特徴とする計算機システム。
  14. 第一のストレージ、および、前記第一のストレージの提供する論理デバイス(以後、外部デバイスと呼ぶ。)と自身が保持する物理デバイスとをホスト計算機に論理デバイスとして提供する第二のストレージを管理する管理サーバであって、
    プロセッサとメモリとを備え、
    前記プロセッサは、前記メモリに格納されているプログラムに従って、
    前記第二のストレージから前記外部デバイスの障害発生の予兆を示す通知を受信すると、当該情報に基づいて、前記障害の影響範囲を移行元として特定する移行元決定処理と、
    前記移行元のデータ容量と当該移行元の予め定められた性能および信頼性レベルの評価とに基づいて、自身が管理する前記第一のストレージおよび前記第二のストレージの範囲でデータの移行先を決定し、前記第二のストレージに前記移行元のデータを前記移行先に移行するよう指示を送出するデータ移行指示送出処理と、を行うこと
    を特徴とする管理サーバ。
  15. 外部のストレージ内のデバイス(以後、外部デバイスと呼ぶ。)を自身のストレージ内のデバイスとして仮想化してホストに提供する手段を備えるストレージであって、
    プロセッサとメモリとを備え、
    前記メモリには、自ストレージが保持する物理デバイスおよび前記外部デバイスを、前記ホストに提供する論理デバイスと対応付けたデバイス構成情報が格納され、
    前記プロセッサは、前記メモリに格納されたプログラムに従って、
    前記ホストから入出力要求を受信すると、前記デバイス構成情報に基づいて前記物理デバイスまたは前記外部デバイスへの入出力処理に変換し、前記変換結果に従って入出力処理を行う入出力処理と、
    前記入出力処理のうち、外部デバイスへの入出力処理中に、当該外部デバイスへのアクセス障害または性能低下の有無を判別する異常検知処理と、
    前記異常検知処理において、アクセス障害または/および性能低下を検出した場合、自身および前記外部ストレージを管理する管理サーバに向けて検出した異常とアクセス対象外部デバイスとを通知する通知処理と、
    前記管理サーバから移行元および移行先を特定したデータ移行の指示を受け付けると、当該指示に従ってデータ移行を行うデータ移行処理と、
    前記データ移行が完了した後、移行後の物理デバイスおよび外部デバイスと、前記論理デバイスとの対応付けに従って、前記デバイス構成情報を更新する構成情報更新処理と、を行うこと
    を特徴とするストレージ。
  16. 請求項15記載のストレージであって、
    前記プロセッサは、
    予め定めた周期でアクセス対象となる前記外部デバイスを決定し、当該外部デバイスに入出力処理を、さらに行うこと
    を特徴とするストレージ。
  17. 1以上の第一のストレージと、第二のストレージと、前記第一のストレージおよび前記第二のストレージに接続する管理サーバとを備える計算機システムにおける障害回避復旧方法であって、
    前記第一のストレージは、
    自身が備える物理デバイスを前記第二のストレージに論理デバイス(以後、外部デバイスと呼ぶ。)として提供する外部デバイス提供手段を備え、
    前記第二のストレージは、
    自身が備える物理デバイスおよび前記外部デバイスとを前記ホストに提供する論理デバイスと対応付けてデバイス構成情報として管理する論理デバイス管理手段を備え、
    前記第二のストレージは、
    前記ホストから入出力要求を受信すると、前記デバイス構成情報に基づいて前記物理デバイスまたは前記外部デバイスへの入出力処理に変換し、
    当該変換結果に従って入出力処理を行い、
    前記入出力処理の対象が、前記外部デバイスの場合、前記第二のストレージが、当該入出力処理中に、当該外部デバイスへのアクセス障害または性能低下の有無を判別し、
    前記判別の結果、前記アクセス障害または/および性能低下を検出した場合、前記管理サーバに向けて検出した異常とアクセス対象外部デバイスとを通知し、
    前記管理サーバは、
    前記第二のストレージから、前記通知を受信すると、当該通知に含まれる情報に基づいて、当該異常により障害が発生する可能性のある範囲を移行元として特定し、
    前記移行元のデータ容量と予め定められた性能および信頼性レベルの評価とに基づいて、自身に接続する前記第一のストレージおよび前記第二のストレージの範囲で移行先を決定し、
    前記第二のストレージに前記移行元のデータを前記移行先に移行するよう指示し、
    前記第二のストレージは、
    前記管理サーバから移行元および移行先を特定したデータ移行の指示を受け付けると、当該指示に従って、前記移行元のデータを前記移行先に移行するデータ移行を行い、
    前記データ移行が完了した後、移行後の物理デバイスおよび外部デバイスと、前記論理デバイスとの対応付けに従って、前記デバイス構成情報を更新すること
    を特徴とする障害回避復旧方法。
  18. 請求項17記載の障害回避復旧方法であって、
    前記外部デバイスは、前記第一のストレージが備える物理デバイスにより構成されたRAIDグループからなり、
    前記第二のストレージは、
    前記入出力処理中に、前記アクセス障害または性能低下の有無に加え、障害の発生そのものの有無を判別し、
    前記判別の結果、障害の発生を検出した場合、前記管理サーバに向けて障害の発生を検出したことおよび障害が発生した外部デバイスを通知し、
    前記管理サーバは、
    前記第二のストレージから障害の発生および前記障害が発生した外部デバイスの通知を受け取ると、当該障害が発生した外部デバイスが属するRAIDグループを構成する他のデバイスが保持するデータを用いて前記障害が発生した外部デバイスのデータを回復するとともに、当該回復したデータを前記移行元として決定すること
    を特徴とする障害回避復旧方法。
  19. 第一のストレージ、および、前記第一のストレージが提供する論理デバイス(以後、外部デバイスと呼ぶ。)と自身の物理デバイスとをホスト計算機に論理デバイスとして提供する第二のストレージを管理する管理サーバが備えるコンピュータを、
    前記第二のストレージから受信した、前記外部デバイスの障害の予兆情報に基づいて、前記障害の影響範囲を移行元として特定する移行元決定手段と、
    前記移行元のデータ容量と予め定められた性能および信頼性レベルの評価とに基づいて、自身が管理する前記第一のストレージおよび前記第二のストレージの範囲で移行先を決定し、前記第二のストレージに前記移行元のデータを前記移行先に移行するよう指示するデータ移行指示手段と、
    として機能させるためのプログラム。
  20. 外部のストレージの論理デバイス(以後、外部デバイスと呼ぶ。)を自身のストレージのデバイスとして仮想化してホストに提供する手段を備えるストレージのコンピュータを、
    自身が保持する物理デバイスおよび前記外部デバイスを、前記ホストに提供する論理デバイスと対応付けてデバイス構成情報として管理する論理デバイス管理手段と、
    前記ホストから入出力要求を受信すると、前記デバイス構成情報に基づいて前記物理デバイスまたは前記外部デバイスへの入出力処理に変換し、前記変換結果に従って入出力処理を行う入出力処理手段と、
    前記入出力処理手段による外部デバイスへの入出力処理中に、当該外部デバイスへのアクセス障害または性能低下の有無を判別する異常検知手段と、
    前記異常検知手段において、アクセス障害または/および性能低下を検出した場合、自身および前記外部ストレージを管理する管理サーバに向けて異常とアクセス対象外部デバイスとを通知する通知手段と、
    前記管理サーバから移行元および移行先を特定したデータ移行の指示を受け付けると、当該指示に従って前記移行元のデータを前記移行先に移行するデータ移行を行うデータ移行手段と、
    して機能させるためのプログラム。
JP2004142179A 2004-05-12 2004-05-12 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法 Pending JP2005326935A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2004142179A JP2005326935A (ja) 2004-05-12 2004-05-12 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法
US10/878,440 US7337353B2 (en) 2004-05-12 2004-06-29 Fault recovery method in a system having a plurality of storage systems
EP04018398A EP1596303A3 (en) 2004-05-12 2004-08-03 Fault recovery method in a system having a plurality of storage systems
US12/003,971 US7603583B2 (en) 2004-05-12 2008-01-04 Fault recovery method in a system having a plurality of storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004142179A JP2005326935A (ja) 2004-05-12 2004-05-12 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法

Publications (1)

Publication Number Publication Date
JP2005326935A true JP2005326935A (ja) 2005-11-24

Family

ID=34926046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004142179A Pending JP2005326935A (ja) 2004-05-12 2004-05-12 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法

Country Status (3)

Country Link
US (2) US7337353B2 (ja)
EP (1) EP1596303A3 (ja)
JP (1) JP2005326935A (ja)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007157060A (ja) * 2005-12-08 2007-06-21 Nec Corp マルチプロセッサシステムと初期立ち上げ方法およびプログラム
JP2007280258A (ja) * 2006-04-11 2007-10-25 Hitachi Ltd 記憶制御装置
JP2007310495A (ja) * 2006-05-16 2007-11-29 Hitachi Ltd 計算機システム
JP2008084253A (ja) * 2006-09-29 2008-04-10 Hitachi Ltd ボリューム選択方法及び情報処理システム
JP2009223879A (ja) * 2007-12-12 2009-10-01 Huawei Technologies Co Ltd ネットワーク記憶デバイスおよびデータ読み取り書き込み制御方法
JP2010055209A (ja) * 2008-08-26 2010-03-11 Hitachi Ltd 論理ボリュームのデータ移動方法とストレージシステムおよび管理計算機
US7734957B2 (en) 2006-09-28 2010-06-08 Hitachi, Ltd. Highly reliable storage system and internal network thereof
JP2010257095A (ja) * 2009-04-23 2010-11-11 Hitachi Ltd データ移行システムおよびデータ移行方法
US7873880B2 (en) 2006-12-26 2011-01-18 Fujitsu Limited Data relay device, storage device, and response delay monitoring method
JP2012238133A (ja) * 2011-05-11 2012-12-06 Dainippon Printing Co Ltd データ保管システム
EP2680126A2 (en) 2012-06-27 2014-01-01 Fujitsu Limited Storage virtualization apparatus, storage virtualization method and storage virtualization program
JP2014164401A (ja) * 2013-02-22 2014-09-08 Nec Corp ストレージシステム
JP2015172958A (ja) * 2015-05-14 2015-10-01 株式会社日立製作所 情報記憶システム
WO2017212514A1 (ja) * 2016-06-06 2017-12-14 株式会社日立製作所 ストレージシステム及び記憶制御方法
JP2020021277A (ja) * 2018-07-31 2020-02-06 株式会社日立製作所 情報処理システム、情報処理システムの管理方法及びプログラム
US10606490B2 (en) 2017-08-17 2020-03-31 Fujitsu Limited Storage control device and storage control method for detecting storage device in potential fault state
JP2021135595A (ja) * 2020-02-25 2021-09-13 東芝テック株式会社 情報処理装置およびプログラム
JP2022003556A (ja) * 2018-10-17 2022-01-11 株式会社日立製作所 ストレージシステム及びストレージシステムにおけるデータ配置方法
JP2023183886A (ja) * 2022-06-16 2023-12-28 株式会社日立製作所 ストレージシステム及び不正アクセス検知方法

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006036812A2 (en) * 2004-09-22 2006-04-06 Xyratex Technology Limited System and method for network performance monitoring and predictive failure analysis
US7571224B2 (en) * 2004-10-29 2009-08-04 International Business Machines Corporation Method for using presence in a system management environment
JP4596889B2 (ja) * 2004-11-08 2010-12-15 株式会社日立製作所 ストレージシステムの管理方法
US7228371B2 (en) * 2004-11-16 2007-06-05 John Roger Schneider Computer workstation automated analysis system and upgrade determination tool
JP4441929B2 (ja) * 2005-01-19 2010-03-31 日本電気株式会社 ディスク装置及びホットスワップ方法
JP4699808B2 (ja) * 2005-06-02 2011-06-15 株式会社日立製作所 ストレージシステム及び構成変更方法
JP4769805B2 (ja) * 2005-07-29 2011-09-07 株式会社サイバー・ソリューションズ ネットワーク管理システム及びネットワーク管理情報収集方法
JP4640071B2 (ja) * 2005-09-21 2011-03-02 富士通株式会社 情報処理装置、情報処理復旧方法及び情報処理復旧プログラム
US7770057B1 (en) * 2005-10-27 2010-08-03 Symantec Operating Corporation System and method for customized disaster recovery reports
JP4920391B2 (ja) * 2006-01-06 2012-04-18 株式会社日立製作所 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
US7711711B1 (en) * 2006-03-29 2010-05-04 Emc Corporation Networked storage system employing information lifecycle management in conjunction with a distributed global file system
US7694171B2 (en) * 2006-11-30 2010-04-06 Lsi Corporation Raid5 error recovery logic
JP2009163562A (ja) * 2008-01-08 2009-07-23 Fujitsu Ltd ストレージシステム、ストレージシステムの制御部、ストレージシステムの制御方法
JP5091704B2 (ja) * 2008-02-06 2012-12-05 株式会社日立製作所 ストレージ構成回復方法及びストレージ管理システム
US8185784B2 (en) * 2008-04-28 2012-05-22 Lsi Corporation Drive health monitoring with provisions for drive probation state and drive copy rebuild
US8615678B1 (en) 2008-06-30 2013-12-24 Emc Corporation Auto-adapting multi-tier cache
JP2010097385A (ja) * 2008-10-16 2010-04-30 Fujitsu Ltd データ管理プログラム、ストレージ装置診断プログラム、およびマルチノードストレージシステム
JP2010186285A (ja) * 2009-02-12 2010-08-26 Fujitsu Ltd ミラーリング制御装置、ストレージ装置、ミラーリング制御方法
US20100274966A1 (en) * 2009-04-24 2010-10-28 Hitachi, Ltd. High availabilty large scale it systems with self recovery functions
US8479040B2 (en) 2009-09-02 2013-07-02 Hitachi, Ltd. Storage system and control method
US8645750B2 (en) * 2010-03-04 2014-02-04 Hitachi, Ltd. Computer system and control method for allocation of logical resources to virtual storage areas
US9682324B2 (en) 2010-05-12 2017-06-20 Activision Publishing, Inc. System and method for enabling players to participate in asynchronous, competitive challenges
US8463995B2 (en) 2010-07-16 2013-06-11 Hitachi, Ltd. Storage control apparatus and storage system comprising multiple storage control apparatuses
WO2012053026A1 (en) * 2010-10-18 2012-04-26 Hitachi, Ltd. Data storage apparatus and power control method therefor
US8707111B2 (en) * 2011-02-09 2014-04-22 Ebay Inc. High-volume distributed script error handling
CN103502951B (zh) * 2011-03-23 2016-12-07 日本电气株式会社 操作管理系统、操作管理方法及其程序
JP5845712B2 (ja) * 2011-08-17 2016-01-20 富士通株式会社 中継装置および中継方法
US8707107B1 (en) * 2011-12-09 2014-04-22 Symantec Corporation Systems and methods for proactively facilitating restoration of potential data failures
WO2013190649A1 (ja) * 2012-06-20 2013-12-27 富士通株式会社 仮想ディスクのマイグレーションに関する情報処理方法及び装置
US9274917B2 (en) * 2012-07-30 2016-03-01 Hewlett Packard Enterprise Development Lp Provisioning resources in a federated cloud environment
US9582385B2 (en) * 2013-01-16 2017-02-28 Dell Products L.P. Surviving write errors by using copy-on-write to another system
US9026863B2 (en) * 2013-01-17 2015-05-05 Dell Products, L.P. Replacement of storage responsive to remaining life parameter
US9081753B2 (en) * 2013-03-14 2015-07-14 Microsoft Technology Licensing, Llc Virtual disk recovery and redistribution
US9280431B2 (en) * 2013-04-17 2016-03-08 Globalfoundries Inc. Prioritizing backups on a disk level within enterprise storage
US9565250B2 (en) * 2014-05-30 2017-02-07 Microsoft Technology Licensing, Llc Data transfer service
US9519556B2 (en) 2014-09-09 2016-12-13 Dell Products, Lp Member replacement in an array of information storage devices
US10471348B2 (en) 2015-07-24 2019-11-12 Activision Publishing, Inc. System and method for creating and sharing customized video game weapon configurations in multiplayer video games via one or more social networks
US10313212B2 (en) * 2015-09-22 2019-06-04 Veniam, Inc. Systems and methods for detecting and classifying anomalies in a network of moving things
US10089178B2 (en) * 2016-02-29 2018-10-02 International Business Machines Corporation Developing an accurate dispersed storage network memory performance model through training
US10572323B1 (en) * 2017-10-24 2020-02-25 EMC IP Holding Company LLC Predicting physical storage unit health
WO2019123457A2 (en) * 2017-12-19 2019-06-27 Isra-Juk Electronics Ltd. System and method for monitoring activity over time-domain of electrical devices
CN109002031B (zh) * 2018-06-26 2020-06-30 卡斯柯信号有限公司 一种应用于监测系统设备故障诊断及智能预警的方法
EP3796149B1 (en) * 2018-07-17 2024-02-21 Huawei Technologies Co., Ltd. Method and device for processing i/o request
US11442826B2 (en) * 2019-06-15 2022-09-13 International Business Machines Corporation Reducing incidents of data loss in raid arrays having the same raid level
US11922043B2 (en) * 2021-06-08 2024-03-05 EMC IP Holding Company LLC Data migration between storage systems

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08249133A (ja) * 1994-12-15 1996-09-27 Internatl Business Mach Corp <Ibm> ディスク・ドライブ・アレイの故障対策の方法及びシステム
US5680640A (en) 1995-09-01 1997-10-21 Emc Corporation System for migrating data by selecting a first or second transfer means based on the status of a data element map initialized to a predetermined state
JP3671595B2 (ja) * 1997-04-01 2005-07-13 株式会社日立製作所 複合計算機システムおよび複合i/oシステム
JPH11345095A (ja) * 1998-06-02 1999-12-14 Toshiba Corp ディスクアレイ装置およびその制御方法
US6332204B1 (en) * 1999-03-31 2001-12-18 International Business Machines Corporation Recovering and relocating unreliable disk sectors when encountering disk drive read errors
US6460151B1 (en) * 1999-07-26 2002-10-01 Microsoft Corporation System and method for predicting storage device failures
US6571354B1 (en) * 1999-12-15 2003-05-27 Dell Products, L.P. Method and apparatus for storage unit replacement according to array priority
US6598174B1 (en) * 2000-04-26 2003-07-22 Dell Products L.P. Method and apparatus for storage unit replacement in non-redundant array
US6996742B2 (en) * 2000-11-28 2006-02-07 Sedna Patent Services, Llc Method for regenerating and streaming content from a video server using RAID 5 data striping
US7120832B2 (en) * 2001-09-27 2006-10-10 Hewlett-Packard Development Company, L.P. Storage device performance monitor
US6880101B2 (en) * 2001-10-12 2005-04-12 Dell Products L.P. System and method for providing automatic data restoration after a storage device failure
US7146522B1 (en) * 2001-12-21 2006-12-05 Network Appliance, Inc. System and method for allocating spare disks in networked storage
JP2003345531A (ja) * 2002-05-24 2003-12-05 Hitachi Ltd ストレージシステム、管理サーバ、及びそのアプリケーションの管理方法
JP4202709B2 (ja) * 2002-10-07 2008-12-24 株式会社日立製作所 ストレージ装置を有するネットワークにおける、ボリューム及び障害管理方法
US6892276B2 (en) * 2002-11-26 2005-05-10 Lsi Logic Corporation Increased data availability in raid arrays using smart drives
US7434097B2 (en) * 2003-06-05 2008-10-07 Copan System, Inc. Method and apparatus for efficient fault-tolerant disk drive replacement in raid storage systems
US7373559B2 (en) * 2003-09-11 2008-05-13 Copan Systems, Inc. Method and system for proactive drive replacement for high availability storage systems
JP2005100259A (ja) * 2003-09-26 2005-04-14 Hitachi Ltd ドライブの2重障害を防止するアレイ型ディスク装置、プログラム、及び方法
JP2005122338A (ja) * 2003-10-15 2005-05-12 Hitachi Ltd スペアディスクドライブをもつディスクアレイ装置及びデータスペアリング方法
JP4426262B2 (ja) * 2003-11-26 2010-03-03 株式会社日立製作所 ディスクアレイ装置及びディスクアレイ装置の障害回避方法
US7251709B2 (en) * 2003-12-03 2007-07-31 Hitachi Global Storage Technologies Netherlands Bv Storage device having a lateral storage director
JP4634049B2 (ja) * 2004-02-04 2011-02-16 株式会社日立製作所 ディスクアレイ装置における異常通知制御
US20050193273A1 (en) * 2004-02-18 2005-09-01 Xiotech Corporation Method, apparatus and program storage device that provide virtual space to handle storage device failures in a storage system
US7313721B2 (en) * 2004-06-21 2007-12-25 Dot Hill Systems Corporation Apparatus and method for performing a preemptive reconstruct of a fault-tolerant RAID array

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007157060A (ja) * 2005-12-08 2007-06-21 Nec Corp マルチプロセッサシステムと初期立ち上げ方法およびプログラム
JP2007280258A (ja) * 2006-04-11 2007-10-25 Hitachi Ltd 記憶制御装置
JP2007310495A (ja) * 2006-05-16 2007-11-29 Hitachi Ltd 計算機システム
US7734957B2 (en) 2006-09-28 2010-06-08 Hitachi, Ltd. Highly reliable storage system and internal network thereof
JP2008084253A (ja) * 2006-09-29 2008-04-10 Hitachi Ltd ボリューム選択方法及び情報処理システム
US8566548B2 (en) 2006-09-29 2013-10-22 Hitachi, Ltd. Volume selection method and information processing system
US7873880B2 (en) 2006-12-26 2011-01-18 Fujitsu Limited Data relay device, storage device, and response delay monitoring method
JP2009223879A (ja) * 2007-12-12 2009-10-01 Huawei Technologies Co Ltd ネットワーク記憶デバイスおよびデータ読み取り書き込み制御方法
JP2010055209A (ja) * 2008-08-26 2010-03-11 Hitachi Ltd 論理ボリュームのデータ移動方法とストレージシステムおよび管理計算機
JP2010257095A (ja) * 2009-04-23 2010-11-11 Hitachi Ltd データ移行システムおよびデータ移行方法
JP2012238133A (ja) * 2011-05-11 2012-12-06 Dainippon Printing Co Ltd データ保管システム
EP2680126A2 (en) 2012-06-27 2014-01-01 Fujitsu Limited Storage virtualization apparatus, storage virtualization method and storage virtualization program
US9367492B2 (en) 2012-06-27 2016-06-14 Fujitsu Limited Storage virtualization apparatus causing access request process to be delayed based on incomplete count and storage virtualization method
JP2014164401A (ja) * 2013-02-22 2014-09-08 Nec Corp ストレージシステム
JP2015172958A (ja) * 2015-05-14 2015-10-01 株式会社日立製作所 情報記憶システム
WO2017212514A1 (ja) * 2016-06-06 2017-12-14 株式会社日立製作所 ストレージシステム及び記憶制御方法
US10606490B2 (en) 2017-08-17 2020-03-31 Fujitsu Limited Storage control device and storage control method for detecting storage device in potential fault state
JP2020021277A (ja) * 2018-07-31 2020-02-06 株式会社日立製作所 情報処理システム、情報処理システムの管理方法及びプログラム
US11221935B2 (en) 2018-07-31 2022-01-11 Hitachi, Ltd. Information processing system, information processing system management method, and program thereof
JP2022003556A (ja) * 2018-10-17 2022-01-11 株式会社日立製作所 ストレージシステム及びストレージシステムにおけるデータ配置方法
JP7140898B2 (ja) 2018-10-17 2022-09-21 株式会社日立製作所 ストレージシステム及びストレージシステムにおけるデータ配置方法
JP2021135595A (ja) * 2020-02-25 2021-09-13 東芝テック株式会社 情報処理装置およびプログラム
JP2023183886A (ja) * 2022-06-16 2023-12-28 株式会社日立製作所 ストレージシステム及び不正アクセス検知方法
JP7436567B2 (ja) 2022-06-16 2024-02-21 株式会社日立製作所 ストレージシステム及び不正アクセス検知方法

Also Published As

Publication number Publication date
US20050268147A1 (en) 2005-12-01
US20080109546A1 (en) 2008-05-08
US7603583B2 (en) 2009-10-13
US7337353B2 (en) 2008-02-26
EP1596303A2 (en) 2005-11-16
EP1596303A3 (en) 2008-12-17

Similar Documents

Publication Publication Date Title
JP2005326935A (ja) 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法
US7546414B2 (en) Computer system, storage system, and device control method
US7480780B2 (en) Highly available external storage system
US7779170B2 (en) Storage area network system
US7467275B2 (en) Capacity expansion volume migration method
JP4842593B2 (ja) ストレージ仮想化装置のデバイス制御引継ぎ方法
US8607230B2 (en) Virtual computer system and migration method of virtual computer
CN101571815B (zh) 信息系统及i/o处理方法
US8683482B2 (en) Computer system for balancing access load of storage systems and control method therefor
US8595436B2 (en) Virtual storage system and control method thereof
JP2007072571A (ja) 計算機システム及び管理計算機ならびにアクセスパス管理方法
US20150234709A1 (en) Storage controller, storage system, and control method
US9823955B2 (en) Storage system which is capable of processing file access requests and block access requests, and which can manage failures in A and storage system failure management method having a cluster configuration
JP2008040571A (ja) 仮想ストレージシステムの構成要素となることが可能なストレージシステムの制御装置
JP2007128437A (ja) ディスクアレイ装置及びその経路障害検出方法
US7478267B2 (en) Access control device and interface installed in same
JP2008112399A (ja) ストレージ仮想化スイッチおよびコンピュータシステム
US20090198942A1 (en) Storage system provided with a plurality of controller modules
US20080288671A1 (en) Virtualization by multipath management software for a plurality of storage volumes
US7886186B2 (en) Storage system and management method for the same
JP6810341B2 (ja) 管理装置、情報処理システムおよび管理プログラム
US11308122B2 (en) Remote copy system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090818

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091019

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100105