JP2006313410A - ストレージネットワークの管理情報管理方法、ストレージ管理システム及びストレージ管理ソフトウェア - Google Patents

ストレージネットワークの管理情報管理方法、ストレージ管理システム及びストレージ管理ソフトウェア Download PDF

Info

Publication number
JP2006313410A
JP2006313410A JP2005134881A JP2005134881A JP2006313410A JP 2006313410 A JP2006313410 A JP 2006313410A JP 2005134881 A JP2005134881 A JP 2005134881A JP 2005134881 A JP2005134881 A JP 2005134881A JP 2006313410 A JP2006313410 A JP 2006313410A
Authority
JP
Japan
Prior art keywords
management
storage
information
business host
host device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005134881A
Other languages
English (en)
Inventor
Kenji Tamura
賢司 田村
Akihiro Okazaki
章浩 岡▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005134881A priority Critical patent/JP2006313410A/ja
Priority to US11/166,075 priority patent/US20060253569A1/en
Publication of JP2006313410A publication Critical patent/JP2006313410A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0784Routing of error reports, e.g. with a specific transmission path or data flow
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • H04L67/125Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks involving control of end-device applications over a network

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】新たな遠隔保守回線を敷設することなく、ストレージネットワークを遠隔保守する。
【解決手段】ストレージネットワークは、ストレージシステム800を管理するとともに遠隔保守回線420を経由して管理センタ900に接続する管理端末160に、複数の業務用ホスト装置200又は管理用サーバ700が管理用LAN410を介して接続している。業務用ホスト装置200又は管理サーバ700は、管理用LAN410経由で管理端末160に管理情報を送信する。管理端末160は、業務用ホスト装置200又は管理サーバ700から取得した管理情報を遠隔保守回線420経由で管理センタ900に送信する。
【選択図】図1

Description

本発明はストレージネットワークの管理情報管理方法、ストレージ管理システム及びストレージ管理ソフトウェアに関する。
近年、大量のデータを管理するためのストレージシステムとして、ディスアレイ装置等が用いられている。ディスクアレイ装置は、多数の記憶デバイスをアレイ状に配設して構成されるもので、例えば、RAID(Redundant Arrays of Independent Inexpensive Disks)に基づく記憶領域を提供する。近年、SAN(Storage Area Network)環境の普及とともに、ストレージシステムの統合が急速に進められている。SAN環境においては、複数のストレージシステムが高速のFC(Fibre Channel)スイッチを介して複数の業務用ホスト装置に接続される形態となり、SAN構成の容易な管理、障害の早期検出と迅速な対処、適切なアクセス制御によるセキュリティ確保といった、運用管理が求められている。ストレージネットワークを管理するためのストレージ管理ソフトウェアは、例えば、業務用ホスト装置や、専用の管理用サーバに実装されている。例えば、特許文献1には、サーバの遠隔保守技術が提案されている。
特開平11−167504号公報
ところで、従来では、ストレージネットワークに障害が生じると、障害原因を解析するために、サポートエンジニアが現地に赴き、障害情報の収集作業を行っていた。しかし、障害発生地が外国などの遠隔地である場合は、迅速な対応が困難となる。また、遠隔地での障害原因を迅速に解析するために、業務用ホスト装置と管理センタとを接続する遠隔保守回線を新たに敷設すると、コストが高騰する。また、このような遠隔保守回線の敷設はセキュリティ上の観点から顧客が望まない場合も想定される。
そこで、本発明は、新たな遠隔保守回線を敷設することなく、ストレージネットワークを遠隔保守するための技術を提案することを課題とする。
本発明が適用されるストレージネットワークは、ストレージシステムを管理するとともに遠隔保守回線を経由して管理センタに接続する管理端末に複数の業務用ホスト装置又は管理用サーバが管理用通信回線を介して接続している。
本発明のストレージネットワークの管理情報管理方法は、業務用ホスト装置又は管理サーバの管理情報を管理用通信回線経由で管理端末に送信するステップと、管理端末が業務用ホスト装置又は管理サーバから取得した管理情報を遠隔保守回線経由で管理センタに送信するステップと、を備える。管理用通信回線は、複数の業務用ホスト装置、管理用サーバ、及び管理端末を接続する保守回線として、従来から用いられているので、新たな回線を敷設することなく、ストレージネットワークの遠隔保守が可能になる。ここで、管理情報には、例えば、ストレージネットワークの障害情報、構成情報、稼働情報、性能情報等が含まれる。
管理用サーバは、例えば、複数の業務用ホスト装置のそれぞれの管理情報を集約し、その管理情報を管理用通信回線経由で管理端末に送信する。これにより、管理情報を一元管理することができるので、遠隔保守回線の回線容量が少ない場合でも、例えば、障害解析に有用な障害情報を抽出して管理端末に送信することができる。
本発明のストレージ管理ソフトウェアは、業務用ホスト装置又は管理サーバの管理情報を管理用通信回線経由で管理端末に送信するステップを業務用ホスト装置又は管理用サーバに実行させる。このストレージ管理ソフトウェアは、例えば、業務用ホスト装置又は管理サーバにインストールされていてもよく、或いは記録媒体に格納されていてもよい。記録媒体として、例えば、光記録媒体(CD−RAM、CD−ROM、DVD−RW、DVD−ROM、DVD−R、PDディスク、MDディスク、MOディスク等の光学的にデータの読み取りが可能な記録媒体)や、磁気記録媒体(フレキシブルディスク、磁気カード、磁気テープ等の磁気的にデータの読み取りが可能な記録媒体)、或いはメモリ素子(DRAM等の半導体メモリ素子、FRAM等の強誘電体メモリ素子等)などを用いることができる。
本発明によれば、新たな遠隔保守回線を敷設することなく、ストレージネットワークを遠隔保守することができる。
以下、各図を参照して、本発明の実施形態について説明する。
図1は本実施形態に係るストレージ管理システム10の概略構成を示している。ストレージ管理システム10は、ストレージネットワーク(ストレージシステム800、通信ネットワーク170或いはその他のネットワークコンポーネント等)の障害発生を監視するとともに、障害発生時には障害情報を管理センタ900に送信する機能を備えたシステムである。同システム10は、更に、ストレージシステム800及び業務用ホスト装置200の性能管理や、ストレージシステム800の構成情報の管理等も行う。同システム10は、主に、ストレージ管理ソフトウェア(ストレージ管理プログラム)500、管理用LAN(管理用通信回線)410、及び管理端末160を備えている。ストレージ管理ソフトウェア500は、例えば、業務用ホスト装置200又は管理用サーバ700に実装される。
業務用ホスト装置200は、例えば、銀行の自動預金預け払いシステムや、航空機の座席予約システム等の業務用計算機であり、具体的には、パーソナルコンピュータ、ワークステーション、或いはメインフレームコンピュータ等である。ストレージシステム800は、業務用ホスト装置200に対して、記憶資源を提供する。業務用ホスト装置200からストレージシステム800へのデータの入出力要求は、通信ネットワーク170を介して行われる。各々のストレージシステム800には、管理端末160が備え付けられている。業務用ホスト装置200、管理用サーバ700、及び管理端末160は、管理用LAN(内部LAN)410を介して相互に接続されている。更に、管理端末160は、遠隔保守用回線420を介して管理センタ900に接続されている。尚、業務用ホスト装置200、管理用サーバ700及びストレージシステム800のそれぞれは、単数でもよく、或いは複数でもよい。
管理センタ900は、ストレージシステム800及び通信ネットワーク170等を管理するための施設である。管理センタ900には、サポートエンジニアが待機しており、ストレージ管理システム10から送られてくる障害情報を収集し、障害解析を行う。遠隔保守回線420としては、例えば、インターネット回線や電話回線等を用いることができる。
図2はストレージシステム800を中心とするシステム構成を示している。説明の便宜上、ストレージシステム800の台数を一台としている。ストレージシステム800は、主に、ディスク制御部100と、記憶装置300とから構成される。ディスク制御部100は、例えば、業務用ホスト装置200から受信したコマンドに従って、記憶装置300へのデータの入出力制御を行う。また、ディスク制御部100は、例えば、管理用サーバ700から受信したコマンドに従って、ストレージシステム800の構成情報の設定又は変更等の各種の処理を行う。
業務用ホスト装置200は、通信ネットワーク170を介してディスク制御部100と通信可能に接続されている。通信ネットワーク170として、例えば、SAN(Storage Area Network)が用いられる場合、業務用ホスト装置200と記憶装置300との間では、ブロック単位でのデータ入出力処理が行われる。SANを介して業務用ホスト装置200とディスク制御部100との間で行われる通信プロトコルは、例えば、ファイバチャネルプロトコルである。
もとより、業務用ホスト装置200とディスク制御部100との間は、必ずしも、SANを介して接続されている必要はなく、例えば、LAN(Local Area Network)を介して接続されていてもよく、或いはネットワークを介さずに直接に接続されていてもよい。業務用ホスト装置200とディスク制御部100とがLANを介して接続される場合には、例えば、TCP/IP(Transmission Control Protocol/Internet Protocol)に従って、通信を行うこともできる。業務用ホスト装置200とディスク制御部100との間を、ネットワークを介さずに直接に接続する場合には、例えば、FICON(Fibre Connection)(登録商標)、ESCON(Enterprise System Connection) (登録商標)、ACONARC(Advanced Connection Architecture)(登録商標)、FIBARC(Fibre Connection Architecture)(登録商標)等の通信プロトコルに従って、通信を行ってもよい。
管理用サーバ700は管理用LAN410を介して管理端末160と接続されている。管理用LAN410は、例えば、インターネット或いは専用線等で構成される。管理用LAN410を介して行われる、管理用サーバ700と管理端末160との間の通信は、例えば、TCP/IP等の通信プロトコルによって行われる。
記憶装置300は、複数の物理ディスクドライブ330を備えている。物理ディスクドライブ330は、例えば、ATA(Advanced Technology Attachment)ディスクドライブ、SCSI(Small Computer System Interface)ディスクドライブ、ファイバチャネルディスクドライブ等のハードディスクドライブである。アレイ状に配列された複数のディスクドライブによって、RAID(Redundant Arrays of Inexpensive Disks)を構成することも可能である。また、物理ディスクドライブ330により提供される物理的な記憶領域である物理ボリュームには、論理的な記憶領域であるLDEV(Logical Device)を設定することができる。
ディスク制御部100と記憶装置300との間は、ネットワークを介さずに直接に接続されていてもよく、或いはネットワークを介して接続されていてもよい。或いは、記憶装置300とディスク制御部100は一体的に構成されていてもよい。
ディスク制御部100は、複数のチャネル制御部110、共有メモリ120、キャッシュメモリ130、複数のディスク制御部140、管理端末160、及び接続部150を備える。
ディスク制御部100は、チャネル制御部110による通信制御により、業務用ホスト装置200と通信を行う。チャネル制御部110は、業務用ホスト装置200との間で通信を行うための通信インターフェースを備えており、業務用ホスト装置200との間でデータ入出力コマンド等を授受する機能を備える。各々のチャネル制御部110は、管理端末160と共に内部LAN(共有バス)151を介して接続されている。これにより、チャネル制御部110に実行させるマイクロプログラム等を管理端末160からインストールすることが可能である。
接続部150は、チャネル制御部110、共有メモリ120、キャッシュメモリ130、ディスク制御部140、及び管理端末160を相互に接続する。チャネル制御部110、共有メモリ120、キャッシュメモリ130、ディスク制御部140、及び管理端末160の間におけるデータやコマンドの授受は、接続部150を介して行われる。接続部150は、例えば、クロスバスイッチ等で構成される。
共有メモリ120とキャッシュメモリ130は、それぞれチャネル制御部110とディスク制御部140とによって共有されるメモリ装置である。共有メモリ120は、主として、ストレージシステム800の構成情報等を記憶するために利用される。キャッシュメモリ130は、主として、物理ディスク330に読み書きされるデータを一時的に記憶するために利用される。
例えば、あるチャネル制御部110が業務用ホスト装置200から受信したデータ入出力要求が書き込みコマンドであった場合には、そのチャネル制御部110は、書き込みコマンドを共有メモリ120に書き込むと共に、業務用ホスト装置200から受信した書き込みデータをキャッシュメモリ130に書き込む。一方、ディスク制御部140は、共有メモリ120を常時監視しており、共有メモリ120に書き込みコマンドが書き込まれたことを検出すると、その書き込みコマンドに従って、キャッシュメモリ130からダーティデータを読み出して、これを物理ディスクドライブ300にデステージする。
また、あるチャネル制御部110が業務用ホスト装置200から受信したデータ入出力要求が読み出しコマンドであった場合には、読み出し対象となるデータがキャッシュメモリ130に存在するかどうかをチェックする。ここで、読み出し対象となるデータがキャッシュメモリ130に存在すれば、チャネル制御部110は、そのデータをキャッシュメモリ130から読み取って、業務用ホスト装置200に送信する。一方、読みだし対象となるデータがキャッシュメモリ130に存在しない場合には、チャネル制御部110は、読み出しコマンドを共有メモリ120に書き込む。ディスク制御部140は、共有メモリ120を常時監視しており、読み出しコマンドが共有メモリ120に書き込まれたことを検出すると、ディスク制御部140は、記憶装置300から読みだし対象となるデータを読み出して、これをキャッシュメモリ130に書き込むと共に、読み出し対象データをキャッシュメモリ130に書き込んだ旨を共有メモリ120に書き込む。すると、チャネル制御部110は、読みだし対象となるデータがキャッシュメモリ130に書き込まれたことを検出し、そのデータをキャッシュメモリ130から読み出して、業務用ホスト装置200に送信する。
このように、チャネル制御部110とディスク制御部140との間では、キャッシュメモリ130を介してデータの授受が行われる。キャッシュメモリ130には、物理ディスクドライブ330に格納されるデータのうち、チャネル制御部110やディスク制御部140によって、読み書きされるデータが一時的に書き込まれる。
尚、チャネル制御部110からディスク制御部140に対するデータの書き込みや、読み出しの指示を、共有メモリ120を介在させて間接的に行う構成の他、例えば、チャネル制御部110からディスク制御部140に対して、データの書き込みや読み出しの指示を、共有メモリ120を介さずに直接に行う構成とすることもできる。或いは、チャネル制御部110にディスク制御部140の機能を持たせて、データの入出力を制御することもできる。
ディスク制御部140は、データを記憶する複数の物理ディスクドライブ330と通信可能に接続され、記憶装置300の制御を行う。例えば、上述のように、チャネル制御部110が業務用ホスト装置200から受信したデータ入出力要求に応じて、物理ディスクドライブ330に対してデータの読み書きを行う。各ディスク制御部140は、管理端末160と共に、内部LAN151で接続されており、相互に通信を行うことが可能である。これにより、ディスク制御部140に実行させるマイクロプログラム等を管理端末160から送信しインストールすることが可能となっている。
尚、上述したチャネル制御部110、ディスク制御部140、接続部150、共有メモリ120、及びキャッシュメモリ130のうち何れか二以上のハードウェアが一体的に構成されていてもよい。
管理端末160は、ストレージシステム800を管理するためのコンピュータである。システム管理者は、管理端末160を操作することにより、例えば、物理ディスクドライブ330の構成の設定、業務用ホスト装置200とチャネル制御部110との間のパスの設定、チャネル制御部110やディスク制御部140において実行されるマイクロプログラムのインストール等を行うことができる。ここで、物理ディスクドライブ330の構成の設定とは、例えば、物理ディスクドライブ330の増設或いは減設、RAID構成の変更(例えば、RAID1からRAID5への変更)等をいう。更に、管理端末160からは、ストレージシステム800の動作状態の確認や、故障部位の特定、チャネル制御部110で実行されるオペレーティングシステムのインストール等の作業を行うことも可能である。これら各種の設定や制御は、管理端末160が備えるユーザインターフェースを通じて行うことができる。
管理端末160は、ディスク制御部100に内蔵してもよく、或いは外付けの構成としてもよい。また、管理端末160は、ディスク制御部100及び記憶装置300の管理専用に用意されたコンピュータでもよく、或いは汎用のコンピュータにストレージシステム800の管理機能を実装させたものでもよい。
図3は業務用ホスト装置200のシステム構成を示している。業務用ホスト装置200は、CPU201、メモリ202、インターフェース部203、ローカルディスク204、入力デバイス205、及び出力デバイス206を備えて構成されている。メモリ202には、業務用のアプリケーションプログラム850と、ストレージ管理ソフトウェア500が実装されている。CPU201は、メモリ202に実装されたアプリケーションプログラム850に基づいて、銀行の自動預金預け払い等の処理を行う他、ストレージ管理ソフトウェア500に基づいて、ストレージシステム800、通信ネットワーク170或いはその他のネットワークコンポーネント等の管理を行う。インターフェース部203は、管理用LAN410の通信インターフェースと、通信ネットワーク170に接続する通信インターフェースとを備えている。ローカルディスク204には、業務用ホスト装置200が業務を行う上で必要な情報や、ストレージシステム800を管理する上で必要な各種の情報が格納されている。入力デバイス205は、例えば、キーボード、マウス等である。出力デバイス206は、例えば、ディスプレイ、プリンタ等である。
図4は管理端末160のシステム構成を示している。管理端末160は、CPU161、メモリ162、インターフェース部163、ローカルディスク164、入力デバイス165、及び出力デバイス166を備えて構成されている。CPU161は、メモリ162に実装された遠隔保守ソフトウェア600に基づいて、ストレージシステム800の遠隔保守を行う。管理端末160が行う遠隔保守の詳細については後述する。インターフェース部163は、管理用LAN410と内部LAN151の通信インターフェースを備えており、管理用LAN410を介して管理用サーバ700から発行された各種の管理コマンドを受信する機能や、内部LAN151を介して共有メモリ120内の構成情報にアクセスする機能などを有する。ローカルディスク164には、ストレージシステム800を管理する上で必要な各種の情報が格納されている。入力デバイス165は、例えば、キーボード、マウス等である。システム管理者は、入力デバイス165を入力操作して、ストレージシステム800の管理等を行う。出力デバイス166は、例えば、ディスプレイ、プリンタ等である。
図5は管理用サーバ700のシステム構成を示している。管理用サーバ700は、CPU701、メモリ702、インターフェース部703、ローカルディスク704、入力デバイス705、及び出力デバイス706を備えて構成されている。CPU701は、メモリ702に実装されたストレージ管理ソフトウェア500に基づいて、ストレージシステム800及び通信ネットワーク170等の管理を行う。インターフェース部703は、管理用LAN410の通信インターフェースを備えており、管理用LAN410を介して管理端末160へ各種の管理コマンドを送信することができる。ローカルディスク704には、ストレージシステム800を管理する上で必要な各種の情報が格納されている。入力デバイス705は、例えば、キーボード、マウス等である。出力デバイス706は、例えば、ディスプレイ、プリンタ等である。
図6は管理用サーバ700における障害監視、及び障害情報収集処理の概要を示している。ストレージ管理ソフトウェア500は、ストレージシステム800、通信ネットワーク170或いはその他のネットワークコンポーネント等の遠隔保守を行うモジュールとして、遠隔保守コンポーネント510を備えている。遠隔保守コンポーネント510は、ストレージシステム800、通信ネットワーク170或いはその他のネットワークコンポーネント等の障害発生を監視する。ストレージシステム800の障害として、例えば、ストレージシステム800のハードウェア(例えば、共有メモリ120、キャッシュメモリ130、ディスク制御部140、物理ディスクドライブ330等)の障害、業務用ホスト装置200とチャネル制御部110との間のアクセスパスの障害(例えば、リード/ライト失敗、ファイバチャネルパスの断線、ホストバスアダプタの障害、ネットワークコンポーネント(スイッチ又はハブ等)の障害等)、ストレージシステム800の構成情報(例えば、ディスク制御に用いられる各種のテーブル等)の設定変更ミス等がある。ストレージ管理ソフトウェア500自体の障害として、例えば、ストレージ管理ソフトウェア500の内部エラー、後述するマネージャー500Mとエージェント500Aとの間の通信エラー、ストレージ管理ソフトウェア500とストレージシステム800との間の通信エラー、コマンドの失敗(バックアップの失敗、構成変更の失敗等)等がある。
遠隔保守コンポーネント510は、障害発生を検出すると、障害情報収集モジュール520を起動させて、障害情報20を収集し、これをローカルディスク704に格納する。障害情報20としては、障害解析に利用される情報であれば、特に限定されるものではなく、例えば、ログ情報でもよく、或いは障害の類型毎に予めコード化された情報を用いてもよい。障害情報20を収集するタイミングとしては、できるだけ障害情報20が不足しないように、ログがラップしないタイミングが望ましい。障害情報20の格納先としては、例えば、メモリ702でもよい。遠隔保守コンポーネント510は、管理用LAN410を経由して、障害情報20を管理端末160のローカルディスク164の特定のディレクトリに格納する。管理端末160が複数存在する場合は、予め定められた管理端末160のローカルディスク164に障害情報20を書き込んでもよく、或いは障害情報20を管理用LAN410に送信する時点で選択した管理端末160のローカルディスク164に書き込んでもよい。遠隔保守回線420は、一般的に回線容量が少ない場合が多いので、障害情報20のデータ量が多い場合は、障害解析に必要な部分だけを抽出して送信するのが望ましい。遠隔保守ソフトウェア600は一定間隔で上述の特定のディレクトリを監視しており、当該特定のディレクトリへの障害情報の書き込みを契機として、障害発生を検出する。すると、遠隔保守ソフトウェア600は、遠隔保守用回線420を経由して、障害情報20を管理センタ900に送信する。管理センタ900では、障害情報20を基に障害解析を行い、必要に応じて現地にサポートエンジニアを派遣する等して、必要な措置を講じる。
尚、ストレージ管理ソフトウェア500は、上述した障害情報収集機能の他、例えば、業務用ホスト装置200とストレージシステム800との間で期待通りの性能(例えば、リード/ライト性能)が発揮されているかどうかを管理する機能、ストレージ管理ソフトウェア500からストレージシステム800を操作したときの操作性能(例えば、ストレージ管理ソフトウェア500のメモリ使用量等)等を管理する機能、或いはストレージシステム800の構成が推奨通りの構成になっているかどうか(例えば、ペアボリュームの設定、ディスク容量等)を管理したりする機能をも備える。
また、業務用ホスト装置200における障害監視及び障害情報収集処理についても、上述した管理用サーバ700における障害管理及び障害情報収集処理と同様である。
図7は管理用サーバ700における障害情報収集処理の他の例の概要を示している。上述した障害情報収集処理(図6)は、遠隔保守コンポーネント510が障害監視を行っていたが、この例では、ユーザが障害発生を発見し、管理用サーバ700に障害通知コマンドを入力することにより、遠隔保守コンポーネント510が障害情報収集モジュール520を起動させて障害情報20を収集している。本発明では、障害情報を収集する契機は、遠隔保守コンポーネント510による障害発生の検出でもよく、或いはユーザによる障害発生の発見でもよい。障害発生を検出した後のその他の処理は、上述した障害情報収集処理(図6)と同様であるため、詳細な説明は省略する。
図8は管理センタ900からのリクエストに応じて、ストレージ管理ソフトウェア500が管理する各種の情報(構成情報、稼働情報、性能情報等)を管理センタ900に送信する処理の概要を示している。ストレージ管理ソフトウェア500は、ストレージシステム800、業務用ホスト装置200、通信ネットワーク170或いはその他のネットワークコンポーネント(スイッチ、ハブ等)の構成情報、稼働情報、性能情報等の各種の情報を管理している。これらの情報は、例えば、ローカルディスク704に格納されており、管理センタ900からのリクエストに応じて、必要な情報を管理センタ900に送信することができる。ローカルディスク704に格納されたこれらの情報を取り出すには、管理センタ900は、まず、遠隔保守回線420を介して管理端末160にログインして、情報の送信を要求する。すると、管理端末160(より詳細には、遠隔保守ソフトウェア600)は、管理用LAN410を介して管理用サーバ700にアクセスし、管理サーバ900から要求された情報の取得を要求する。すると、管理用サーバ700(より詳細には、ストレージ管理ソフトウェア500)は、ローカルディスク704に格納された各種の情報から、管理センタ900が要求する情報を選別し、管理用LAN410を介して管理端末160に送信する。管理端末160は、管理用サーバ700から受信した情報を、保守回線420を介して管理センタ900に転送する。
次に、図9乃至図13を参照しながら、プッシュ型の障害情報収集処理と、プル型の障害情報収集処理について説明を加える。上述したストレージ管理ソフトウェア500は、エージェント500Aとマネージャー500Mに分類することができる。エージェント500Aは、例えば、業務用ホスト装置200にインストールされる。エージェント500Aは、業務用ホスト装置200の障害監視や障害情報の収集等を行う他、更に、通信ネットワーク170経由でストレージシステム800の障害監視や障害情報の収集等を行う。エージェント500Aは、収集した障害情報をマネージャー500Mに送信する。一方、マネージャー500Mは、例えば、管理用サーバ700にインストールされる。マネージャー500Mは、業務用ホスト装置200に実装されたエージェント500Aと通信することで、業務用ホスト装置200の障害監視や障害情報の収集を行う他、管理用LAN410経由でストレージシステム800の障害監視や障害情報の収集等を行う。マネージャー500Mは、複数の業務用ホスト装置200や、ストレージシステム800の障害情報を集約し、一元管理する。
図9はプッシュ型の障害情報収集処理の概要を示している。各々の業務用ホスト装置200にインストールされた各々のエージェント500Aは、障害の発生を検出すると、ローカルディスク204に障害情報を一時的に格納した後、管理用LAN410を経由して管理端末160に障害情報を送信し、管理端末160の特定のディレクトリに障害情報を書き込む処理を各々独立して行う。管理用サーバ700にインストールされたマネージャー500Mは、障害の発生を検出すると、ローカルディスク704に障害情報を一時的に格納した後、管理用LAN410を経由して管理端末160に障害情報を送信し、管理端末160の特定のディレクトリに障害情報を書き込む処理を各々のエージェント500Aとは独立して行う。管理端末160が複数存在する場合は、各々のエージェント500A及びマネージャー500Mは、障害情報を送信する管理端末160をその都度選定してもよく、或いは予め定められた管理端末160に障害情報を送信してもよい。遠隔保守ソフトウェア600は、管理端末160の特定のディレクトリへの障害情報の書き込みを検出すると、その都度、遠隔保守回線420を経由して管理センタ900へ障害情報を送信する。
図10はプル型の障害情報収集処理の概要を示している。各々の業務用ホスト装置200にインストールされた各々のエージェント500Aは、障害の発生を検出すると、ローカルディスク204に障害情報を一時的に格納する。同様に、管理用サーバ700にインストールされたマネージャー500Mは、障害の発生を検出すると、ローカルディスク704に障害情報を一時的に格納する。障害情報の格納先としては、例えば、ローカルディスク204,704の特定のディレクトリが好適である。管理端末160にインストールされた遠隔保守ソフトウェア600は、管理用LAN410を経由して、ローカルディスク204,704の特定のディレクトリに定期的にアクセスし、当該ディレクトリに格納されている障害情報の更新を検出すると、最新の障害情報を取得して、これを管理センタ900に送信する。
図11はプッシュ型の障害情報収集処理の概要を示している。図9に示したプッシュ型の処理と異なる点は、各々のエージェント500Aが取得した障害情報を、一旦、マネージャー500Mが集約し、一元管理を行っている点である。マネージャー500Mは、自ら検出した障害情報のみならず、各々のエージェント500Aが検出した障害情報をも管理する。マネージャー500Mは、各々のエージェント500Aから障害情報を取得すると、管理用LAN410を経由して管理端末160の特定のディレクトリに障害情報を書き込む。遠隔保守ソフトウェア600は、管理端末160の特定のディレクトリへの障害情報の書き込みを検出すると、その都度、遠隔保守回線420を経由して管理センタ900へ障害情報を送信する。
図12はプル型の障害情報収集処理の概要を示している。図10に示したプル型の処理と異なる点は、各々のエージェント500Aが取得した障害情報を、一旦、マネージャー500Mが集約し、一元管理を行っている点である。マネージャー500Mは、自ら検出した障害情報のみならず、各々のエージェント500Aが検出した障害情報をローカルディスク704の特定のディレクトリに格納し、一元管理する。管理端末160にインストールされた遠隔保守ソフトウェア600は、管理用LAN410を経由して、ローカルディスク704の特定のディレクトリに定期的にアクセスし、当該ディレクトリに格納されている障害情報の更新を検出すると、最新の障害情報を取得して、これを管理センタ900に送信する。
図13はプッシュ型の障害情報収集処理の概要を示している。図9に示したプッシュ型の処理と異なる点は、各々のエージェント500A及びマネージャー500Mが検出した障害情報を管理端末160のローカルディスク164の特定のディレクトリに直接格納する点である。管理端末160は、各々のエージェント500A及びマネージャー500Mが検出した障害情報を一元管理し、ローカルディスク164の特定のディレクトリに格納された障害情報の更新を検出すると、その都度、遠隔保守回線420を経由して最新の障害情報を管理センタ900に送信する。
本実施形態のストレージ管理システムの概略構成図である。 ストレージシステムを中心とするシステム構成図である。 業務ホスト装置のシステム構成図である。 管理端末のシステム構成図である。 管理用サーバのシステム構成図である。 障害情報を収集する処理の説明図である。 障害情報を収集する処理の説明図である。 構成情報等を収集する処理の説明図である。 障害情報を収集する処理(プッシュ型)の説明図である。 障害情報を収集する処理(プル型)の説明図である。 障害情報を収集する処理(プッシュ型)の説明図である。 障害情報を収集する処理(プル型)の説明図である。 障害情報を収集する処理(プッシュ型)の説明図である。
符号の説明
10…ストレージ管理システム 200…業務用ホスト装置 410…管理用LAN 420…遠隔保守回線 500…ストレージ管理ソフトウェア 510…遠隔保守コンポーネント 520…障害情報収集モジュール 600…遠隔保守ソフトウェア 700…管理用サーバ 900…管理センタ

Claims (6)

  1. ストレージシステムを管理するとともに遠隔保守回線を経由して管理センタに接続する管理端末に業務用ホスト装置又は管理用サーバが管理用通信回線を介して接続するストレージネットワークの管理情報を管理するための方法であって、
    前記業務用ホスト装置又は前記管理サーバの管理情報を前記管理用通信回線経由で前記管理端末に送信するステップと、
    前記管理端末が前記業務用ホスト装置又は前記管理サーバから取得した管理情報を前記遠隔保守回線経由で前記管理センタに送信するステップと、
    を備える、ストレージネットワークの管理情報管理方法。
  2. 請求項1に記載のストレージネットワークの管理情報管理方法であって、
    前記管理用サーバは、複数の前記業務用ホスト装置のそれぞれの管理情報を集約し、前記管理情報を前記管理用通信回線経由で前記管理端末に送信する、ストレージネットワークの管理情報管理方法。
  3. ストレージシステムを管理するとともに遠隔保守回線を経由して管理センタに接続する管理端末と、
    前記ストレージシステムが提供する記憶資源を利用する業務用ホスト装置と、
    前記ストレージシステムを管理する管理用サーバと、
    前記業務用ホスト装置、前記管理用サーバ、及び前記管理端末を接続する管理用通信回線と、
    を備え、
    前記業務用ホスト装置又は前記管理サーバは、前記管理用通信回線経由で前記管理端末に管理情報を送信し、前記管理端末は、前記業務用ホスト装置又は前記管理サーバから受信した管理情報を前記遠隔保守回線経由で前記管理センタに送信する、ストレージ管理システム。
  4. 請求項3に記載のストレージ管理システムであって、
    前記管理用サーバは、複数の前記業務用ホスト装置のそれぞれの管理情報を集約し、前記管理情報を前記管理用通信回線経由で前記管理端末に送信する、ストレージ管理システム。
  5. ストレージシステムを管理するとともに遠隔保守回線を経由して管理センタに接続する管理端末に管理用通信回線を介して接続する業務用ホスト装置又は管理用サーバに実装されるストレージ管理ソフトウェアであって、
    前記業務用ホスト装置又は前記管理サーバの管理情報を前記管理用通信回線経由で前記管理端末に送信するステップを、前記業務用ホスト装置又は前記管理用サーバに実行させる、ストレージ管理ソフトウェア。
  6. 請求項5に記載のストレージ管理ソフトウェアであって、
    複数の前記業務用ホスト装置のそれぞれの管理情報を集約し、前記管理情報を前記管理用通信回線経由で前記管理端末に送信するステップを前記管理用サーバに実行させる、ストレージ管理ソフトウェア。

JP2005134881A 2005-05-06 2005-05-06 ストレージネットワークの管理情報管理方法、ストレージ管理システム及びストレージ管理ソフトウェア Pending JP2006313410A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005134881A JP2006313410A (ja) 2005-05-06 2005-05-06 ストレージネットワークの管理情報管理方法、ストレージ管理システム及びストレージ管理ソフトウェア
US11/166,075 US20060253569A1 (en) 2005-05-06 2005-06-27 Administrative information management method of storage network, storage management system and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005134881A JP2006313410A (ja) 2005-05-06 2005-05-06 ストレージネットワークの管理情報管理方法、ストレージ管理システム及びストレージ管理ソフトウェア

Publications (1)

Publication Number Publication Date
JP2006313410A true JP2006313410A (ja) 2006-11-16

Family

ID=37395268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005134881A Pending JP2006313410A (ja) 2005-05-06 2005-05-06 ストレージネットワークの管理情報管理方法、ストレージ管理システム及びストレージ管理ソフトウェア

Country Status (2)

Country Link
US (1) US20060253569A1 (ja)
JP (1) JP2006313410A (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101681362B (zh) * 2007-01-05 2013-08-21 桑帕尔斯技术有限公司 存储优化方法
JP4480756B2 (ja) * 2007-12-05 2010-06-16 富士通株式会社 ストレージ管理装置、ストレージシステム制御装置、ストレージ管理プログラム、データ記憶システムおよびデータ記憶方法
WO2009073013A1 (en) * 2007-12-07 2009-06-11 Apara Global Services Inc. Remote data storage management system
US8601134B1 (en) 2011-06-30 2013-12-03 Amazon Technologies, Inc. Remote storage gateway management using gateway-initiated connections
US8793343B1 (en) * 2011-08-18 2014-07-29 Amazon Technologies, Inc. Redundant storage gateways
US8789208B1 (en) 2011-10-04 2014-07-22 Amazon Technologies, Inc. Methods and apparatus for controlling snapshot exports
US10398060B1 (en) 2014-03-17 2019-08-27 Amazon Technologies, Inc. Discrete cooling module
CN105335168B (zh) * 2014-05-27 2018-07-10 阿里巴巴集团控股有限公司 实现操作系统远程配置的系统、方法及装置
JP2019144778A (ja) * 2018-02-19 2019-08-29 富士通株式会社 情報処理装置、情報処理方法及びプログラム
US11204699B2 (en) * 2020-03-05 2021-12-21 EMC IP Holding Company LLC Storage system port maintenance information sharing with host device

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5819028A (en) * 1992-06-10 1998-10-06 Bay Networks, Inc. Method and apparatus for determining the health of a network
US5944794A (en) * 1994-09-30 1999-08-31 Kabushiki Kaisha Toshiba User identification data management scheme for networking computer systems using wide area network
US6220768B1 (en) * 1996-06-28 2001-04-24 Sun Microsystems, Inc. Network asset survey tool for gathering data about node equipment
US5923850A (en) * 1996-06-28 1999-07-13 Sun Microsystems, Inc. Historical asset information data storage schema
US6065053A (en) * 1997-10-01 2000-05-16 Micron Electronics, Inc. System for resetting a server
US6360255B1 (en) * 1998-06-25 2002-03-19 Cisco Technology, Inc. Automatically integrating an external network with a network management system
US6286047B1 (en) * 1998-09-10 2001-09-04 Hewlett-Packard Company Method and system for automatic discovery of network services
US6356282B2 (en) * 1998-12-04 2002-03-12 Sun Microsystems, Inc. Alarm manager system for distributed network management system
US6397245B1 (en) * 1999-06-14 2002-05-28 Hewlett-Packard Company System and method for evaluating the operation of a computer over a computer network

Also Published As

Publication number Publication date
US20060253569A1 (en) 2006-11-09

Similar Documents

Publication Publication Date Title
JP2006313410A (ja) ストレージネットワークの管理情報管理方法、ストレージ管理システム及びストレージ管理ソフトウェア
US8234467B2 (en) Storage management device, storage system control device, storage medium storing storage management program, and storage system
US7366838B2 (en) Storage system and control method thereof for uniformly managing the operation authority of a disk array system
JP4391265B2 (ja) ストレージサブシステムおよび性能チューニング方法
US7360047B2 (en) Storage system, redundancy control method, and program
US8220000B2 (en) System and method for executing files stored in logical units based on priority and input/output load of the logical units
US20080052433A1 (en) Storage system
JP2000339098A (ja) ストレージドメイン管理システム
KR100736647B1 (ko) Raid 장치, 통신 접속 감시 방법 및 프로그램 기록매체
WO2011141963A1 (en) Information processing apparatus and data transfer method
US8959375B2 (en) System and method for power management of storage resources
WO2011055406A1 (en) Data storage system and method therefor
JP2005326935A (ja) 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法
US7216210B2 (en) Data I/O system using a plurality of mirror volumes
JP5000234B2 (ja) 制御装置
US8095820B2 (en) Storage system and control methods for the same
CN100362483C (zh) 磁盘冗余阵列设备的自动重建方法
US8099634B2 (en) Autonomic component service state management for a multiple function component
US20070016901A1 (en) Storage system and automatic renewal method of firmware
US20060179163A1 (en) Disk array device
US20090228672A1 (en) Remote copy system and check method
US10659285B2 (en) Management apparatus and information processing system
US8732531B2 (en) Information processing apparatus, method of controlling information processing apparatus, and control program
JP2007048017A (ja) ストレージシステム及び記憶制御方法
JP2006031335A (ja) 情報処理システム及び方法