JP2006107080A - ストレージ装置システム - Google Patents

ストレージ装置システム Download PDF

Info

Publication number
JP2006107080A
JP2006107080A JP2004292170A JP2004292170A JP2006107080A JP 2006107080 A JP2006107080 A JP 2006107080A JP 2004292170 A JP2004292170 A JP 2004292170A JP 2004292170 A JP2004292170 A JP 2004292170A JP 2006107080 A JP2006107080 A JP 2006107080A
Authority
JP
Japan
Prior art keywords
svp
information processing
terminal
storage apparatus
processing terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004292170A
Other languages
English (en)
Inventor
Katsuhiko Fukui
克彦 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004292170A priority Critical patent/JP2006107080A/ja
Priority to US10/998,758 priority patent/US7650532B2/en
Publication of JP2006107080A publication Critical patent/JP2006107080A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0784Routing of error reports, e.g. with a specific transmission path or data flow
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Debugging And Monitoring (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

【課題】 操作性を要求されるストレージ装置各部に対する設定作業や保守作業に加え、高い信頼性が要求される監視・保守端末への障害情報の通報を、信頼性を低下させることなく行えるようにする。
【解決手段】 SVP23、SVP25が有する機能とは、高い信頼性が要求される、ストレージ装置3に対する監視機能、遠隔保守センター端末13等への通報機能である。この通報機能とは、監視機能により検知された、ストレージ装置3の障害等のイベントを、遠隔保守センター端末3等へ通報するものである。SVP23、SVP25の機能を、ストレージ装置3の障害の通報機能、障害以外の情報の通報機能、SNMP機能に限定して、SVP23、SVP25に搭載されるOSを始めとするプログラムの量を少なくしている。
【選択図】 図1

Description

本発明は、上位装置又は他のストレージ装置と通信可能に接続されるストレージ装置を備える情報処理システムに関する。
従来、大規模並列計算機システムにおいて、システム内で生じた障害を発生時系列順に正確に把握することを目的とした障害監視システムが提案されている。この障害監視システムは、夫々が独立した計算機である複数のノードと、ノード間の信号経路を切り換えるクロスバデータスイッチと、クロスバデータスイッチの駆動を制御するクロスバ制御装置と、ノード、クロスバデータスイッチ、及びクロスバ制御装置に接続され、障害を監視すると共に障害を検出すると直ちに所定の障害情報を出力するスレーブ・サービスプロセッサと、障害情報を受信することにより、障害の発生時系列を監視するマスタ・サービスプロセッサとを備える(例えば特許文献1参照)。
また、従来、複数のサービスプロセッサの障害時の切り換え処理を迅速且つ確実に行うと共に、電子計算機システムの連続運転を可能にすることを目的としたサービスプロセッサの切り換え方式が提案されている。このサービスプロセッサの切り換え方式は、電子計算機本体と、複数のサービスプロセッサとで構成された電子計算機システムに適用されるもので、電子計算機本体の監視、制御、及び操作員との情報交換を行うために運用中に参照される電子計算機本体の構成情報を、該電子計算機本体の主記憶装置内に設けられた構成情報格納領域に格納することにより、複数のサービスプロセッサから共通にアクセス可能とし、マスタ・サービスプロセッサの障害発生時には、バックアップ用サービスプロセッサが、構成情報を読み込み、電子計算機システムの連続運転を行う(例えば特許文献2参照)。
更に、従来、2重化されてホットスタンバイ構成を採るSVP(サービス・プロセッサ)が初期設定を行う情報処理装置の初期設定時間の短縮を図ることを目的とした情報処理装置の初期設定方式が提案されている。この提案では、複数系統の演算装置により単一の計算機システムを構成し、2台のSVPがホットスタンバイ方式を採る。2つの初期設定実行手段は、2台のSVPが並行して初期設定を行う2SVP初期設定手順と1台のSVPが全ての初期設定を行う1SVP初期設定手順とを備え、初期設定開始時、各SVPと演算装置の2つのアクセス経路との2つの接続切替手段を両方共に接続状態として2台のSVPが2SVP初期設定手順を用いて並行して初期設定を行う。初期設定が完了するまでの間に2つの障害監視手段が他系SVPの障害を検出した場合、2つの接続切替手段により他系SVPに繋がる2つのアクセス経路を切り離して、1台のSVPが1SVP初期設定手順を用いて全ての初期設定を行う(例えば特許文献3参照)。
特開2000-353154号公報 特開平6-83657号公報 特開2001-22712号公報
ところで、従来のストレージ装置では、SVPが、作業対象であるストレージ装置各部に対し(環境設定等)諸々の設定を行う装置設定の作業や保守作業を行う保守操作用端末としての機能と、ストレージ装置に係わる障害情報の取得、取得した障害情報の遠隔地にある保守センター端末への通報、及び顧客端末へのSNMP(Simple Network Management Protocol)通報等の機能と、を備えている。SVPが、保守用操作端末としての機能を果たすためには、装置設定の作業や保守作業に操作性を要求されるので、例えばGUI(Graphical User Interface)を持った市販のOS(Operating System)が使用される。これに対して、SVPが、遠隔保守センター端末への障害情報の通報や、顧客端末へのSNMP通報等の機能を果たすためには、常時、監視対象であるストレージ装置各部の稼働状況を監視し、ストレージ装置各部に障害等のイベントが発生した場合には、該イベントを遠隔保守センター端末や顧客端末等に確実に行うことが必要であるから、高い信頼性を要求される。
しかし、高い信頼性の要求される監視・通報の作業を、操作性の要求される装置設定や保守作業を行う保守用操作端末として機能しているSVPと同一のハードウェアで行おうとすると、上記監視・通報の作業のアプリケーション・プログラムを、上述した市販のOS上で稼働させることになるので、上記監視・通報の作業の信頼性が低下するという問題がある。
従って本発明の目的は、ストレージ装置システムにおいて、操作性を要求されるストレージ装置各部に対する設定作業や保守作業に加えて、高い信頼性が要求される監視・保守端末への障害情報の通報を、信頼性を低下させることなく行えるようにすることにある。
本発明の第1の観点に従うストレージ装置システムは、通信ネットワークを通じて監視・保守用端末との間で通信を行うストレージ装置と、上記ストレージ装置各部に対し、必要な設定作業、及び保守管理作業を行うための第1の情報処理端末と、上記ストレージ装置各部の状態を監視して、上記ストレージ装置にイベントが発生したことを認識した場合に、そのイベント発生を上記監視・保守用端末へ通報する第2の情報処理端末と、を備える。
本発明の第1の観点に係る好適な実施形態では、上記ストレージ装置が、通信ネットワークを通じて更にユーザ端末との間でも通信を行う。
上記とは別の実施形態では、上記第2の情報処理端末からの通報が、ユーザ端末へのSNMP通報を含む。
また、上記とは別の実施形態では、上記第2の情報処理末が、記憶デバイスとして、磁気記録媒体以外の記憶デバイスを備える。
更に、上記とは別の実施形態では、上記第1の情報処理端末には、GUIを持ったOSが搭載されており、上記第1の情報処理端末は、上記第2の情報処理端末を通じて、ストレージ装置内の記憶デバイスを制御する情報処理部との間で通信を行って、ストレージ装置の保守管理に必要な処理を実行する。
本発明の第2の観点に従うストレージ装置システムは、通信ネットワークを通じて監視・保守用端末との間で通信を行うストレージ装置と、上記ストレージ装置各部に対し、必要な設定作業、及び保守管理作業を行うための第1の情報処理端末と、上記ストレージ装置各部の状態を監視して、上記ストレージ装置にイベントが発生したことを認識した場合に、そのイベント発生を上記監視・保守用端末へ通報する第2の情報処理端末と、を備え、上記第2の情報処理端末が、少なくとも稼働中の情報処理端末と待機中の情報処理端末との2台の情報処理端末であり、上記各々の第2の情報処理端末が、互いの間で通信を行うことによって相手方情報処理端末の状態を監視する状態監視部を含み、上記待機中の第2の情報処理端末の状態監視部が、上記稼動中の第2の情報処理端末の状態を異常と判断した場合には、上記稼動中の第2の情報処理端末の動作を停止させると共に、上記待機中の第2の情報処理端末を稼働させるようにした。
本発明の第2の観点に係る好適な実施形態では、上記2台の第2の情報処理端末と、上記ストレージ装置内の記憶デバイスを制御する情報処理部との間を接続する通信経路が、二重化されている。
上記とは別の実施形態では、上記各々の状態監視部が、相手方端末である第2の情報処理端末の状態監視部に対して通信を行ってから一定時間が経過しても相手方端末である第2の情報処理端末の状態監視部から応答が無い場合に、相手方端末である第2の情報処理端末の状態を異常と判断するようにした。
また、上記とは別の実施形態では、上記各々の第2の情報処理端末が、相手方端末である第2の情報処理端末との間で通信テストを行った結果を示す情報を記録した管理テーブルを持っている。
また、上記とは別の実施形態では、上記通信テストが、上記各々の第2の情報処理端末同士の間を接続する複数の通信経路別に行われる。
また、上記とは別の実施形態では、上記各々の第2の情報処理端末が、相手方端末である第2の情報処理端末との間で通信テストを行った結果得られた、相手方端末である第2の情報処理端末における故障の有無、及び故障箇所を検知するためのパターン情報を持っている。
また、上記とは別の実施形態では、上記各々の状態監視部が、上記管理テーブルに記録されている情報と、上記パターン情報とを参照して相手方端末である第2の情報処理端末の状態が異常か否か判断する。
また、上記とは別の実施形態では、上記各々の状態監視部が、相手方端末である第2の情報処理端末の状態を異常と判断した場合に、相手方端末である第2の情報処理端末の駆動電源からの相手方端末である第2の情報処理端末各部への給電をオフにすることで、相手方端末である第2の情報処理端末の動作を停止させるようにした。
また、上記とは別の実施形態では、上記稼動中の第2の情報処理端末が、上記ストレージ装置内の記憶デバイスを制御する情報処理部との間で通信を行うことにより、上記稼動中の第2の情報処理端末の情報格納部に格納している上記ストレージ装置に係わる情報を更新するタイミングで、上記待機中の第2の情報処理端末との間で通信を行う。
また、上記とは別の実施形態では、上記待機中の第2の情報処理端末が、上記稼動中の第2の情報処理端末との間で通信を行うタイミングで、上記待機中の第2の情報処理端末の情報格納部に格納している上記ストレージ装置に係わる情報を更新するようにした。
更に、上記とは別の実施形態では、上記第1の情報処理端末が、モバイル端末、又はデスクトップ型の固定端末の何れかである。
本発明の第3の観点に従うストレージ装置は、ストレージ装置本体と、上記ストレージ装置本体内に収容される、複数のHDDを収容するHDDボックス、複数のロジック基板を収容するロジックボックス、電源装置、及びサービスプロセッサと、を備え、上記サービスプロセッサが、小型化されて、上記ロジックボックス中の標準的なロジック基板内に実装されている。
本発明によれば、ストレージ装置システムにおいて、操作性を要求されるストレージ装置各部に対する設定作業や保守作業に加えて、高い信頼性が要求される監視・保守端末への障害情報の通報を、信頼性を低下させることなく行えるようにすることができる。
以下、本発明の実施の形態を、図面により詳細に説明する。
図1は、本発明の第1の実施形態に係るストレージ装置を備える情報処理システムの全体構成を示すブロック図である。
上記情報処理システムは、図1に示すように、上位装置1と、ストレージ装置3と、顧客端末5と、保守PC7と、ダイヤルアップルータ9と、公衆電話回線網11と、遠隔保守センター端末13と、を備える。ストレージ装置3は、複数のMP(マイクロプロセッサ)15、17(図示と説明の都合上、図1では、符号15、17を付した2個のみを記載)と、システムメモリ(例えば、情報処理システムの稼動や、保守管理に必要なシステム構成情報や、稼働管理情報等が格納されているSM(共有メモリ))19と、を備える。上記各部に加えて、ストレージ装置3は、複数の記憶デバイス21(図示と説明の都合上、図1では、符号21を付した1個のみを記載)と、第1のSVP23と、第2のSVP25と、CM(キャッシュメモリ)と、を備える。更に、ストレージ装置3内には、システムバス27と、情報ネットワーク29とが布設されている。
上位装置1は、CPU(Central Processing Unit)やメモリ等の情報処理資源を備えるコンピュータ装置である。上位装置1は、所定の通信ネットワーク31を通じて、ストレージ装置3との間でデータの授受(データ通信)を行う。
ストレージ装置3において、MP15は、例えば上位装置1との間でデータ通信を行うためのCHA(チャネルアダプタ)に内蔵されている。一方、MP17は、例えば記憶デバイス21との間でデータの授受を行うためのDKA(ディスクアダプタ)に内蔵されている。MP15とMP17とは、例えばシステムバス27、及びSM(システムメモリ)19を通じて、或いはシステムバス27を通じて、通信を行う。
MP15、及びMP17には、夫々MP15、MP17が所定の処理動作を実行するためのマイクロプログラムが搭載されている。
MP15は、通信ネットワーク31を通じて上位装置1からのREAD要求を受信すると、上記CMの所定記憶領域に一時的に保持されている、上記READ要求に対応するデータを、システムバス27を通じて読み出す。そして、該読み出したデータを、通信ネットワーク31を通じて上位装置1へ転送する。MP15は、また、通信ネットワーク31を通じて上位装置1からのWRITE要求を受信すると、該WRITE要求に従い、通信ネットワーク31を通じて上位装置1から転送されたデータを、システムバス27を通じて上記CMの所定記憶領域に書き込む。これにより、該データを、上記CMに一時的に保持させる。
MP17は、MP15からの通知に基づき、上位装置1からのREAD要求に応じたデータを、システムバス27を通じて記憶デバイス21から読み出し、該読み出したデータを、上記CMの所定記憶領域に書き込む。MP17は、また、MP15からの通知に基づき、上位装置1からのWRITE要求によって上記CMの所定記憶領域に書き込まれたデータを、システムバス27を通じて記憶デバイスに書き込む。これによって、該データを、記憶デバイス21に保存させる。
第1のSVP23、及び第2のSVP25には、同一の回路構成を備え、且つ、同一の機能を有するPC(パーソナルコンピュータ)が採用されている。本実施形態では、第1のSVP23、及び第2のSVP25の回路構成については、比較的故障率の高いHDD(ハードディスクドライブ)やFDD(フロッピディスクドライブ)やCD(コンパクトディスク)−ROM等のデバイスを排除したものとなっている。第1のSVP23、及び第2のSVP25が夫々備える回路構成の詳細については、後述する。
一方、第1のSVP23、及び第2のSVP25が夫々有する機能とは、何れも高い信頼性が要求される、ストレージ装置3に対する監視機能、及び遠隔保守センター端末13や顧客端末5への通報機能である。遠隔保守センター端末3や顧客端末5への通報機能とは、監視機能によって検知された、ストレージ装置3に発生した障害等のイベントを、遠隔保守センター端末3や顧客端末5へ通報するためのものである。本実施形態では、第1のSVP23、及び第2のSVP25の機能を、例えばストレージ装置3に発生した障害の通報機能、障害以外の情報の通報機能、及びSNMP機能に限定して、第1のSVP23、及び第2のSVP25に搭載されるOSを始めとするプログラムの量を少なくしている。
第1のSVP23(又は第2のSVP25)は、情報ネットワーク29を通じてMP15、及びMP17との間で通信を行うのみならず、外部LAN33を通じて顧客端末5、及び保守PC7との間でも通信を行う。
本実施形態では、保守PC7には、第1のSVP23、及び第2のSVP25と同一の回路構成を備えたものが採用されており、且つ、例えばGUI(Graphical User Interface)を持った市販のOS(Operating System)が搭載されている。そして、該OS上には、保守PC7が、操作性の要求されるストレージ装置3に対する諸々の設定作業や、ストレージ装置3に対する保守作業等を行うための操作用端末として機能するように、専用のアプリケーション・プログラムが搭載されている。保守PC7は、上記専用のアプリケーション・プログラムが起動することにより、外部LAN33、及び第1のSVP23(又は第2のSVP25)を通じてMP15、又はMP17との間で交信を行い、ストレージ装置3の保守管理に必要な設定を実行する。
ダイヤルアップルータ9は、ダイヤルアップ接続機能を備えたルータであり、着信機能を備え、外部からのダイヤルアップ接続リクエストに対する接続サーバとしても機能し得る。
遠隔保守センター端末13は、公衆電話回線網11、ダイヤルアップルータ9、外部LAN33、及び第1のSVP23(又は第2のSVP25)を通じてMP15、又はMP17との間で交信を行うことにより、ストレージ装置3の遠隔からの保守管理に必要なデータを、MP15、又はMP17から取得する。
図2は、図1に記載のストレージ装置3の全体構成を示すブロック図である。
図2において、ホスト装置35は、図1で示した上位装置1に対応しており、CPUやメモリ等の情報処理資源を備えるコンピュータ装置である。ホスト装置35は、例えばキーボードスイッチや、ポインティングデバイスや、マイクロフォン等の情報入力手段(図示しない)と、例えばモニタディスプレイやスピーカ等の情報出力手段(図示しない)とを有する。また、ホスト装置35は、例えばストレージ装置3が提供する記憶領域を使用するデータベースソフトウェア等のアプリケーション・プログラム35aと、通信ネットワーク67を通じてストレージ装置3にアクセスするためのアダプタ35bとを有する。
通信ネットワーク67としては、例えばLAN(Local Area Network)、SAN(Storage Area Network)、インターネット、専用回線、公衆回線等を場合に応じて適宜使い分けることができる。ここで、LANを通じたデータ通信は、例えばTCP/IP(Transmission Control Protocol/Internet Protocol)プロトコルに従って行われる。ホスト装置35がLANを通じてストレージ装置3に接続される場合、ホスト装置35は、ファイル名を指定してファイル単位でのデータ入出力を要求する。これに対し、ホスト装置35がSANを通じてストレージ装置3等に接続される場合、ホスト装置35は、ファイバチャネルプロトコルに従って、複数のディスク記憶装置(ディスクドライブ)により提供される記憶領域のデータ管理単位であるブロックを単位としてデータ入出力を要求する。通信ネットワーク67がLANである場合、上記アダプタ35bは、例えばLAN対応のネットワークカードである。通信ネットワーク67がSANの場合には、上記アダプタ35bは、例えばホストバスアダプタ(HBA)である。
ストレージ装置3は、例えばディスクアレイサブシステムとして構成されるものである。但し、これに限らず、ストレージ装置3を、高機能化されたインテリジェンス型のファイバチャネルスイッチとして構成することも可能である。ストレージ装置3は、コントローラ部と記憶装置部とに大別することができる。コントローラ部は、例えば複数のCHA37、39(図2では、2個のみ記載)と、複数のディスクアダプタ(DKA)53、55(図2では、2個のみ記載)と、を備える。コントローラ部は、上記各部に加えて、更に、複数枚のキャッシュボード(Cache)41、43(図2では、2枚のみ記載)上に搭載された共有メモリ(SM)45、47、及びキャッシュメモリ(CM)49、51と、例えばLANを通じて接続された第1のSVP23、第2のSVP25と、を備える。
各CHA37、39は、夫々例えばホスト装置35との間でデータ通信を行うための通信ポート37a、39aを備える。上記に加えて、各CHA37、39は、夫々CPUやメモリ等を備えたマイクロコンピュータシステムとして構成されており、例えばホスト装置35から受信した各種コマンドを解釈して実行する。各CHA37、39には、夫々を識別するためのネットワークアドレス(例えば、IPアドレスやWWN(World Wide Name))が割り当てられており、夫々が個別にNAS(Network Attached Storage)として振る舞うことができるようになっている。複数のホスト装置(35)が存在する場合には、各CHA37、39は、各ホスト装置(35)からの要求を夫々個別に受け付けることができるようになっている。なお、CHA39は、通信ネットワーク65を通じてホスト装置35とは別のホスト装置(図示しない)や、別のストレージ装置(図示しない)と接続される。
各DKA53、55は、例えばRAID構成になっている複数個のPDEV(61〜61、63〜63)との間でデータの授受を行うため、各PDEV(61〜61、63〜63)と接続するのに必要な通信ポート53a、55aを夫々備える。上記に加えて、各DKA53、55は、夫々CPUやメモリ等を備えたマイクロコンピュータシステムとして構成されており、CHA37がホスト装置35から受信したデータを、ホスト装置35からのリクエスト(書き込み命令)に基づいて、所定のPDEV(61〜61、63〜63)の所定のアドレスに書き込む。各DKA53、55は、また、ホスト装置35からのリクエスト(読み出し命令)に基づいて所定のPDEV(61〜61、63〜63)の所定のアドレスからデータを読み出し、該データを、CHA37を通じてホスト装置35へ送信する。
各DKA53、55がPDEV(61〜61、63〜63)との間でデータ入出力を行う場合、各DKA53、55は、論理的なアドレスを物理的なアドレスに変換する。なお、各DKA53、55は、PDEV(61〜61、63〜63)がRAIDに従って管理されている場合には、RAID構成に応じたデータアクセスを行うことになる。
第1のSVP23、第2のSVP25は、夫々管理用のコンソールとして、ストレージ装置3全体の動作を監視・制御するためのコントロールユニット(図示しない)に接続されている。第1のSVP23、第2のSVP25は、夫々コントロールユニット(図示しない)から伝送されるストレージ装置3内の障害情報を表示部に表示したり、コントロールユニット(図示しない)に対し、PDEV(61〜61、63〜63)の閉塞処理等を指令するようになっている。
CM49、51は、夫々CHA37がホスト装置35から受信したデータや、各DKA53、55がPDEV(61〜61、63〜63)から読み出したデータを一時的に記憶する。
SM45、47には、夫々制御情報等が格納される。また、SM45、47には、夫々ワーク領域が設定される他、例えばマッピングテーブル等の各種テーブル類も格納される。
記憶装置部は、複数のPDEV(61〜61、63〜63)を備える。PDEV(61〜61、63〜63)としては、例えばハードディスク、フレキシブルディスク、磁気テープ、半導体メモリ、光ディスク等のようなデバイスを用いることができる。
図3は、図1に記載のストレージ装置3が備える第1のSVP23、第2のSVP25の回路構成の詳細を示すブロック図である。既述のように、第1のSVP23と、第2のSVP25とは、同一の回路構成を備えているので、以下では、図3に示す回路構成を、第1のSVP23の回路構成として説明する。
図3に示すように、第1のSVP23は、CPU71と、メモリ73と、チップセット75と、駆動電源77と、フラッシュROM79と、第1のLAN接続回路81と、第2のLAN接続回路83と、PCカードコントローラ85と、モデムカード87と、を備える。上記各部に加えて、第1のSVP23は、更に、PCIバス89と、第1のLANのI/Oポート91と、第2のLANのI/Oポート93と、電源入力端子95をも備える。
メモリ73には、第1のSVP23が例えば上述した通報機能や、SNMP機能を発揮するのに必要なOSを始めとするプログラムや、不揮発性の固定データが格納されているものとする。メモリ73は、CPU71からのデータ読み出し要求に応じて、上記固定データを、CPU71に出力する。チップセット75は、CPU71の制御下で、PCIバス89を通じてフラッシュROM79、第1のLAN接続回路81、第2のLAN接続回路83、及びPCカードコントローラ85の動作を制御する。
フラッシュROM79は、EEPROMと同様の機能を有しており、通常のPCに内蔵されるHDDやFDDやCD−ROM等の記憶デバイスの代りに第1のSVP23に備えられている。本実施形態では、フラッシュROM79は、第1のSVP23に設けられるPCMCIAスロットに差し込んで使用するPCカードである。フラッシュROM79に格納されるデータ(情報)としては、例えば後述するような(本発明の第2の実施形態において説明するような)ストレージ装置3の構成情報、SIM(Service Information Message)、ログ、イベント等の情報が挙げられる。
第1のLAN接続回路81は、第1のLANのI/Oポート91を通じて、例えば図1で示した情報ネットワーク29に接続される。一方、第2のLAN接続回路83は、第2のLANのI/Oポート93を通じて、例えば図1で示した外部LAN33に接続される。第1のLAN接続回路81が第1のLANのI/Oポート91を通じて情報ネットワーク29に接続され、且つ、第2のLAN接続回路83が第2のLANのI/Oポート93を通じて外部LAN33に接続されることにより、第1のSVP23を通じたMP15、又はMP17と、保守PC7との間の交信が可能になる。同様に、顧客端末5と、MP15、又はMP17との間の交信や、遠隔保守センター端末13と、MP15、又はMP17との間の交信も可能になる。
PCカードコントローラ85は、例えば(図1で示した)遠隔保守センター端末13により、ストレージ装置3の遠隔保守を実施する場合等に駆動されるもので、第1のSVP23に設けられるPCカードスロットに差し込まれるモデムカード87とPCIバス89との間の接続を制御する。
CPU71は、上述した第1のSVP23を構成する各部の動作を制御する。CPU71は、PCIバス89、第1のLAN接続回路81、第1のLANのポート91、及び情報ネットワーク29を通じてMP15、又はMP17との間で交信を行う。CPU71は、また、PCIバス89、第2のLAN接続回路83、第2のLANのポート93、及び外部LAN33を通じて、保守PC7、及び顧客端末5との間で交信を行う。
駆動電源77は、電源入力端子95を通じて供給される電力を蓄積し、駆動電圧として、第1のSVP23の各部に所定のDC電圧を供給する(バッテリ等の)直流電源である。
図4は、図1で示した第1のSVP23(又は第2のSVP25)、保守PC7、顧客端末5、及び遠隔保守センター端末13が夫々有する機能の一覧を示した説明図である。
図4において、保守PC7が有する装置設定(ストレージ装置3に対する諸々の設定作業)や、ストレージ装置3に対する保守作業に係わる機能は、既述のように、何れも信頼性よりもむしろ、操作性を要求される機能である。装置設定には、上述したストレージ装置3に係わる構成情報の設定、及びストレージ装置3の初期設定が、一方、保守作業には、装置状態表示、障害ログ情報表示、閾値等設定・変更、部品交換、マイクロ交換、及びダンプ採取が、夫々含まれる。
なお、保守作業において、マイクロ交換とは、図1で示したMP15、及びMP17に夫々搭載されるマイクロプログラムの交換作業のことを指し、また、ダンプ採取とは、ストレージ装置3に発生した障害の解析に必要な情報である障害情報を採取したときの操作のログのことを指す。上述した保守作業は、図4において◎印で示すように、保守PC7で操作される。
次に、第1のSVP23(又は第2のSVP25)は、何れも比較的高い信頼性を要求される(遠隔保守センター端末13の)監視・遠隔保守機能をサポートするための機能と、SNMP通報に係わる機能を有する。ここで、監視機能とは、ストレージ装置3から遠隔の位置に存在する保守センターの端末(即ち、遠隔保守センター端末)13からストレージ装置3内の設定情報を見る機能のことを指す。換言すれば、第1のSVP23(又は第2のSVP25)が監視・遠隔保守機能をサポートするための機能を有するということは、第1のSVP23(又は第2のSVP25)が、ストレージ装置3とは別の遠隔の地に存在する端末(即ち、遠隔保守センター端末13)の、言わば窓口になっていることを意味する。上述した監視・遠隔保守機能を実現するために操作される端末は、◎印で示すように、遠隔保守センター端末13であり、また、SNMP通報機能を実現するために操作される端末は、同じく◎印で示すように、顧客端末5である。
以上説明したように、本発明の第1の実施形態によれば、保守PC7と、第1のSVP23(又は第2のSVP25)とを、ハードウェア的に分離することとしたので、第1のSVP23(又は第2のSVP25)によって、高い信頼性が要求される監視・遠隔保守機能に対応することができる。
また、ストレージ装置3を構成する各クラスタ毎に実装が必要なSVP(第1のSVP23/第2のSVP25)のハードウェアを小型化することができるので、ストレージ装置3全体としての原価低減を図ることができる。
また、SVP(第1のSVP23、第2のSVP25)のハードウェアを小型化することにより、ストレージ装置3におけるSVP(第1のSVP23、第2のSVP25)の実装スペースが小さくなるので、ストレージ装置3におけるSVP(第1のSVP23、第2のSVP25)の二重化構成の実装が容易に行える。
更に、高機能化、及び良好な操作性が要求される保守PC7については、ストレージ装置3の外部に設置することができるので、複数のストレージ装置において保守PC7の共用化を図ることも可能になるので、複数台のストレージ装置(3)から成るストレージ装置システムの原価低減を図ることもできる。
ところで、従来にあっては、SVP(の状態が正常か否か)の監視は、主に、以下の2つの方法のうちの何れかによって行われていた。
第1の方法は、監視対象であるSVPとは別の、SVPを監視するための専用のハードウェアを設けて、該専用のハードウェアによりSVPと通信を行い、SVPから該専用のハードウェアに対して応答が無い場合に、SVPに障害が発生したと判断するものである。また、第2の方法は、SVPに搭載されているアプリケーション・プログラムが、自己の動作を監視し、その結果、自己の動作が異常であると判断した場合に、SVPをリブート(再起動)するものである。
しかし、上述した第1の方法には、SVPを監視するための専用のハードウェアが二重化(冗長化)されていないため、該専用のハードウェアが故障すると、SVPに発生した障害を検出することができないという問題がある。或いは、SVPが(第1のSVP、第2のSVPと)二重化(冗長化)されているような場合には、二重化されているSVPが2台とも異常と判断されてしまう虞もある。また、上述した第2の方法には、SVPに搭載されているアプリケーション・プログラム自身が、期待した通りに動作しているか、換言すれば、所望の動作を行っているか否かを自己監視しているもので、(監視対象であるSVPの)ハードウェアに故障が発生して、アプリケーション・プログラムが動作しなくなった場合には、監視対象であるSVPに発生した異常を検出することができなくなるという問題が生じる。
そこで、上記に鑑みて、以下に記載するような構成のストレージ装置が本発明者により提案されている。
図5は、本発明の第2の実施形態に係るストレージ装置内部の回路構成を示すブロック図である。
図5に示すように、ストレージ装置101は、第1のSVP103と、第2のSVP105と、第1のクラスタ107と、第2のクラスタ109と、第1のSVP103側のHUB111と、第2のSVP105側のHUB113と、第1のクラスタ107側のHUB117と、第2のクラスタ109側のHUB119と、を備える。第1のSVP103と、第2のSVP105とは、同一の内部構成を備えている。
即ち、第1のSVP103は、ハードウェアであるSVP電源121、SVP電源制御回路123、HUB電源制御回路125、第1のLAN接続回路127、及び第2のLAN接続回路129と、アプリケーション・プログラムである監視アプリケーション131と、を備える。一方、第2のSVP105も、第1のSVP103におけると同様に、ハードウェアであるSVP電源133、SVP電源制御回路135、HUB電源制御回路137、第1のLAN接続回路139、及び第2のLAN接続回路141と、アプリケーション・プログラムである監視アプリケーション143と、を備える。
HUB117には、制御信号の非反転入力端子を持つ駆動電源117aが内蔵されている。同様に、HUB119には、制御信号の反転入力端子を持つ駆動電源119aが内蔵されている。
第1のクラスタ107には、複数のMP(図5では、図示と説明の都合上、符号145、145、145を付した3個のみを記載する)と、各々のMPに対応して設けられた複数のHUB(図5では、図示と説明の都合上、符号147、147、147を付した3個のみを記載する)と、が内蔵されている。同様に、第2のクラスタ109にも、複数のMP(図5では、図示と説明の都合上、符号149、149、149を付した3個のみを記載する)と、各々のMPに対応して設けられた複数のHUB(図5では、図示と説明の都合上、符号151、151、151を付した3個のみを記載する)と、が内蔵されている。
なお、符号153は、外部LAN155を通じて(ストレージ装置101内の)第1のSVP103、或いは第2のSVP105に接続される保守PCであり、符号157は、外部LAN155を通じて(ストレージ装置101内の)第1のSVP103、或いは第2のSVP105に接続される顧客端末、或いは遠隔保守センター端末等の外部端末である。
本実施形態では、第1のSVP103、及び第2のSVP105は、双方共に常時、所定の処理動作を何時でも実行可能な状態(以下、「駆動状態」と表記する)に置かれており、冗長化(二重化)された構成となっている。そして、第1のSVP103、及び第2のSVP105の駆動状態が共に正常である場合には、第1のSVP103が第2のSVP105に優先して所定の処理動作を実行し、第2のSVP105は、第1のSVP103が正常に所定の処理動作を実行している限りにおいて、待機状態になっている。
SVP電源制御回路123は、監視アプリケーション131からの制御動作の開始指令に基づき、第2のSVP105側のSVP電源133に対し、所定論理レベルの制御信号(SVP電源ON/OFF制御信号)を出力する。一方、HUB電源制御回路125は、HUB117の駆動電源117a、及びHUB119の駆動電源119aに対し、所定論理レベルの制御信号(HUB電源ON/OFF制御信号)を出力する。本実施形態では、HUB117側の駆動電源117a、及びHUB119側の駆動電源119aは、何れも論理レベル"L"の制御信号が印加されている場合に、オンになるように設定されているものとする。
第1のLAN接続回路127は、HUB111を通じてHUB117、及びHUB119に接続される。
第2のLAN接続回路129は、外部LAN155を通じて保守PC153、及び外部端末157に接続される。第1のLAN接続回路127が、HUB111を通じてHUB117、及びHUB119に接続され、且つ、第2のLAN接続回路129が、外部LAN155を通じて保守PC153、及び外部端末157に接続されることにより、第1のSVP103を通じたMP145〜MP145、MP149〜MP149と、保守PC153、及び外部端末157との間の交信が可能になる。
SVP電源121は、第1のSVP103を構成する上記各部に対し、駆動電源を供給する。SVP電源121による上記駆動電源の供給は、第2のSVP105側のSVP電源制御回路135から所定論理レベルのSVP電源ON制御信号が出力されていれば継続され、SVP電源ON制御信号からSVP電源OFF制御信号に切り替わることにより、停止される。
第1のSVP103が正常な状態で駆動している限りにおいて、第2のSVP105は、待機状態を継続する。第2のSVP105は、第1のSVP103と同一の内部構成を備えており、且つ、第1のSVP103と同様の処理動作を行うようになっているので、第2のSVP105の内部構成に関する詳細な説明は省略する。
HUB117の駆動電源117aには、制御信号の非反転入力端子を介して上記制御信号が入力され、一方、HUB119の駆動電源119aには、制御信号の反転入力端子を介して上記制御信号が入力される。即ち、駆動電源117aがオンで、HUB117が駆動状態にあるときには、駆動電源119aがオフで、HUB119は駆動停止状態に置かれる。これとは逆に、駆動電源117aがオフで、HUB117が駆動停止状態に置かれているときには、駆動電源119aがオンでHUB119は駆動状態になる。
第1のSVP103が正常に稼働しているときには、HUB117を駆動させるため、(第1のSVP103側の)HUB電源制御回路125からHUB電源ON/OFF制御信号として、論理レベル"L"の信号が出力され、これによりHUB117側の駆動電源117aがオンになる。しかし、上記論理レベル"L"の信号は、HUB119側の駆動電源119aには、反転入力端子を通じて論理レベルが"H"に反転されて印加されるので、HUB119側の駆動電源119aがオンになることはない。
上記とは逆に、第2のSVP105を、待機状態から起動させるに際しては、HUB119を駆動させるため、(第2のSVP105側の)HUB電源制御回路137からHUB電源ON/OFF制御信号として、論理レベル"H"の信号が出力され、これがHUB119側の駆動電源119aに、反転入力端子を通じて論理レベルが"L"に反転されて印加され、HUB119側の駆動電源119aがオンになる。しかし、HUB117側の駆動電源117aには、非反転入力端子を通じて論理レベル"H"の制御信号がそのまま印加されるので、HUB117側の駆動電源117aがオンになることはない。
なお、本実施形態では、図5に示すように、第1のSVP103側のHUB電源制御回路125、第2のSVP105側のHUB電源制御回路137のどちらからでも、HUB117側の駆動電源117a、及びHUB119側の駆動電源119aに対し、HUB電源ON/OFF制御信号を出力することが可能なように構成されている。
このように、一方のHUB(117)が駆動状態にあるときに、他方のHUB(119)を駆動停止状態に置くことによって、例えば第1のクラスタ107側のMP145から第1のSVP103、及び第2のSVP105へ転送されるべきデータが、重複されて転送される不具合を防止することができる。例えば、HUB117、119が共に駆動状態にある場合には、MP145から送出されるデータは、HUB147、HUB117、及びHUB111を介して第1のSVP103へ転送され、且つ、HUB147、HUB119、及びHUB111を介しても第1のSVP103へ転送されることになる。同時に、上記データは、HUB147、HUB117、及びHUB113を介して第2のSVP105へ転送され、且つ、HUB147、HUB119、及びHUB113を介しても第2のSVP105へ転送されることになる。
しかし、HUB119が駆動停止状態に置かれていれば、MP145から送出されるデータが、HUB147、HUB119、及びHUB111を介して第1のSVP103へ転送されることは無いし、上記データが、HUB147、HUB119、及びHUB113を介して第2のSVP105へ転送されることも無い。よって、第1のクラスタ107側のMP145から第1のSVP103、及び第2のSVP105へ転送されるべきデータが、重複されて転送される不具合を防止することができる。
第1のSVP103において、監視アプリケーション131は、起動することにより、SVP電源制御回路123、及びHUB電源制御回路125に対し、夫々制御動作の開始指令を送出する。監視アプリケーション131は、例えば第1のLAN接続回路127、及び第2のLAN接続回路129を通じて、第1のSVP103と第2のSVP105との間の通信テスト、第1のSVP103と全部のMP(145〜145、149〜149)との間の通信テストを実行し、それら通信テストの実行結果を、後述する管理テーブルに記録する。勿論、第2のSVP105との間の通信テストでは、第2のSVP105側で監視アプリケーション143が監視アプリケーション131と同様の処理動作を実行することが必要である。換言すれば、第1のSVP103、及び第2のSVP105は、相手方(のSVP)が正常に動作しているか否かを互いに監視し合っていることになる。
上記通信テストにおいて、例えば第2のSVP105側(の監視アプリケーション143)からの問い合わせに対し、一定時間が経過しても第1のSVP103側(の監視アプリケーション131)から応答が無い場合には、第2のSVP105(側の監視アプリケーション143)は、第1のSVP103に異常が発生したと判断する。これにより、SVP電源制御回路135は、第1のSVP103の駆動電源、即ち、SVP電源121に対し、SVP電源OFF制御信号を出力することにより、SVP電源121をオフにする。そして、第2のSVP105は、待機状態から直ちに第1のSVP103に替わって所定の処理動作を実行する。
監視アプリケーション131は、上述した全部のMP(145〜145、149〜149)との間の通信テスト、或いは、上記全部のMP(145〜145、149〜149)との間の通常の通信において、第1のSVP103が内蔵するフラッシュROMに格納されているストレージ装置101の構成情報、SIM(Service Information Message)、ログ、ストレージ装置101におけるイベント等の情報の更新を行う。監視アプリケーション131は、上記情報の更新を行うタイミングで、待機中の第2のSVP105側の監視アプリケーション143との間で通信を行う。この通信により、第2のSVP105側のフラッシュROMに格納されている上記と同一の情報も更新されるので、第1のSVP103、及び第2のSVP105は、常時、同一の情報を保有することになる。
ここで、MP(145〜145、149〜149)、保守PC153、外部端末(顧客端末、遠隔保守センター端末等)157は、第1のSVP103(の監視アプリケーション131)のIPアドレスに対して通信を行うため、待機中のSVPである第2のSVP105(の監視アプリケーション143)に対しては通信を行わない。第1のSVP103に故障(異常)が発生したことで、第2のSVP105が、待機状態から稼働状態に移行する場合には、第2のSVP105側の監視アプリケーション143は、SVP電源制御回路135を通じて第1のSVP103側のSVP電源121をオフにすると共に、第2のSVP105のIPアドレスを第1のSVP103の値に書き換える。これにより、MP(145〜145、149〜149)、保守PC153、外部端末(顧客端末、遠隔保守センター端末等)157は、第2のSVP(側の監視アプリケーション143)との間で通信が可能になる。
上記通信テストの方法としては、例えばLANのプロトコルであるPINGを使用して、通信の相手方(即ち、第2のSVP105や、MP(145〜145、149〜149))からの応答の有無により、通信の相手方(即ち、第2のSVP105や、MP(145〜145、149〜149))の正常/異常を判断する手法が用いられる。上記通信テストは、一定の時間間隔を置いて定期的に実施されると共に、通信テストの結果は、後述する管理テーブルに反映される。
例えば、第2のSVP105が稼働中で、第1のSVP103が待機中であると仮定して、監視アプリケーション131は、通信の相手方である第2のSVP105、HUB113、及びHUB119の駆動状態を、後述するような監視動作を実行することによって把握する。そして、後述するような『管理テーブル情報による故障の判断』の基準に従って、故障(異常)箇所を特定すると共に、第2のSVP105の駆動を停止させ、それまで待機中であった第1のSVP103を起動させる処理を実行する。
図6は、第1のSVP103、及び第2のSVP105において行われるSVP電源(121、133)のON/OFF切り替え制御の態様を示すブロック図である。
図6に示すように、第1のSVP103には、図5で示したSVP電源121として、2個のDC―DC電源161、163と、2個の逆流阻止用ダイオード165、167とが内蔵されている。上記に加えて、第1のSVP103には、外部から印加されるON/OFF制御信号によってスイッチング動作するスイッチング機構、例えば半導体スイッチング素子(以下、「スイッチング素子」と略記する)167と、SVP制御回路171とが、更に内蔵されている。
第2のSVP105も、第1のSVP103と同様に、図5で示したSVP電源133として、2個のDC―DC電源173、175と、2個の逆流阻止用ダイオード177、179とが内蔵されている。上記に加えて、第2のSVP105には、外部から印加されるON/OFF制御信号によってスイッチング動作するスイッチング素子(例えば半導体スイッチング素子)181と、SVP制御回路183とが、更に内蔵されている。
第1のSVP103において、DC―DC電源161は、例えば図5で示したストレージ装置101に内蔵されている第1の電源供給系統からの給電を受けて、スイッチング素子169がONしている場合には、所定の駆動電圧(DC電圧)を、逆流阻止用ダイオード165、スイッチング素子169を通じてSVP制御回路171に印加する。一方、DC―DC電源163は、例えばストレージ装置101に内蔵されている第2の電源供給系統からの給電を受けて、スイッチング素子169がONしている場合には、所定の駆動電圧(DC電圧)を、逆流阻止用ダイオード167、スイッチング素子169を通じてSVP制御回路171に印加する。
SVP制御回路171は、ON状態になっているスイッチング素子169を通じて、DC―DC電源161側(或いは、DC―DC電源163側)から印加される所定の駆動電圧によって駆動状態になり、図5で示した第1のSVP103を構成する各部の動作を制御する。SVP制御回路171には、第2のSVP105の駆動を停止させる情報(第2のSVP105のOFF情報)171bをセットするためのレジスタ171aが内蔵されている。第2のSVP105のOFF情報171bは、例えば図5で示した監視アプリケーション131が、第2のSVP105に故障(異常)が生じたことを検知したことで、レジスタ171aにセットされる。
スイッチング素子169は、第1のSVP103内において、プルアップ抵抗162により、所定電位にプルアップされている制御信号線164を通じて、第2のSVP105側のSVP制御回路183(のレジスタ183a)から出力されるSVP電源ON/OFF制御信号によって、ON/OFF動作を行う。スイッチング素子169がOFF動作するのは、例えば図5で示した監視アプリケーション143が、第1のSVP103に故障(異常)が生じたことを検知したことで、第1のSVP103のOFF情報183bを、レジスタ183aにセットした場合である。即ち、第1のSVP103のOFF情報183bが、レジスタ183aにセットされることにより、第1のSVP103内において、プルアップ抵抗162により、所定電位にプルアップされている制御信号線164を通じてレジスタ183aからスイッチング素子169にSVP電源OFF制御信号が印加される。これによって、スイッチング素子169がOFF動作し、第1のSVP103は、駆動停止状態になる。
第2のSVP105において、スイッチング素子181がOFF動作するのは、例えば図5で示した監視アプリケーション131が、第2のSVP105に故障(異常)が生じたことを検知したことで、第2のSVP105のOFF情報171bを、レジスタ171aにセットした場合である。即ち、第2のSVP105のOFF情報171bが、レジスタ171aにセットされることにより、第2のSVP105内において、プルアップ抵抗172により、所定電位にプルアップされている制御信号線174を通じてレジスタ171aからスイッチング素子181にSVP電源OFF制御信号が印加される。これによって、スイッチング素子181がOFF動作し、第2のSVP105は、駆動停止状態になる。
図7は、ストレージ装置101において行われるHUB117、119のON/OFF切り替え制御の態様を示すブロック図である。
図7に示すように、HUB117には、図5で示した駆動電源117aとして、2個のDC―DC電源191、193と、2個の逆流阻止用ダイオード195、197とが内蔵されている。上記に加えて、HUB117には、外部から印加されるON/OFF制御信号によってスイッチング動作するスイッチング機構、例えば半導体スイッチング素子(以下、「スイッチング素子」と略記する)199と、HUB制御回路201とが、更に内蔵されている。
HUB119も、HUB117と同様に、図5で示した駆動電源119aとして、2個のDC―DC電源203、205と、2個の逆流阻止用ダイオード207、209とが内蔵されている。上記に加えて、HUB119には、外部から印加されるON/OFF制御信号によってスイッチング動作するスイッチング素子(例えば半導体スイッチング素子)211と、HUB制御回路213と、インバータ215とが、更に内蔵されている。
HUB117において、DC―DC電源191は、例えば図5で示したストレージ装置101に内蔵されている第1の電源供給系統からの給電を受けて、スイッチング素子199がONしている場合には、所定の駆動電圧(DC電圧)を、逆流阻止用ダイオード195、スイッチング素子199を通じてHUB制御回路201に印加する。一方、DC―DC電源193は、例えばストレージ装置101に内蔵されている第2の電源供給系統からの給電を受けて、スイッチング素子199がONしている場合には、所定の駆動電圧(DC電圧)を、逆流阻止用ダイオード197、スイッチング素子199を通じてHUB制御回路201に印加する。
HUB制御回路201は、ON状態になっているスイッチング素子199を通じて、DC―DC電源191側(或いは、DC―DC電源193側)から印加される所定の駆動電圧によって駆動状態になり、HUB117を構成する各部の動作を制御する。
スイッチング素子199は、HUB117内において、プルアップ抵抗192により、所定電位にプルアップされている制御信号線194を通じて、論理レベル"L"の制御信号が印加されている場合にON状態を保持し、論理レベル"H"の制御信号が印加されると、ON状態からOFF状態に切り替わる。
HUB119において、DC―DC電源203、205、逆流阻止用ダイオード207、209、スイッチング素子211、プルアップ抵抗202、及びHUB制御回路213は、HUB117におけるDC―DC電源191、193、逆流阻止用ダイオード195、197、スイッチング素子199、プルアップ抵抗192、及びHUB制御回路201と夫々同一である。
スイッチング素子211も、スイッチング素子199におけると同様に、論理レベル"L"の制御信号が印加されている場合にON状態を保持し、論理レベル"H"の制御信号が印加されると、ON状態からOFF状態に切り替わる。スイッチング素子211には、外部から伝送されるON/OFF制御信号が、インバータ素子215において論理レベルが反転されてから印加される。
HUB電源制御回路125には、稼動させるHUBをHUB119からHUB117に切り替えるための情報125bをセットするレジスタ125aが内蔵されている。上記稼働させるHUBを切り替えるための情報125bは、例えば図5で示した監視アプリケーション131が、第2のSVP105に故障(異常)が生じたことを検知したことで、レジスタ125aにセットされる。上記切り替えるための情報125bが、レジスタ125aにセットされることで、レジスタ125aから論理レベル"L"の制御信号が出力される。レジスタ125aから出力される論理レベル"L"の制御信号は、制御信号線194を通じてHUB117へ印加されると共に、制御信号線204を通じてHUB119へも印加される。
HUB電源制御回路137には、稼動させるHUBをHUB117からHUB119に切り替えるための情報137bをセットするレジスタ137aが内蔵されている。上記稼働させるHUBを切り替えるための情報137bは、例えば図5で示した監視アプリケーション143が、第1のSVP103に故障(異常)が生じたことを検知したことで、レジスタ137aにセットされる。上記切り替えるための情報137bが、レジスタ137aにセットされることで、レジスタ137aから論理レベル"H"の制御信号が出力される。レジスタ137aから出力される論理レベル"H"の制御信号は、制御信号線194を通じてHUB117へ印加されると共に、制御信号線204を通じてHUB119へも印加される。
図8は、図5に記載の第1のSVP103、及び第2のSVP105が夫々備える管理テーブルを示す説明図である。
図8に示した管理テーブルは、図5に記載の監視アプリケーション131、143による通信テストの結果が記録されると共に、管理テーブルに記録される情報は、監視アプリケーション131、143による故障(異常)判断の基礎資料になる。
図8において、通信結果『1』は成功を、通信結果『0』は失敗を、夫々表している。第1のSVP103側の管理テーブルは、通信経路1−1、1−2、1−3における通信結果が何れも成功であったことを、一方、第2のSVP105側の管理テーブルは、通信経路2−1、2−2、2−3における通信結果が何れも失敗であったことを、夫々示している。
図9は、図8で示した管理テーブル情報に基づいて、監視アプリケーション131、143が行った第1のSVP103、第2のSVP105についての故障の判断結果と、該判断結果に基づく対応の内容とを示す説明図である。
図9では、第1のSVP103、第2のSVP105についての故障の判断結果の例として、符号(a)、(b)、(c)で示す3つのケースが列挙されている。夫々のケースでは、各SVP(103、105)毎に6つの通信経路(1−1、1−2、1−3、2−1、2−2、2−3)につき合計で6回の通信テストが実施されている。
まず、符号(a)で示す第1のケースにおいて、第1のSVP103について行われた最初の通信テストでは、何の対応も為されていない。これは、通信テストの結果、第1のSVP103が正常稼働していると判断されたためである。次に、第2回目乃至第4回目の通信テストでは、夫々HUB117に故障が生じたと判断され、HUB117をオフにしてHUB119をオンにする切り替え処理と、HUB117が故障した旨の通報とが対応として為されている。次に、第5回目と第6回目の通信テストでは、何れも故障発生箇所の特定が行えず、後述する第2のケースにおいて改めて故障発生箇所を判断する対応と、HUB117をオフにしてHUB119をオンにする切り替え処理とが為されている。一方、第2のSVP105について行われた最初の通信テストにおいても、上述した第1のSVP103について行われた最初の通信テストにおけると同様の判断、及び対応が為されている。
次に、符号(b)で示す第2のケースにおいて、第1のSVP103について行われた最初の通信テストと第3回目の通信テストでは、何れもHUB117に故障が生じたと判断され、HUB117が故障した旨の通報が対応として為されている。次に、第2回目の通信テストでは、HUB117と、HUB119と第2のSVP105とを接続するためのLANに故障が生じたと判断され、HUB117が故障した旨の通報が対応として為されている。次に、第4回目の通信テストでは、HUB117、119の双方に故障が生じたか、若しくは、MP側に故障が生じたものと判断され、それらが故障した旨の通報が対応として為されている。次に、第5回目の通信テストでは、HUB119に故障が生じたと判断され、HUB119をオフにしてHUB117をオンにする切り替え処理と、HUB119が故障した旨の通報とが対応として為されている。次に、第6回目の通信テストでは、HUB119に故障が生じたか、若しくは、HUB117、119の双方に故障が生じたものと判断され、HUB119をオフにしてHUB117をオンにする切り替え処理と、故障が生じた旨の通報とが、対応として為されている。一方、第2のSVP105について行われた第1回目乃至第4回目の通信テストにおいては、上述した第1のSVP103について行われた第1回目乃至第4回目の通信テストにおけると同様の判断、及び対応が為されている。次に、第5回目と第6回目の通信テストでは、何れもHUB119をオフにしてHUB117をオンにする切り替え処理と、障害部位の判断については、第1のSVP103を優先させる処理とが、対応として為されている。
次に、符号(c)で示す第3のケースにおいて、第1のSVP103について行われた第1回目乃至第5回目の通信テストでは、上述した符号(b)で示した第2のケースにおける第1のSVP103について行われた第1回目乃至第5回目の通信テストと同様の対応が為されている。次に、第6回目の通信テストでは、HUB117に故障が生じたものと判断され、第1のSVP103を稼働停止させて第2のSVP105を稼働させる切り替え処理と、HUB119をオフにしてHUB117をオンにする切り替え処理と、第1のSVP103に故障が生じた旨の通報とが、対応として為されている。一方、第2のSVP105について行われた第1回目の通信テストと第3回目の通信テストでは、HUB117が故障した旨の通報が、第2回目の通信テストでは、HUB117と、HUB119と第2のSVP105とを接続するためのLANに故障が生じた旨の通報が、夫々対応として為されている。次に、第4回目の通信テストでは、HUB117、119の双方に故障が生じたか、若しくは、MP側に故障が生じた旨の通報が対応として為されている。次に、第5回目の通信テストでは、第1のSVP103について行われた第6回目の通信テストと同様の対応が為されている。次に、第6回目の通信テストでは、HUB119をオフにしてHUB117をオンにする切り替え処理と、障害部位の判断については、第1のSVP103を優先させる処理とが、対応として為されている。
図10は、監視アプリケーション131、143が、図8で示した管理テーブル情報に基づいて実施する処理動作を示すフローチャートである。
図10において、まず、第1のSVP103の駆動電源(SVP電源)121をオンにすると共に(ステップS221)、相手方SVP(第2のSVP105)の所持する管理テーブルの情報を入手する(ステップS222)。そして、該入手した管理テーブルの情報を参照し(ステップS223)、例えば、図9で示した、管理テーブル情報による故障の判断のパターンに従って第1のSVP103、第2のSVP105、HUB117、119に故障(異常)が生じたか否か判断する(ステップS224)。
上述した本発明の第2の実施形態によれば、第1のSVP103、第2のSVP105とMP(145〜145、149〜149)との間の通信経路や、SVPによるストレージ装置101内部の状態監視を二重化したので、第1のSVP103、第2のSVP105によるストレージ装置101に係わる障害通報、及び情報取得作業における信頼性の向上を図ることが可能である。
ところで、上述した本発明の第1、第2の実施形態では、何れも操作性の要求されるストレージ装置(3、101)に対する諸々の設定作業や、保守作業等は、保守PC(7、153)に、一方、何れも高い信頼性が要求されるストレージ装置(3、101)に対する監視機能、及び遠隔保守センター端末(13)や顧客端末(5)への通報機能等は、第1のSVP(23、103)、及び第2のSVP(25、105)に夫々分担させている。そのため、本発明の第1、第2の実施形態においては、保守作業時に、ストレージ装置(3、101)に係わる情報を、第1のSVP(23、103)、又は第2のSVP(25、105)を通じて保守PC(7、153)にダウンロードする必要が生じる。
図11は、本発明の第3の実施形態に係るストレージ装置を備える情報処理システムにおいて、該システムを構成する各部の間で行われるデータ通信の手順を示すフローチャートである。
図11に記載のハードウェアの構成は、図5で示した情報処理システムのハ−ドウェアの構成に対応している。図11では、符号233を付した第1のSVPが2個記載されているが、これら2個の第1のSVPは、同一のハードウェアである。第1のSVP233はゲートウェイ的な機能を有するが、アプリケーションでは機能しない。
また、符号237で示した1個のMPは、例えば図5で示した複数のMP(145〜145、149〜149)を表している。MP237は、常に指定されたIPアドレスにアクセスする。IPアドレスとして指定されるのは、第1のSVP233のもの(IPアドレス)に限定されるため、MP237は、第1のSVP233のIPアドレスしか知らないから、MP237からのアクセスは、第1のSVP233に限定される。
保守PC231については、例えば所謂デスクトップ型の固定端末でも良いし、保守員が携帯し得るモバイル端末であっても差し支えない。保守PC231には、操作用のプログラムが搭載されている。なお、図11で示す処理動作は、第1のSVP233を中心として行われる。
図11において、まず、MP237は、ストレージ装置(例えば図5で示したストレージ装置101)内において発生した障害に係わる情報、ログ、イベントに係わる情報等を、ストレージ装置の内部LANを通じて、第1のSVP233に転送する(ステップS241)。MP237からの上記情報を受信すると、第1のSVP233は、上記情報を第1のSVP233内の所定の記憶エリア(情報格納エリア)に書き込む(ステップS242)。上記情報は、監視アプリケーション(図5において、符号131、143で示した)が、SNMP又は障害通報が必要であると判断した場合に、第1のSVP233から通報される。
次に、第1のSVP233は、待機状態に置かれている第2のSVP235に対し、情報格納エリアに書き込まれている上記情報を転送する。上記情報は、第2のSVP235によって受信されると、第2のSVP235内の所定の記憶エリア(情報格納エリア)に書き込まれる(これにより、該情報格納エリアに書き込まれている従前の情報が、更新される)。これにより、第2のSVP235は、第1のSVP233と同一の情報を保有することになる(ステップS243)。
しかし、一定の期間が経過しても、第1のSVP233から上記情報が転送されてこない場合には、第2のSVP235は、第1のSVP233に対し、情報転送要求を発する(ステップS244)。この情報転送要求を受信すると、第1のSVP233は、情報格納エリアに保存されている情報を読み出して、該情報を第2のSVP235へ転送する(ステップS245)。上記情報は、第2のSVP235によって受信されると、第2のSVP235内の情報格納エリアに書き込まれる(コピーされる)(ステップS246)。ステップS244乃至ステップS246で示した処理を実行する理由は、第1のSVP233が保有する情報と、第2のSVP235が保有する情報との間に不一致が生じる可能性を少なくするために、一定期間が経過しても第1のSVP233から情報が転送されない場合には、第1のSVP233が保有する情報を第2のSVP235がコピーすることにより、第1のSVP233が保有する情報と第2のSVP235が保有する情報との間の不一致が生じないようにしている。
次に、保守PC231が第1のSVP233にログインすると(ステップS247)、第1のSVP233の情報格納エリアに保存されている情報が、第1のSVP233から保守PC231へ転送され、該情報が保守PC231内の情報格納エリアに書き込まれる(ステップS248)。保守PC231に搭載されているアプリケーション(即ち、上述した操作用のプログラム)は、上記情報を基に、ストレージ装置(101)の構成や状況(ストレージ装置(101)の環境)を認識し、第1のSVP233を通じてMP237と接続し、ストレージ装置(101)の保守操作を実行することになる。即ち、保守PC231のオペレータは、保守PC231を操作して保守PC231上で操作画面を作成し、該操作画面を利用してオペレータが指令をMP237側へ転送する(ステップS249)。
図12は、従来のストレージ装置の全体構成、及び従来のSVPの全体構成を夫々示す斜視図であり、図13は、本発明の第4の実施形態に係るストレージ装置の全体構成、及び本発明の第4の実施形態に係るSVPの全体構成を示す斜視図である。
図12において、図12(a)で示す従来のストレージ装置では、二重化されたSVP251a、251bの実装位置が、ストレージ装置250内部の最上部の、HDDボックス253の設置位置の側面に設定されている。なお、ストレージ装置250内部において、HDDボックス253の下方にはロジックボックス255が、ロジックボックス255の下方には電源装置257が、更に、電源装置257の下方、即ち、ストレージ装置250の最下部にはバッテリ259が、夫々設置されている。
一方、図12(b)で示す従来のSVPは、ボード261上に、CPU263、ファン265a、265bを持つ電源装置265、ファン267aを持つHDD267、CD−ROM269、及びFDD271を備える。
上記のように、従来のSVPは、HDD267、CD−ROM269、及びFDD271が実装されているので、SVP全体としてハードウェアが大型化せざるを得ないから、実装位置も、例えば図12(a)で示したストレージ装置250内部の最上部の、HDDボックス253の設置位置の側面のような、振動や電気的ノイズ等に対して不利で、且つ、冷却し難い場所にならざるを得ない。そのため、ファン265a、265b、267a等を設けて、SVP自身の冷却を行わなければならなかった。換言すれば、従来のSVPは、ハードウェア自体が大きい上に、稼働部品点数が多いため、振動や電気的ノイズ等を受け難く、且つ、冷却効果を受け易いロジックボックス中に実装することは不可能であった。
そこで、上記に鑑みて、本発明の第4の実施形態に係るストレージ装置、及びSVP、即ち、図13(a)で示した構成のストレージ装置、及び図13(b)で示した構成のSVPが提案されている。
図13において、図13(a)で示す本発明の第4の実施形態に係るストレージ装置では、2重化されたSVP281a、281bの実装位置が、ストレージ装置280内部の略中央のロジックボックス285中に設定されている。なお、ストレージ装置280内部の最上部には、HDDボックス283が、ストレージ装置280内部のロジックボックス285の下方には電源装置287が、更に、電源装置287の下方、即ち、ストレージ装置280の最下部にはバッテリ289が、夫々設置されている。
一方、図13(b)で示す本発明の第4の実施形態に係るSVPは、ボード291上に、CPU293、及びDC―DC電源295のみを備えた構成になっている。SVPを、図13(b)で示したように、ボード291上からCD‐ROM、HDD、及びFDDを除去して、CPU293、及びDC―DC電源295の電気部品のみを備えた構成とすることにより、図13(b)と図12(b)とを比較対照すれば明らかなように、SVP全体としての大きさを小さくでき、厚みを薄くすることができるので、パッケージ1枚でSVPの機能を実現できる。
しかも、SVPが、ロジックボックス285中の標準のロジック基板内に収める規模にまで、SVP全体としての大きさを小さくでき、厚みを薄くすることが可能になるから、図12に示した従来のSVPとは異なり、振動、電気的ノイズ、冷却等への対策を講じなくてもよくなった。
図14は、図12で示した従来のストレージ装置とは別の従来のストレージ装置の全体構成を示す斜視図であり、図15は、本発明の第5の実施形態に係るストレージ装置の全体構成を示す斜視図である。
図14で示す別の従来のストレージ装置では、所定大きさのラック300中の最上部から最下部に向かって、第1のHDDボックス301、第1のバッテリユニット303、第2のHDDボックス305、第2のバッテリユニット307の順に設置されている。一方、上記ラック300の最下部から最上部に向かって、複数個(図14では4個)のACボックス309、複数個(図14では6個)のバッテリ311、OP−パネル313、複数枚のロジック基板315が積層状に配置されたロジックボックスユニット317の順に配置されている。そして、SVPは、符号319で示すように、第2のバッテリユニット307とロジックボックスユニット317との間に実装されており、ラック300中の1ユニット分のエリアを占有している。勿論、SVPを二重化した場合には、2つのSVPによってラック300中の2ユニット分のエリアを占有することになる。
これに対して、本発明の第5の実施形態に係るストレージ装置では、(SVPを二重化しているため)図13(b)で説明したような、ロジックボックス中の標準の基板内に収める規模にまで、小型化し、肉厚を薄くした2個のSVP331、333が、積層状に配置された複数枚のロジック基板315と共にロジックボックスユニット317内に実装された構成となっている。なお、図15において、上記構成以外の各部である第1のHDDボックス、第1のバッテリユニット、第2のHDDボックス、第2のバッテリユニット、複数個(図15では4個)のACボックス、複数個(図15では6個)のバッテリ、OP−パネルについては、図14に示したものと同一符号を付して、それらの詳細な説明を省略する。
上述した本発明の第5の実施形態によれば、図14に示した従来のストレージ装置におけるよりも、SVPに対する振動、電気的ノイズの悪影響を低減でき、且つ、冷却等につき、特別に対策を講じなくてもよくなった。
以上、本発明の好適な実施形態を説明したが、これらは本発明の説明のための例示であって、本発明の範囲をこれらの実施形態にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実施することが可能である。
本発明の第1の実施形態に係るストレージ装置を備える情報処理システムの全体構成を示すブロック図。 図1に記載したストレージ装置の全体構成を示すブロック図。 図1に記載したストレージ装置が備える第1のSVP、第2のSVPの回路構成の詳細を示すブロック図。 図1で示した第1のSVP(又は第2のSVP)、保守PC、顧客端末、及び遠隔保守センター端末が夫々有する機能の一覧を示した説明図。 本発明の第2の実施形態に係るストレージ装置内部の回路構成を示すブロック図。 第1のSVP、及び第2のSVPにおいて行われるSVP電源のON/OFF切り替え制御の態様を示すブロック図。 ストレージ装置において行われるHUBのON/OFF切り替え制御の態様を示すブロック図。 図5に記載した第1のSVP、及び第2のSVPが夫々備える管理テーブルを示す説明図。 図8で示した管理テーブル情報に基づいて、監視アプリケーションが行った第1のSVP、第2のSVPについての故障の判断結果と、該判断結果に基づく対応の内容とを示す説明図。 監視アプリケーションが、図8で示した管理テーブル情報に基づいて実施する処理動作を示すフローチャート。 本発明の第3の実施形態に係るストレージ装置を備える情報処理システムにおいて、該システムを構成する各部の間で行われるデータ通信の手順を示すフローチャート。 従来のストレージ装置の全体構成、及び従来のSVPの全体構成を夫々示す斜視図。 本発明の第4の実施形態に係るストレージ装置の全体構成、及び本発明の第4の実施形態に係るSVPの全体構成を示す斜視図。 図12で示した従来のストレージ装置とは別の従来のストレージ装置の全体構成を示す斜視図。 本発明の第5の実施形態に係るストレージ装置の全体構成を示す斜視図。
符号の説明
1 上位装置
3 ストレージ装置
5 顧客端末
7 保守PC
9 ダイヤルアップルータ
11 公衆電話回線網
13 遠隔保守センター端末
15、17 MP(マイクロプロセッサ)
19 システムメモリ
21 記憶デバイス
23 SVP(サービスプロセッサ)1
25 SVP(サービスプロセッサ)2
27 (ストレージ装置内の)システムバス
29 (ストレージ装置内の)情報ネットワーク
31 通信ネットワーク
33 外部LAN

Claims (17)

  1. 通信ネットワークを通じて監視・保守用端末との間で通信を行うストレージ装置と、
    前記ストレージ装置各部に対し、必要な設定作業、及び保守管理作業を行うための第1の情報処理端末と、
    前記ストレージ装置各部の状態を監視して、前記ストレージ装置にイベントが発生したことを認識した場合に、該イベント発生を前記監視・保守用端末へ通報する第2の情報処理端末と、
    を備えるストレージ装置システム。
  2. 請求項1記載のストレージ装置システムにおいて、
    前記ストレージ装置が、通信ネットワークを通じて更にユーザ端末との間でも通信を行うストレージ装置システム。
  3. 請求項2記載のストレージ装置システムにおいて、
    前記第2の情報処理端末からの通報が、ユーザ端末へのSNMP通報を含むストレージ装置システム。
  4. 請求項3記載のストレージ装置システムにおいて、
    前記第2の情報処理末が、記憶デバイスとして、磁気記録媒体以外の記憶デバイスを備えるストレージ装置システム。
  5. 請求項1記載のストレージ装置システムにおいて、
    前記第1の情報処理端末には、GUIを持ったOSが搭載されており、
    前記第1の情報処理端末は、前記第2の情報処理端末を通じて、ストレージ装置内の記憶デバイスを制御する情報処理部との間で通信を行って、ストレージ装置の保守管理に必要な処理を実行するストレージ装置システム。
  6. 通信ネットワークを通じて監視・保守用端末との間で通信を行うストレージ装置と、
    前記ストレージ装置各部に対し、必要な設定作業、及び保守管理作業を行うための第1の情報処理端末と、
    前記ストレージ装置各部の状態を監視して、前記ストレージ装置にイベントが発生したことを認識した場合に、該イベント発生を前記監視・保守用端末へ通報する第2の情報処理端末と、
    を備え、
    前記第2の情報処理端末が、少なくとも稼働中の情報処理端末と待機中の情報処理端末との2台の情報処理端末であり、
    前記各々の第2の情報処理端末が、互いの間で通信を行うことによって相手方情報処理端末の状態を監視する状態監視部を含み、
    前記待機中の第2の情報処理端末の状態監視部が、前記稼動中の第2の情報処理端末の状態を異常と判断した場合には、前記稼動中の第2の情報処理端末の動作を停止させると共に、前記待機中の第2の情報処理端末を稼働させるようにしたストレージ装置システム。
  7. 請求項6記載のストレージ装置システムにおいて、
    前記2台の第2の情報処理端末と、前記ストレージ装置内の記憶デバイスを制御する情報処理部との間を接続する通信経路が、二重化されているストレージ装置システム。
  8. 請求項6記載のストレージ装置システムにおいて、
    前記各々の状態監視部が、相手方端末である第2の情報処理端末の状態監視部に対して通信を行ってから一定時間が経過しても相手方端末である第2の情報処理端末の状態監視部から応答が無い場合に、相手方端末である第2の情報処理端末の状態を異常と判断するようにしたストレージ装置。
  9. 請求項6記載のストレージ装置システムにおいて、
    前記各々の第2の情報処理端末が、相手方端末である第2の情報処理端末との間で通信テストを行った結果を示す情報を記録した管理テーブルを持っているストレージ装置システム。
  10. 請求項9記載のストレージ装置システムにおいて、
    前記通信テストが、前記各々の第2の情報処理端末同士の間を接続する複数の通信経路別に行われるストレージ装置システム。
  11. 請求項9又は請求項10記載のストレージ装置システムにおいて、
    前記各々の第2の情報処理端末が、相手方端末である第2の情報処理端末との間で通信テストを行った結果得られた、相手方端末である第2の情報処理端末における故障の有無、及び故障箇所を検知するためのパターン情報を持っているストレージ装置システム。
  12. 請求項9乃至請求項11の何れか1項記載のストレージ装置システムにおいて、
    前記各々の状態監視部が、前記管理テーブルに記録されている情報と、前記パターン情報とを参照して相手方端末である第2の情報処理端末の状態が異常か否か判断するストレージ装置システム。
  13. 請求項6記載のストレージ装置システムにおいて、
    前記各々の状態監視部が、相手方端末である第2の情報処理端末の状態を異常と判断した場合に、相手方端末である第2の情報処理端末の駆動電源からの相手方端末である第2の情報処理端末各部への給電をオフにすることで、相手方端末である第2の情報処理端末の動作を停止させるようにしたストレージ装置システム。
  14. 請求項6記載のストレージ装置システムにおいて、
    前記稼動中の第2の情報処理端末が、前記ストレージ装置内の記憶デバイスを制御する情報処理部との間で通信を行うことにより、前記稼動中の第2の情報処理端末の情報格納部に格納している前記ストレージ装置に係わる情報を更新するタイミングで、前記待機中の第2の情報処理端末との間で通信を行うストレージ装置システム。
  15. 請求項14記載のストレージ装置システムにおいて、
    前記待機中の第2の情報処理端末が、前記稼動中の第2の情報処理端末との間で通信を行うタイミングで、前記待機中の第2の情報処理端末の情報格納部に格納している前記ストレージ装置に係わる情報を更新するようにしたストレージ装置システム。
  16. 請求項6記載のストレージ装置システムにおいて、
    前記第1の情報処理端末が、モバイル端末、又はデスクトップ型の固定端末の何れかであるストレージ装置システム。
  17. ストレージ装置本体と、
    前記ストレージ装置本体内に収容される、複数のHDDを収容するHDDボックス、複数のロジック基板を収容するロジックボックス、電源装置、及びサービスプロセッサと、
    を備え、
    前記サービスプロセッサが、小型化されて、前記ロジックボックス中の標準的なロジック基板内に実装されているストレージ装置。
JP2004292170A 2004-10-05 2004-10-05 ストレージ装置システム Withdrawn JP2006107080A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004292170A JP2006107080A (ja) 2004-10-05 2004-10-05 ストレージ装置システム
US10/998,758 US7650532B2 (en) 2004-10-05 2004-11-30 Storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004292170A JP2006107080A (ja) 2004-10-05 2004-10-05 ストレージ装置システム

Publications (1)

Publication Number Publication Date
JP2006107080A true JP2006107080A (ja) 2006-04-20

Family

ID=36127085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004292170A Withdrawn JP2006107080A (ja) 2004-10-05 2004-10-05 ストレージ装置システム

Country Status (2)

Country Link
US (1) US7650532B2 (ja)
JP (1) JP2006107080A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007328408A (ja) * 2006-06-06 2007-12-20 Hitachi Ltd ストレージシステム及び記憶制御装置
JP2008217682A (ja) * 2007-03-07 2008-09-18 Nec Corp 監視システムおよび監視方法ならびにプログラム
JP2010033466A (ja) * 2008-07-30 2010-02-12 Hitachi Ltd ストレージ装置及びその制御方法
US8996924B2 (en) 2011-02-24 2015-03-31 Fujitsu Limited Monitoring device, monitoring system and monitoring method
US10511489B2 (en) 2015-09-30 2019-12-17 Hitachi, Ltd. Storage operational management service providing apparatus, storage operational management service providing method, and storage operational management system

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107080A (ja) * 2004-10-05 2006-04-20 Hitachi Ltd ストレージ装置システム
US7818630B2 (en) * 2006-01-18 2010-10-19 International Business Machines Corporation Framework for automatically analyzing I/O performance problems using multi-level analysis
GB0612573D0 (en) * 2006-06-24 2006-08-02 Ibm System and method for detecting routing problems
WO2008069480A1 (en) * 2006-12-04 2008-06-12 Electronics And Telecommunications Research Institute Portable storage device for supporting portable computing system and portable computing based system using the same
KR100892417B1 (ko) * 2006-12-04 2009-04-10 한국전자통신연구원 이동식 컴퓨팅 체제를 지원하는 이동식 저장 장치 및 이를이용한 이동식 컴퓨팅 체제 시스템
JP4551947B2 (ja) * 2008-05-23 2010-09-29 株式会社日立製作所 ストレージシステムを構成する電子機器を管理する装置
WO2011055406A1 (en) * 2009-11-04 2011-05-12 Hitachi, Ltd. Data storage system and method therefor
JP5923976B2 (ja) * 2011-12-27 2016-05-25 富士通株式会社 接続装置、ストレージ装置、接続装置における処理方法、および処理プログラム
JP5983102B2 (ja) * 2012-07-02 2016-08-31 富士通株式会社 監視プログラム、方法及び装置
JP2014048782A (ja) * 2012-08-30 2014-03-17 Fujitsu Ltd 情報処理装置、及び情報処理装置の障害処理方法
USRE48835E1 (en) 2014-04-30 2021-11-30 Rubrik, Inc. Network addressable storage controller with storage drive profile comparison
US9081828B1 (en) 2014-04-30 2015-07-14 Igneous Systems, Inc. Network addressable storage controller with storage drive profile comparison
US8935567B1 (en) * 2014-04-30 2015-01-13 Igneous Systems, Inc. Network addressable storage controller with storage drive profile comparison
US20160092310A1 (en) * 2014-09-30 2016-03-31 Vivint, Inc. Systems and methods for managing globally distributed remote storage devices
US9116833B1 (en) 2014-12-18 2015-08-25 Igneous Systems, Inc. Efficiency for erasure encoding
US9361046B1 (en) 2015-05-11 2016-06-07 Igneous Systems, Inc. Wireless data storage chassis
US10089178B2 (en) * 2016-02-29 2018-10-02 International Business Machines Corporation Developing an accurate dispersed storage network memory performance model through training
KR20170121622A (ko) * 2016-04-25 2017-11-02 엘에스산전 주식회사 인버터 제어장치
CN110191190A (zh) * 2019-06-06 2019-08-30 四川京炜交通工程技术有限公司 一种隧道机电设备的维护检测系统及方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0683657A (ja) 1992-08-27 1994-03-25 Hitachi Ltd サービスプロセッサの切り換え方式
US6421754B1 (en) * 1994-12-22 2002-07-16 Texas Instruments Incorporated System management mode circuits, systems and methods
US5764878A (en) * 1996-02-07 1998-06-09 Lsi Logic Corporation Built-in self repair system for embedded memories
US5764913A (en) * 1996-04-05 1998-06-09 Microsoft Corporation Computer network status monitoring system
IL119062A0 (en) * 1996-08-13 1996-11-14 Madge Networks Israel Ltd Apparatus and method for detecting a layout of a switched local network
US6393386B1 (en) * 1998-03-26 2002-05-21 Visual Networks Technologies, Inc. Dynamic modeling of complex networks and prediction of impacts of faults therein
JP2000353154A (ja) 1999-06-10 2000-12-19 Nec Corp 障害監視システム
JP2001022712A (ja) 1999-07-13 2001-01-26 Hitachi Ltd 情報処理装置の初期設定方式
US7627694B2 (en) * 2000-03-16 2009-12-01 Silicon Graphics, Inc. Maintaining process group membership for node clusters in high availability computing systems
US7275103B1 (en) * 2002-12-18 2007-09-25 Veritas Operating Corporation Storage path optimization for SANs
JP2006107080A (ja) * 2004-10-05 2006-04-20 Hitachi Ltd ストレージ装置システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007328408A (ja) * 2006-06-06 2007-12-20 Hitachi Ltd ストレージシステム及び記憶制御装置
JP2008217682A (ja) * 2007-03-07 2008-09-18 Nec Corp 監視システムおよび監視方法ならびにプログラム
JP2010033466A (ja) * 2008-07-30 2010-02-12 Hitachi Ltd ストレージ装置及びその制御方法
US8996924B2 (en) 2011-02-24 2015-03-31 Fujitsu Limited Monitoring device, monitoring system and monitoring method
US10511489B2 (en) 2015-09-30 2019-12-17 Hitachi, Ltd. Storage operational management service providing apparatus, storage operational management service providing method, and storage operational management system

Also Published As

Publication number Publication date
US20060075292A1 (en) 2006-04-06
US7650532B2 (en) 2010-01-19

Similar Documents

Publication Publication Date Title
JP2006107080A (ja) ストレージ装置システム
JP4723290B2 (ja) ディスクアレイ装置及びその制御方法
JP4786312B2 (ja) 記憶制御装置及び記憶制御装置のエラー情報管理方法
US8516294B2 (en) Virtual computer system and control method thereof
JP5057741B2 (ja) ストレージ装置
US8392756B2 (en) Storage apparatus and method of detecting power failure in storage apparatus
JP4274523B2 (ja) 記憶装置システム、及び記憶装置システムの起動方法
JP5959733B2 (ja) ストレージシステムおよびストレージシステムの障害管理方法
JP5561622B2 (ja) 多重化システム、データ通信カード、状態異常検出方法、及びプログラム
WO2011141963A1 (en) Information processing apparatus and data transfer method
US7568119B2 (en) Storage control device and storage control device path switching method
JP2008134829A (ja) 節電機能を備えたストレージシステム
JP2007086972A (ja) ストレージシステム、二重化制御方法、及びプログラム
JP2008102804A (ja) 電源装置及び電源装置の電源供給方法
US7730474B2 (en) Storage system and automatic renewal method of firmware
JP2006031630A (ja) ストレージ装置及びストレージ装置の消費電力制御方法
JP2005267111A (ja) 記憶制御システム及び記憶制御システムの制御方法
JP2005339216A (ja) 記憶制御システム
JP2009015584A (ja) 記憶制御装置及び筐体単位の電源制御方法
US8095820B2 (en) Storage system and control methods for the same
WO2013046248A1 (en) Storage system and its control method
JP2005222404A (ja) 仮想記憶ユニットを備えた記憶制御サブシステム
JP3957065B2 (ja) ネットワーク計算機システムおよび管理装置
JP2006235673A (ja) ディスクアレイ装置
US20110231674A1 (en) Independent drive power control

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070808

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090525