JP2005251078A - 情報処理装置、及び情報処理装置の制御方法 - Google Patents

情報処理装置、及び情報処理装置の制御方法 Download PDF

Info

Publication number
JP2005251078A
JP2005251078A JP2004063959A JP2004063959A JP2005251078A JP 2005251078 A JP2005251078 A JP 2005251078A JP 2004063959 A JP2004063959 A JP 2004063959A JP 2004063959 A JP2004063959 A JP 2004063959A JP 2005251078 A JP2005251078 A JP 2005251078A
Authority
JP
Japan
Prior art keywords
communication
communication port
path
data input
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004063959A
Other languages
English (en)
Other versions
JP2005251078A5 (ja
Inventor
Yasuhiro Matsuda
康博 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004063959A priority Critical patent/JP2005251078A/ja
Priority to US10/837,565 priority patent/US7020089B2/en
Publication of JP2005251078A publication Critical patent/JP2005251078A/ja
Priority to US11/302,218 priority patent/US7519001B2/en
Publication of JP2005251078A5 publication Critical patent/JP2005251078A5/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/552Prevention, detection or correction of errors by ensuring the integrity of packets received through redundant connections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/356Switches specially adapted for specific applications for storage area networks
    • H04L49/357Fibre channel switches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/557Error correction, e.g. fault recovery or fault tolerance

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】異状部位の特定を短時間で行える制御方法を提供する。
【解決手段】複数の第1通信ポートを有する情報処理装置と複数の第2通信ポートを有するスイッチと複数の第3通信ポート及び複数の記憶ボリュームを有するストレージ装置とを備え、第1通信ポート及び第3通信ポートが第2通信ポートと1対1に通信可能に接続されてなる情報処理システムにおける情報処理装置であって、第1通信ポートから第1記憶ボリュームへの第1通信路による第1データ入出力要求に対するストレージ装置からの応答を所定時間内に受信できない場合に、第1通信路上の第1ポートから、第2、第3通信路によりそれぞれ第2、第3のデータ入出力要求を送信し、第1通信路上の第2通信ポートの検査要求をスイッチに送信し、第2、第3データ入出力要求に対する応答を所定時間内に受信せず、検査要求に対する応答を所定時間内に受信した場合には第1通信路上の第1通信ポートを異常と判定する。
【選択図】図3

Description

本発明は、情報処理装置、及び情報処理装置の制御方法に関する。
近年、情報処理装置とディスクアレイ装置などのストレージ装置との間をSAN(Storage Area Network)などのネットワークで通信可能に接続する構成の情報処理システムが実現されている。このような情報処理システムでは、情報処理装置とストレージ装置との間はスイッチを介して接続され、通信アルゴリズムに従って適宜に選択された通信路により、ストレージ装置に記憶されるデータの読み書きが行われる。
特開2003−167794号公報
ところで、このような構成においては、情報処理装置からストレージ装置に記憶されるデータの読み書きが正常に行えなくなった場合に、通信路のどこで異常が発生したのかを特定することは困難であり、多くの時間と労力を必要とする。
異常部位特定の長時間化は情報処理システムの可用性を低下させることになる。そのため、異常部位の特定を短時間で行えるようにするための技術が切望されている。
本発明は上記課題を鑑みてなされたものであり、情報処理装置、及び情報処理装置の制御方法を提供することを主たる目的とする。
上記課題を解決するために、本発明は、複数の第1の通信ポートを有する情報処理装置と、複数の第2の通信ポートを有するスイッチと、複数の第3の通信ポート及び複数の記憶ボリュームを有するストレージ装置とを備え、前記第1の通信ポート及び前記第3の通信ポートが前記第2の通信ポートと1対1に通信可能に接続されてなる情報処理システムにおける前記情報処理装置であって、前記第1の通信ポートの識別子と、前記第1の通信ポートに接続される前記第2の通信ポートの識別子とにより特定される第1のパス、前記第3の通信ポートの識別子と、前記第3の通信ポートに接続される前記第2の通信ポートの識別子とにより特定される第2のパス、及び前記第3の通信ポートの識別子と第1の前記記憶ボリュームの識別子とにより特定される第3のパス、により特定される、前記第1の通信ポートから前記第1の記憶ボリュームへの第1の通信路により第1のデータ入出力要求を送信する第1のデータ入出力要求送信部と、前記第1のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信できない場合に、前記第1の通信路に対して、前記第1のパスが同じで、前記第2のパス及び前記第3のパスが異なる前記第1の記憶ボリュームへの第2の通信路、及び前記第1のパス及び前記第2のパスが同じで、前記第3のパスが異なる、第2の前記記憶ボリュームへの第3の通信路、により、それぞれ第2乃至第3のデータ入出力要求を送信する第2のデータ入出力要求送信部と、前記第1の通信路上の前記第1の通信ポートとは異なる前記第1の通信ポートから、前記スイッチに、前記第1の通信路上の前記第1の通信ポートに接続される前記第2の通信ポート、及び前記第1の通信路上の前記第3の通信ポートに接続される前記第2の通信ポート、をそれぞれ検査するための第1及び第2の検査要求を送信する検査要求送信部と、前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第2の通信路により送信された前記第2のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第1の検査要求に対する前記スイッチからの応答を所定時間内に受信した場合には、前記第1の通信路における前記第1の通信ポートを異常と判定する異常箇所判定部と、を備えることを特徴とする情報処理装置に関する。
その他、本願が開示する課題、及びその解決方法は、発明を実施するための最良の形態の欄、及び図面により明らかにされる。
情報処理装置、及び情報処理装置の制御方法を提供することができる。
===全体構成例===
まず、本実施の形態に係る情報処理システムの全体構成を示すブロック図を図1に示す。本実施の形態に係る情報処理システムは、情報処理装置200及びストレージ装置600がSAN(Storage Area Network)500で通信可能に接続されて構成される。
情報処理装置200は、ストレージ装置600が備える記憶ボリューム310により提供される記憶資源を利用し、各種の情報処理サービスを提供する情報機器である。情報処理装置200により提供される情報処理サービスとしては、例えば銀行の自動預金預け払いサービスや、航空機の座席予約サービス等とすることができる。
記憶ボリューム310は、ハードディスクドライブ等により提供される物理的な記憶領域である物理ボリュームと、物理ボリューム上に論理的に設定される記憶領域である論理ボリュームとを含む、データを記憶するための記憶領域である。
情報処理装置200は、他の情報処理装置200とLAN(Local Area Network)400により通信可能に接続されるようにすることもできる。ここでLAN400は例えばインターネットとすることができる。またLAN400はプライベートな通信ネットワークとすることもできる。
SAN500は、情報処理装置200とストレージ装置600とを通信可能に接続するネットワークである。SAN500は、複数の通信ポート(第2の通信ポート)512を有するスイッチ510を備えて構成される。情報処理装置200とストレージ装置600とは、それぞれ通信ケーブル520によりスイッチ510の通信ポート512と接続されている。
なお情報処理装置200とストレージ装置600との間は、SAN500以外にも例えばFICON(Fibre Connection)(登録商標)やESCON(Enterprise System Connection) (登録商標)、ACONARC(Advanced Connection Architecture)(登録商標)、FIBARC(Fibre Connection Architecture)(登録商標)、iSCSI(Internet Small Computer Systems Interface)等の通信プロトコルを用いたネットワークにより接続されるようにすることもできる。
情報処理装置200とストレージ装置600とをSAN500で接続して構成した情報処理システムにおいては、通信経路上で障害が発生した場合の障害箇所の特定は困難であるが、本実施の形態に係る情報処理装置200においては、後述するような仕組みにより、障害部位の特定や障害部位の表示を行うことができる。
===情報処理装置===
本実施の形態に係る情報処理装置200の構成を示すブロック図を図2に示す。
情報処理装置200は、CPU210、メモリ220、ポート230、記録媒体読取装置240、入力装置250、出力装置260、記憶装置280、HBA(Host Bus Adapter)290を備える。
CPU210は情報処理装置200の全体の制御を司るもので、メモリ220に記憶されたアプリケーションプログラム221を実行することにより上述した各種情報処理サービスの提供を行う。またCPU210は、メモリ220に記憶された、本実施の形態に係る各種の動作を行うためのコードから構成されるオペレーティングシステム222(以下、OS222とも記す)やHBA制御プログラム223を実行する。CPU210によりオペレーティングシステム222やHBA制御プログラム223が実行されることにより、第1のデータ入出力要求送信部や第2のデータ入出力要求送信部、検査要求送信部、異常箇所判定部、判定表示部が実現される。
メモリ220には、HBAドライバ構成情報管理テーブル224、障害ルートチェックマップ225、HBA基本構成情報テーブル226が記憶される。これらの詳細については後述する。なお、HBA制御プログラム223やオペレーティングシステム222は、それぞれ個別のプログラムとすることもできるし、これらのプログラムの少なくとも一部が同一プログラムにより構成されるようにすることもできる。また各プログラムが複数のプログラムにより構成されるようにすることもできる。
記録媒体読取装置240は、記録媒体270に記録されているプログラムやデータを読み取るための装置である。読み取られたプログラムやデータはメモリ220や記憶装置280に格納される。従って、例えば記録媒体270に記録されたHBA制御プログラム223やオペレーティングシステム222を、記録媒体読取装置240を用いて上記記録媒体270から読み取って、メモリ220や記憶装置280に記憶するようにすることができる。記録媒体270としてはフレキシブルディスクや磁気テープ、CD−ROM、半導体メモリ等を用いることができる。記録媒体読取装置240は情報処理装置200に内蔵されている形態とすることもできるし、外付されている形態とすることもできる。記憶装置280は、例えばハードディスク装置や半導体記憶装置等とすることができる。HBA制御プログラム223やオペレーティングシステム222、HBAドライバ構成情報管理テーブル224、障害ルートチェックマップ225、HBA基本構成情報テーブル226は、記憶装置280に記憶されるようにすることもできる。入力装置250はオペレータ等による情報処理装置200へのデータ入力等のために用いられるユーザインタフェースである。入力装置250としては例えばキーボードやマウス等を用いることができる。出力装置260は情報を外部に出力するためのユーザインタフェースである。出力装置260としては例えばディスプレイやプリンタ等を用いることができる。ポート230は通信を行うための装置である。例えばLAN400を介して行う他の情報処理装置200との通信は、ポート230を介して行われるようにすることができる。また例えば、アプリケーションプログラム221やHBA制御プログラム223、オペレーティングシステム222を、ポート230を通じて他の情報処理装置200から受信して、メモリ220や記憶装置280に記憶するようにすることもできる。HBA290は、情報処理装置200がストレージ装置600との間でデータの送受信を行うための装置である。HBA290は通信ポート(第1の通信ポート)291を備えており、通信ポート291を通じてデータ入出力要求をストレージ装置600に送信したり、ストレージ装置600からの応答を受信したりする。なお、図2に示す情報処理装置200には2つの通信ポート291を備えたHBAが一つが備えられる構成が示されるが、複数のHBA290を備えるようにすることもできる。またこの場合、各HBA290が備える通信ポート291は一つとすることもできる。HBA290が備える通信ポート291は、スイッチ510が備える通信ポート512と1対1に通信可能に接続される。なお、HBA290は情報処理装置200に内蔵される形態とすることもできるし、外付けされる形態とすることもできる。情報処理装置200とストレージ装置600との間が複数の通信路により通信可能に接続されている場合に、情報処理装置200とストレージ装置600との間の通信をいずれの通信ポート291を用いて行うかは、HBA制御プログラム223が実行されることにより制御される。
===ストレージ装置===
次に本実施の形態に係るストレージ装置600について、図1を用いて説明する。
ストレージ装置600は、ストレージ制御装置100と、ストレージ駆動装置300と、管理端末160とを備える。
ストレージ制御装置100は、情報処理装置200との間で通信を行い、ストレージ駆動装置300が備える記憶ボリューム310に対するデータの読み書きを制御する。例えば情報処理装置200から記憶ボリューム310に対するデータの書き込み要求を受信した場合には、ストレージ駆動装置300が備える記憶ボリューム310に対してデータの書き込み処理を行う。また情報処理装置200から記憶ボリューム310に対するデータの読み出し要求を受信した場合には、ストレージ駆動装置300が備える記憶ボリューム310に記憶されたデータの読み出し処理を行う。
ストレージ制御装置100は、CPU110、メモリ120、FC I/F(Fibre Channel InterFace)130、ディスクI/F(ディスクInterFace)140を備える。
CPU110は、ストレージ制御装置100の全体の制御を司るもので、メモリ120に記憶された、各種の動作を行うためのコードから構成されるストレージ制御プログラム121を実行する。CPU110によりストレージ制御プログラム121が実行されることにより、上記記憶ボリューム310に対するデータの読み書きが制御される。またメモリ120にはストレージ装置構成情報管理テーブル122、ストレージ装置ポートチェックテーブル123が記憶されている。これらの詳細については後述する。なお、ストレージ制御プログラム121は、複数のプログラムにより構成されるようにすることもできる。FC I/F130は通信ポート(第3の通信ポート)131を備えており、情報処理装置200と通信を行うためのインタフェース機能を有する。図1に示すストレージ制御装置100には2つの通信ポート131を備えたFC I/F130が一つ備えられる構成が示されるが、複数のFC I/F130を備えるようにすることもできる。この場合、各FC I/F130が備える通信ポート131は一つとすることもできる。FCI/F130が備える通信ポート131は、スイッチ510が備える通信ポート512と1対1に通信可能に接続される。ディスクI/F140はストレージ駆動装置300とデータの授受を行うためのインタフェース機能を有する。
ストレージ駆動装置300はデータを記憶する複数の記憶ボリューム310を有する。記憶ボリューム310は、ハードディスクドライブ等により提供される物理的な記憶領域である物理ボリュームと、物理ボリューム上に論理的に設定される記憶領域である論理ボリュームとを含む記憶領域である。
管理端末160は、ストレージ装置600の保守管理を行うための情報機器である。管理端末160はストレージ装置600に内蔵されるように構成することもできるし、外付けされるように構成することもできる。また管理端末160はストレージ装置600の保守・管理を専用に行うコンピュータとすることもできるし、汎用のコンピュータに保守・管理機能を持たせたものとすることもできる。また管理端末160は、例えばLAN400により情報処理装置200と通信可能に接続されるようにすることもできる。
===障害部位について===
次に、本実施の形態に係る情報処理装置200からストレージ装置600が備える記憶ボリューム310に対して送信されるデータ入出力要求(第1のデータ入出力要求)の通信路(第1の通信路)における障害部位について、図3乃至図7を用いて説明する。
情報処理装置200は、HBA105(290)、HBA106(290)、HBA107(290)、HBA108(290)を備えている。ここでは各HBA290が備える通信ポート291が一つである場合を例に説明する。そのため以下の説明においては、HBA290が備える通信ポート291を単にHBA290と記す場合がある。HBA制御プログラム223は、オペレーティングシステム222を通じてアプリケーションプログラム221からデータ入出力要求の送信指示を受けると、これらのHBA290のいずれかを選択して、データ入出力要求をスイッチ510に送信する。HBA制御プログラム223によるHBA290の選択は、ラウンドロビン式に順番に行うようにすることもできるし、処理負荷の少ない順に行うようにすることもできる。
一方、スイッチ510は、複数の通信ポート(第2の通信ポート)512、制御部511、メモリ513を備える。スイッチ510は、SW111(512)〜SW118(512)の8つの通信ポート512を備える。SW111(512)〜SW114(512)は、それぞれ情報処理装置200のHBA105(290)〜HBA108(290)と通信ケーブル520により1対1に接続されている。また、SW115(512)〜SW118(512)は、それぞれストレージ装置600が備えるFC I/F(130)の通信ポート131であるR121(131)〜R124(131)と通信ケーブル520により1対1に接続されている。
制御部511はスイッチ510の制御を司る。メモリ513には、制御部511がスイッチ510を制御するために必要なデータやテーブルが記憶される。また本実施の形態に係るメモリ513にはスイッチ情報管理テーブル514が記憶される。詳細については後述する。
ストレージ装置600は、前述したように、複数の通信ポート131と複数の記憶ボリューム310を備える。ストレージ装置600は、R121(131)〜R124(131)の各通信ポート131を備える。またLUN(Logical Unit Number)125(310)〜LUN130(310)の各記憶ボリュームを備える。
図3乃至図7には、情報処理装置200のHBA105(290)から、スイッチ510のSW111(512)、SW115(512)、及びストレージ装置600のR121を経由して、LUN125(310)にデータ入出力要求(第1のデータ入出力要求)が送信された場合の例を示す。このように情報処理装置200から記憶ボリューム310への通信路は、HBA290の通信ポート291の識別子(例えばHBA105)と、その通信ポート291に接続されるスイッチ510の通信ポート512の識別子(例えばSW111)とにより特定される第1のパス、ストレージ装置600の通信ポート131の識別子(例えばR121)と、その通信ポート131に接続されるスイッチ510の通信ポート512の識別子(例えばSW115)とにより特定される第2のパス、及び、ストレージ装置600の通信ポート131の識別子(例えばR121)と、その記憶ボリューム310の識別子(例えばLUN125)とにより特定される第3のパスにより特定される。ここで、HBA290の通信ポート291の識別子は例えばWWPN(World Wide Port Name)とすることができる。またスイッチ510の通信ポート512の識別子も例えば同様にWWPNとすることができる。同様にストレージ装置600の通信ポート131の識別子も例えばWWPNとすることができる。また記憶ボリューム310の識別子は例えばLUN(Logical Unit Number)とすることができる。
情報処理装置200からストレージ装置600が備える記憶ボリューム310までの通信路に障害が発生していなければ、情報処理装置200からのデータ入出力要求はストレージ装置600に送信され、ストレージ装置600において記憶ボリューム310に記憶されるデータの読み書きが行われた後に、ストレージ装置600から情報処理装置200に、データ入出力要求に対する応答が送信される。応答の内容は、例えばデータ入出力要求がデータ読み出し要求であった場合には読み出されたデータを含み、データ入出力要求がデータの書き込み要求であった場合には、記憶ボリューム310へのデータ書き込みが正しく行われたか否かを示すデータを含むようにすることができる。
情報処理装置200は、ストレージ装置600にデータ入出力要求を送信した場合には、ストレージ装置600から応答が送信されてくるのを待つ。そして所定時間内にストレージ装置600から応答を受信しない場合には、情報処理装置200は、通信路に何らかの障害が発生したと判断する。
図3には、LUN125(310)に障害が発生したために、情報処理装置200が応答を受信できない場合を示す。図4には、R121(131)に障害が発生したために、情報処理装置200が応答を受信できない場合を示す。図5には、SW115(512)に障害が発生したために、情報処理装置200が応答を受信できない場合を示す。図6には、SW111(512)に障害が発生したために、情報処理装置200が応答を受信できない場合を示す。図7には、HBA105(290)に障害が発生したために、情報処理装置200が応答を受信できない場合を示す。
===障害部位の特定===
上述のように、情報処理装置200は、所定時間内にストレージ装置600から応答を受信しない場合には、通信路に何らかの障害が発生したと判断する。そして本実施の形態に係る情報処理装置200は、障害部位を特定することができる。以下、図8乃至図23及び図33を参照しながら詳細に説明する。
まず図17を参照しながら、情報処理装置200からストレージ装置600に対してデータ入出力要求が送信される場合の処理の流れについて説明する。HBA制御プログラム223は、OS222からデータ入出力要求を受領すると(S1000)、そのデータ入出力要求の通信路が縮退中の状態から回復しているか否かを確認する(S1001)。縮退中とは、当該通信路による通信ができない状態をいう。縮退中の状態から回復している場合には”Yes”に進み、縮退回復確認命令をストレージ装置600に送信する(S1002)。縮退回復確認命令は、例えばデータの読み出し要求とすることができる。そして縮退回復確認命令(例えばデータ読み出し要求)に対する応答が正常に受信できれば、縮退から回復したことを確認することができる。縮退中の状態から回復している場合ではない場合は、S1001において”No”に進む。縮退中の状態から回復している場合ではない場合とは、まだ縮退中の状態である場合や、もともと通信路が縮退中でなかった場合である。当該通信路がまた縮退中の状態であればS1003において”Yes”に進む。そして目的の記憶ボリューム310に至る他の通信路(他ルート)があれば、S1004において”Yes”に進み、OS222から受信したデータ入出力要求を他ルートでストレージ装置600に送信する(S1006)。一方、他ルートがない場合には、情報処理装置200からストレージ装置600へデータ入出力要求を送信することはできないので、S1004にて”No”にすすみ、OS222に障害の報告を行う。また、もともと通信路が縮退中でなかった場合には、S1003において、”No”に進み、OS222から受信したデータ入出力要求をストレージ装置600に送信する(S1006)。
情報処理装置200からストレージ装置600にデータ入出力要求、あるいは縮退回復確認命令を送信すると、ストレージ装置600から情報処理装置200に対して、データ入出力要求や縮退回復確認命令に対する応答が送信されてくる。ストレージ装置600からの応答受信時の処理を図18に示す。
まずHBA制御プログラム223は、S2000において障害部位探査中であるか否かを判定する(S2000)。障害部位探査中とは、S2005における障害部位探査の処理を実行中であることを示す。後述するが、図19のS3012の処理を実行することにより障害部位探査中となる。そして図19のS3015の処理を実行することにより障害部位探査中ではなくなる。障害部位探査中でなければ”No”に進む。そしてデータ入出力要求に対するストレージ装置600からの応答が正常に受信された場合にはS2001において”No”に進む。そしてデータ入出力要求の通信路が縮退中の状態から回復した状態でなければ、S2002において”No”に進み、OS222へ正常終了報告を行う。一方、データ入出力要求の通信路が縮退中の状態から回復した状態であればS2002において”Yes”に進み、HBAドライバ構成情報管理テーブル224を更新する(S2003)。HBAドライバ構成情報管理テーブル224については後述する。データ入出力要求に対するストレージ装置600からの応答が所定時間内に受信されない場合にはS2001において”Yes”に進み、どこに障害が発生したのかを特定する(S2005)。
この場合、まず情報処理装置200は、スイッチ510及びストレージ装置600に対して、それぞれスイッチ情報管理テーブル514及びストレージ装置構成情報管理テーブル122の送信要求を送信する。このスイッチ情報管理テーブル514及びストレージ装置構成情報管理テーブル122の送信要求の送信は、どの通信路により行ってもかまわない。またデータ入出力要求に対する応答を受信しない場合に送信することもできるし、予め送信しておくようにすることもできる。情報処理装置200からスイッチ510及びストレージ装置600に対して、それぞれスイッチ情報管理テーブル514及びストレージ装置構成情報管理テーブル122の送信要求を送信する様子をそれぞれ図23、図22に示す。またそれぞれのフローチャートを図29及び図25に示す。
ここで、スイッチ情報管理テーブル514を図9に示す。スイッチ情報管理テーブル514には、スイッチ510が備える通信ポート512の識別子が記載されている。
またストレージ装置構成情報管理テーブル122を図8に示す。ストレージ装置構成情報管理テーブル122には、ストレージ装置600が備える通信ポート131の識別子と、各通信ポート131と通信可能に接続されるスイッチ510の通信ポート512の識別子が記載される。また各通信ポート131を通じて読み書き可能な記憶ボリューム310の識別子も記載される。
情報処理装置200は、スイッチ情報管理テーブル514及びストレージ装置構成情報管理テーブル122に記載された情報、並びに、情報処理装置200のメモリ220に記憶されたHBA基本構成情報テーブル226に基づいて、HBAドライバ構成情報管理テーブル224を作成する。
HBA基本構成情報テーブル226は、情報処理装置200のHBA290に接続されるスイッチ510やストレージ装置600の情報を記憶したものである。HBA基本構成情報テーブル226を図33に示す。「HBA」欄にはHBA290の識別子が記載される。「RAIDWWNN」欄にはストレージ装置600の識別子が記載される。ここでは例えばWWNN(World Wide Node Name)が記載される。「RAIDWWPN」欄にはストレージ装置600の通信ポート131の識別子が記載される。「LUN」欄には記憶ボリューム310の識別子が記載される。「Switch情報」欄にはスイッチ510の識別子が記載される。「SWWWPN」欄には、情報処理装置200やストレージ装置600の通信ポート291、131と接続されるスイッチ510の通信ポート512の識別子が記載される。また「SW−SW」欄には、スイッチ510をカスケード接続した場合にスイッチ510間で接続される通信ポート512の識別子が記載される。
以上の情報に基づきHBAドライバ構成情報管理テーブル224が作成される。HBAドライバ構成情報管理テーブル224は、情報処理装置200の各通信ポート291からストレージ装置600の各記憶ボリューム310までの全ての通信路を列挙したものである。作成されたHBAドライバ構成情報管理テーブル224の一部を図10に示す。
HBAドライバ構成情報管理テーブル224は、「構成番号」欄、「目的LUN」欄、「構成情報」欄、「状態管理」欄を備える。「構成番号」欄は列挙された通信路の識別番号が記載される欄である。「目的LUN」欄は、記憶ボリューム310の識別子が記載される欄である。「構成情報」欄は、記憶ボリューム310に至る各通信路において経由する通信ポート291、512、131を示す欄である。「状態管理」欄は、通信路の状態が記載される欄である。例えば図10に示す例では、構成番号1で示される、HBA105、SW111、SW115、R121を経由してLUN125に至る通信路は使用不可であることが示される。この「状態管理」欄は、情報処理装置200からストレージ装置600に対して送信されるデータ読み出し要求や書き込み要求等のデータ入出力要求に対する応答の結果に基づいて記載される。図18のS2003で述べたように、縮退回復の場合にはHBAドライバ構成情報管理テーブル224の「状態管理」欄が更新される。なお、HBAドライバ構成情報管理テーブル224の作成は、データ入出力要求に対する応答を受信しない場合に行うようにすることもできるし、予め行っておくようにすることもできる。
図18に戻って、続いて情報処理装置200は、障害部位の探査を開始する(S2005)。障害部位探査の処理を図19に示す。まずS3000において障害部位探査中であるか否かを判定する(S3000)。障害部位探査中でなければ”No”に進む。そして情報処理装置200は、HBAドライバ構成情報管理テーブル224を読み込む(S3001)、又は作成する。そして情報処理装置200はHBAドライバ構成情報管理テーブル224に基づいて、障害ルートチェックマップ225を作成する(S3002)。障害ルートチェックマップ225は、障害部位を特定するために情報処理装置200がストレージ装置600に送信するデータ入出力要求(第2のデータ入出力要求、第3のデータ入出力要求)の通信路や、スイッチ510に送信する検査要求(第1の検査要求、第2の検査要求)の通信路を特定するためのテーブルである。障害ルートチェックマップ225を図11に示す。
障害ルートチェックマップ225は、「ルートチェック番号」欄、「判断経路」欄を備える。「ルートチェック」欄には、障害部位を特定するために情報処理装置200がストレージ装置600に送信するデータ入出力要求の通信路や、スイッチ510に送信する検査要求の通信路の識別番号が記載される。「判断経路」欄には、障害部位を特定するために情報処理装置200がストレージ装置600に送信するデータ入出力要求の通信路や、スイッチ510に送信する検査要求の通信路が記載される。
図11に示す障害ルートチェックマップ225には、ストレージ装置600から所定時間内に応答を受信することができなかったデータ入出力要求の通信路(第1の通信路、TUR−1)、第1の通信路に対して、第1のパスが異なり、第2のパス及び第3のパスが同じ通信路(TUR−2)、第1のパスが同じで、第2のパス及び第3のパスが異なる通信路(第2の通信路、TUR−3)、第1のパス及び第2のパスが同じで、第3のパスが異なる通信路(第3の通信路、TUR−4)が記載される。
また障害ルートチェックマップ225には、第1の通信路上のHBA290の通信ポート291とは異なる通信ポート291から、スイッチ510に、第1の通信路上のHBA290の通信ポート291と1対1に接続されるスイッチ510の通信ポート512を検査するための第1の検査要求を送信し、その第1の検査要求に対する応答を受信するための通信路(TEST−1)、及び、第1の通信路上のHBA290の通信ポート291とは異なる通信ポート291から、スイッチ510に、第1の通信路上のFC I/F130の通信ポート131と1対1に接続されるスイッチ510の通信ポート512を検査するための第2の検査要求を送信し、その第2の検査要求に対する応答を受信するための通信路(TEST−2)も記載される。
なお、TUR−2乃至TUR−4で示される通信路により、情報処理装置200がストレージ装置600に送信するデータ入出力要求は、例えばSCSI(Small Computer System Interface)通信規格で定められたTUR(Test Unit Ready)コマンドとすることができる。
また、TEST−1乃至TEST−2で示される通信路により、情報処理装置200がスイッチ510に送信する検査要求(以下、TESTコマンドとも記す)は、ルート指定機能を備え、例えば「命令コード」、「送信元識別子」、「送信先識別子」、「通信路指定情報」の各欄を備えたコマンドとすることができる。ここで「命令コード」欄は、検査要求であることを示すための識別子が記載される欄である。「送信元識別子」欄は、検査要求の送信元を示す識別子が記載される欄である。図11の例に従えば”HBA106”が記載される。「送信先識別子」欄は、検査要求の送信先を示す識別子が記載される欄である。図11の例に従えば”HBA106”が記載される。「通信路指定情報」欄は、検査要求の経路を示す情報が記載される欄である。図11のTEST−1の例では、”SW112”、”SW111”、”SW112”が記載される。このようなTESTコマンドは、HBA106から送信されると、SW112、SW111、SW112、HBA106の順に送信される。情報処理装置200は、送信したTESTコマンドが送信先識別子欄に記載された通信ポート291に戻ってきたことを確認することにより、SW111で示される通信ポート512に異常が発生していないか否かを判定することができる。
図19に戻って、続いて情報処理装置200は、その後第1の通信路で、別のデータ読み出し要求あるいは書き込み要求が送信されたか否かを確認する(S3003)。もしも、第1の通信路で別のデータ読み出し要求あるいは書き込み要求が送信され、その応答が正常であったならば、”Yes”に進み、障害ルートチェックマップのルートチェック番号”TUR−1”で特定される通信路を正常と判定する(S3004)。また第1の通信路で別のデータ読み出し要求あるいは書き込み要求が送信されていない場合には、S3003において”No”に進む。そしてTURチェックが終了しているか否かを判定し(S3005)、終了していれば”Yes”に進む。TURチェックの結果が正常であった場合には(S3013)、”Yes”に進み、障害ルートチェック結果欄に正常である旨を記録する(S3004)。TURチェックの結果が正常でなかった場合には(S3013)”No”に進み、障害ルートチェック結果欄に異常である旨を記録する(S3014)。TESTコマンドについてもTURコマンドと同様に処理を行う(S3006、S3013、S3004、S3014)。全てのルートチェック番号について探査が終了したら(S3007)、障害探査を完了する(S3015)。
一方、全てのルートチェック番号について探査が終了していない場合にはS3007にて”No”に進み、S3008乃至S3011において、TURコマンド、TESTコマンドを送信する。このときS3012にて障害部位探査中である旨を記憶しておく。
図18に戻って、指定ルートが正常であればS2006において”Yes”に進む。指定ルートが正常でなければ”No”に進む。指定ルートが正常とは、図19のS3003にて第1の通信路で別のデータ読み出し要求あるいは書き込み要求が送信され、その応答が正常であった場合をいう。
図19のS3015にて障害探査完了の旨が記憶された場合には、図18のS2007にて”Yes”に進み、障害部位判定処理を行う(S2008)。
障害部位判定処理を図20及び図21に示す。図21に示す処理は、図20に示す処理を図3乃至図7に示した具体例に適用した場合の例を示すものである。
まず情報処理装置200は、記憶ボリューム310の障害であるか否かを判定する(S4000、S5000)。この処理は、第3の通信路により送信された上記第3のデータ入出力要求に対するストレージ装置600からの応答を所定時間内に受信した場合には、記憶ボリューム310の障害(異常)であると判定することにより行う。具体的には、図12に示すように、障害ルートチェック結果が、TUR−1については異常であり、TUR−4については正常であった場合には、記憶ボリューム310の異常であると判定する(S5000)。
次に、情報処理装置200は、上流側パス障害であるか否かを判定する(S4001、S5001)。ここで上流側パスとは第1のパスのことを言う。この処理は 第3の通信路により送信された上記第3のデータ入出力要求に対するストレージ装置600からの応答を所定時間内に受信せず、かつ、第2の通信路により送信された上記第2のデータ入出力要求に対するストレージ装置600からの応答も所定時間内に受信しなかった場合には、上流側パスの障害であると判定することにより行う。具体的には、図15及び図16に示すように、障害ルートチェック結果が、TUR−1については異常であり、TUR−3についても異常であった場合には、上流側パスの異常であると判定する(S5001)。
上流側パスが異常と判定された場合には、情報処理装置200は、第1の通信ポート291が異常なのか、第2の通信ポート512が異常なのかを判定する(S4002、S5002)。この処理は、第1の検査要求に対するスイッチ510からの応答を所定時間内に受信した場合には、第1の通信ポート291を異常と判定し、第1の検査要求に対するスイッチ510からの応答を所定時間内に受信しない場合には、第2の通信ポート512を異常と判定することにより行う。具体的には、図15及び図16に示すように、障害ルートチェック結果が、TEST−1について正常であった場合にはHBA105(291)の異常であると判定し、TEST−1について異常であった場合にはSW111(512)の異常であると判定する(S5002)。
一方、第3の通信路により送信された上記第3のデータ入出力要求に対するストレージ装置600からの応答を所定時間内に受信せず、かつ、第2の通信路により送信された上記第2のデータ入出力要求に対するストレージ装置600からの応答も所定時間内に受信した場合には、上流側パスの障害であるとは判定されない(S4001、S5001)。この場合には、情報処理装置200は、第2の通信ポート512が異常なのか、第3の通信ポート131が異常なのかを判定する(S4003、S5003)。この処理は、第2の検査要求に対するスイッチ510からの応答を所定時間内に受信した場合には、第3の通信ポート131を異常と判定し、第2の検査要求に対するスイッチ510からの応答を所定時間内に受信しない場合には、第2の通信ポート512を異常と判定することにより行う。具体的には、図13及び図14に示すように、障害ルートチェック結果が、TEST−2について正常であった場合にはR121(131)の異常であると判定し、TEST−2について異常であった場合にはSW115(512)の異常であると判定する(S5003)。
以上の処理により障害部位の判定を行うと、図18の処理において、情報処理装置200は、記憶ボリューム310の障害であった場合には(S2009)、OS222へ、記憶ボリューム310の障害であった旨の報告を行う(S2010)。これによりOS222は、記憶ボリューム310の障害発生時の処理を行うことができる。また、当該記憶ボリューム310へのデータの読み書きができなくなることから、OS222は必要に応じてアプリケーションプログラム221に対して、その旨の情報を通知する。
一方、記憶ボリューム310の障害ではなくても、記憶ボリューム310への他の通信路(他ルート)がなければ(S2011)、やはり当該記憶ボリューム310へのデータの読み書きはできなくなるので、情報処理装置200は、OS222へ、障害部位の報告を行う(S2012)。そしてこれによりOS222は、障害発生時の処理を行うことができる。さらにOS222は必要に応じてアプリケーションプログラム221に対して、その旨の情報を通知する。
S2011において、他ルートがあれば、情報処理装置200は、ストレージ装置600へのデータ入出力要求の送信を他ルートで行う(S2013)。そしてユーザインタフェースに、障害部位(判定の結果)を表示する。情報処理装置200が備えるディスプレイ装置に障害部位が表示される様子を図31に示す。
これによりオペレータは、情報処理システムにおける障害部位を直ちに認識することができるようになる。
なお、ストレージ装置600の通信ポート131に障害が発生しているか否かの検査を、ストレージ装置600に行わせるようにすることも可能である。その様子を図24乃至図28に示す。
まず情報処理装置200は、ストレージ装置600に対してRAID障害探査命令を発行する(S7000)。RAID障害探査命令は、ストレージ装置600に、通信ポート131のチェックを実行させるための命令である。そうするとストレージ装置600は、図8に示したストレージ装置構成情報管理テーブル122に基づいて、図27に示すストレージ装置ポートチェックテーブル123を作成する。ストレージ装置ポートチェックテーブル123は、ストレージ装置600の各通信ポート131からスイッチ510の通信ポート512を通ってストレージ装置600の各通信ポート131に戻ってくる全てのルートを列挙したものである。ストレージ装置600は、ストレージ装置ポートチェックテーブル123の各チェックルートに従ってTESTコマンドを送信し、その結果をストレージ装置ポートチェックテーブル123のチェック結果欄に記載する。そしてストレージ装置600はストレージ装置ポートチェックテーブル123を情報処理装置200に送信する。そして情報処理装置200は、図28に示すように、ストレージ装置ポートチェックテーブル123に記載されたチェック結果に基づいて、ストレージ装置構成情報管理テーブル122のRAID障害探査結果欄に各通信ポート131の障害有無を記録する(S7001)。
情報処理装置200は、例えばストレージ装置600に対して上記RAID障害探査命令を繰り返し送信するようにし、ストレージ装置600の通信ポート131の障害有無をストレージ装置構成情報管理テーブル122のRAID障害探査結果欄により常時把握するようにすることにより、情報処理装置200とストレージ装置600との間の通信路に障害が発生した場合の障害部位の特定をより迅速に行うことができるようになる。例えば、ストレージ装置構成情報管理テーブル122のRAID障害探査結果欄に記載された各通信ポート131の障害有無を示す情報に基づいて、無駄なTESTコマンドやTURコマンドの送信を省くことができるからである。
また、本実施の形態にかかる情報処理装置200は、通信路に発生した障害が回復した後に、その通信路を用いて障害回復監視命令をストレージ装置600に送信するようにすることもできる。その様子を図30に示す。この場合、情報処理装置200は、障害回復監視命令を、何度か繰り返し送信する様にすることもできる。
このようにすることにより、一度障害の発生した通信路のその後の障害の発生を監視することが可能となる。また、障害回復監視命令の送信により、その通信路にその後も障害が発生するようであれば、その旨を情報処理装置200のユーザインタフェースに表示し、オペレータに通知することもできる。これにより、オペレータは、その通信路の点検を重点的に行うなどの対応をとることが可能となる。
また、本実施の形態に係る情報処理システムは図34に示すような構成とすることもできる。すなわち、情報処理装置200とストレージ装置600との間にスイッチ510が多段に設けられる構成(カスケード接続される構成)である。この場合のHBA基本構成情報テーブル226を図35に示す。この場合も情報処理装置200は、スイッチ情報管理テーブル514及びストレージ装置構成情報管理テーブル122に記載された情報、並びに、HBA基本構成情報テーブル226に基づいて、HBAドライバ構成情報管理テーブル224を作成する。作成されるHBAドライバ構成情報管理テーブル224を図36に示す。そして情報処理装置200はHBAドライバ構成情報管理テーブル224に基づいて障害ルートチェックマップ225を作成する。障害ルートチェックマップ225を図37に示す。そして情報処理装置200は、障害ルートチェックマップ225に従ってTURコマンド、TESTコマンドを送信することにより、通信路の障害部位を特定することができる。
さらに本実施の形態に係る情報処理システムは図32に示すような構成とすることもできる。すなわち、ストレージ装置A600とストレージ装置B600とがSAN500で接続される構成である。この場合、ストレージ装置B600に記憶されるストレージ装置構成情報管理テーブル122やストレージ装置ポートチェックテーブル123は、ストレージ装置A600を経由して情報処理装置200に送信される。このようにストレージ装置A600を介在させて情報処理装置200とストレージ装置B600との間で通信を行うことにより、図32に示すような構成においても、情報処理装置200とストレージ装置600との間の通信路の障害部位の特定を行うことが可能となる。
以上、本実施の形態に係る情報処理装置200について説明したが、本実施の形態に係る情報処理装置200によれば、ストレージ装置600との間の通信路における異常箇所の特定を容易化し、異常箇所特定に要する時間を短縮することが可能となる。これにより、情報処理システムの保守管理作業負担を軽減することが可能となる。また、情報処理システムの異常からの復旧時間を短縮することができるので、情報処理システムの可用性を向上させることができる。
以上発明を実施するための最良の形態について説明したが、上記実施の形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明はその趣旨を逸脱することなく変更、改良され得ると共に、本発明にはその等価物も含まれる。
本実施の形態に係る情報処理システムの全体構成を示すブロック図である。 本実施の形態に係る情報処理装置の構成を示すブロック図である。 本実施の形態に係る障害部位を示す図である。 本実施の形態に係る障害部位を示す図である。 本実施の形態に係る障害部位を示す図である。 本実施の形態に係る障害部位を示す図である。 本実施の形態に係る障害部位を示す図である。 本実施の形態に係るストレージ装置構成情報管理テーブルを示す図である。 本実施の形態に係るスイッチ構成情報管理テーブルを示す図である。 本実施の形態に係るHBAドライバ構成情報管理テーブルを示す図である。 本実施の形態に係る障害ルートチェックマップを示す図である。 本実施の形態に係る障害ルートチェック結果を示す図である。 本実施の形態に係る障害ルートチェック結果を示す図である。 本実施の形態に係る障害ルートチェック結果を示す図である。 本実施の形態に係る障害ルートチェック結果を示す図である。 本実施の形態に係る障害ルートチェック結果を示す図である。 本実施の形態に係るデータ入出力処理の流れを示すフローチャートである。 本実施の形態に係る障害部位特定処理の流れを示すフローチャートである。 本実施の形態に係る障害部位探査処理の流れを示すフローチャートである。 本実施の形態に係る障害部位判定処理の流れを示すフローチャートである。 本実施の形態に係る障害部位判定処理の流れを示すフローチャートである。 本実施の形態に係る情報処理装置によりストレージ装置構成情報管理テーブルが取得される様子を示す図である。 本実施の形態に係る情報処理装置によりスイッチ構成情報管理テーブルが取得される様子を示す図である。 本実施の形態に係る情報処理装置により障害探査命令が送信される様子を示す図である。 本実施の形態に係る情報処理装置によりストレージ装置構成情報管理テーブルが取得される処理の流れを示すフローチャートである。 本実施の形態に係る情報処理装置によりストレージ装置に通信ポートの障害探査を実行させる処理の流れを示すフローチャートである。 本実施の形態に係るストレージ装置ポートチェックテーブルを示す図である。 本実施の形態に係るストレージ装置構成情報管理テーブルを示す図である。 本実施の形態に係る情報処理装置によりスイッチ構成情報管理テーブルが取得される処理の流れを示すフローチャートである。 本実施の形態に係る情報処理装置により障害回復監視命令が送信される様子を示す図である。 本実施の形態に係るユーザインタフェースに障害部位が表示される様子を示す図である。 本実施の形態に係る情報処理システムの全体構成を示すブロック図である。 本実施の形態に係るHBA基本構成情報テーブルを示す図である。 本実施の形態に係る情報処理システムの全体構成を示すブロック図である。 本実施の形態に係るHBA基本構成情報テーブルを示す図である。 本実施の形態に係るHBAドライバ構成情報管理テーブルを示す図である。 本実施の形態に係る障害ルートチェックマップを示す図である。
符号の説明
100 ストレージ制御装置
122 ストレージ装置構成情報管理テーブル
123 ストレージ装置ポートチェックテーブル
130 FC IF
131 通信ポート
200 情報処理装置
210 CPU
220 メモリ
221 アプリケーションプログラム
222 オペレーティングシステム
223 HBA制御プログラム
224 HBAドライバ構成情報管理テーブル
225 障害ルートチェックマップ
226 HBA基本構成情報テーブル
230 ポート
260 出力装置
270 記録媒体
290 HBA
291 通信ポート
300 ストレージ駆動装置
310 記憶ボリューム
500 SAN
510 スイッチ
511 制御部
512 通信ポート
514 スイッチ構成情報管理テーブル
520 通信ケーブル
600 ストレージ装置

Claims (17)

  1. 複数の第1の通信ポートを有する情報処理装置と、複数の第2の通信ポートを有するスイッチと、複数の第3の通信ポート及び複数の記憶ボリュームを有するストレージ装置とを備え、前記第1の通信ポート及び前記第3の通信ポートが前記第2の通信ポートと1対1に通信可能に接続されてなる情報処理システムにおける前記情報処理装置であって、
    前記第1の通信ポートの識別子と、前記第1の通信ポートに接続される前記第2の通信ポートの識別子とにより特定される第1のパス、前記第3の通信ポートの識別子と、前記第3の通信ポートに接続される前記第2の通信ポートの識別子とにより特定される第2のパス、及び前記第3の通信ポートの識別子と第1の前記記憶ボリュームの識別子とにより特定される第3のパス、により特定される、前記第1の通信ポートから前記第1の記憶ボリュームへの第1の通信路により第1のデータ入出力要求を送信する第1のデータ入出力要求送信部と、
    前記第1のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信できない場合に、
    前記第1の通信路に対して、
    前記第1のパスが同じで、前記第2のパス及び前記第3のパスが異なる前記第1の記憶ボリュームへの第2の通信路、及び
    前記第1のパス及び前記第2のパスが同じで、前記第3のパスが異なる、第2の前記記憶ボリュームへの第3の通信路、
    により、それぞれ第2乃至第3のデータ入出力要求を送信する第2のデータ入出力要求送信部と、
    前記第1の通信路上の前記第1の通信ポートとは異なる前記第1の通信ポートから、前記スイッチに、
    前記第1の通信路上の前記第1の通信ポートに接続される前記第2の通信ポート、及び
    前記第1の通信路上の前記第3の通信ポートに接続される前記第2の通信ポート、
    をそれぞれ検査するための第1及び第2の検査要求を送信する検査要求送信部と、
    前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第2の通信路により送信された前記第2のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第1の検査要求に対する前記スイッチからの応答を所定時間内に受信した場合には、前記第1の通信路における前記第1の通信ポートを異常と判定する異常箇所判定部と、
    を備えることを特徴とする情報処理装置。
  2. 前記異常箇所判定部は、
    前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第2の通信路により送信された前記第2のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第1の検査要求に対する前記スイッチからの応答を所定時間内に受信しない場合には、前記第1の通信路における前記第1の通信ポートに接続される前記第2の通信ポートを異常と判定すること
    を特徴とする請求項1に記載の情報処理装置。
  3. 前記異常箇所判定部は、
    前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第2の通信路により送信された前記第2のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信し、かつ、前記第2の検査要求に対する前記スイッチからの応答を所定時間内に受信しない場合には、前記第1の通信路における前記第3の通信ポートに接続される前記第2の通信ポートを異常と判定すること
    を特徴とする請求項1に記載の情報処理装置。
  4. 前記異常箇所判定部は、
    前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第2の通信路により送信された前記第2のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信し、かつ、前記第2の検査要求に対する前記スイッチからの応答を所定時間内に受信した場合には、前記第1の通信路における前記第3の通信ポートを異常と判定すること
    を特徴とする請求項1に記載の情報処理装置。
  5. 前記異常箇所判定部は、
    前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信した場合には、前記第1の記憶ボリュームを異常と判定すること
    を特徴とする請求項1に記載の情報処理装置。
  6. 前記第1のデータ入出力要求は、前記第1の記憶ボリュームに対するデータの読み出し要求、又は書き込み要求であり、
    前記第2のデータ入出力要求及び前記第3のデータ入出力要求は、SCSI規格で定められたTURコマンドであること
    を特徴とする請求項1に記載の情報処理装置。
  7. 前記情報処理装置はホストバスアダプタを備え、
    前記第1の通信ポートは、前記ホストバスアダプタが備える通信ポートであること
    を特徴とする請求項1に記載の情報処理装置。
  8. 前記異常箇所判定部による判定の結果をユーザインタフェースに表示する判定表示部と、
    を備えることを特徴とする請求項1に記載の情報処理装置。
  9. 複数の第1の通信ポートを有する情報処理装置と、複数の第2の通信ポートを有するスイッチと、複数の第3の通信ポート及び複数の記憶ボリュームを有するストレージ装置とを備え、前記第1の通信ポート及び前記第3の通信ポートが前記第2の通信ポートと1対1に通信可能に接続されてなる情報処理システムにおける前記情報処理装置の制御方法であって、
    前記第1の通信ポートの識別子と、前記第1の通信ポートに接続される前記第2の通信ポートの識別子とにより特定される第1のパス、前記第3の通信ポートの識別子と、前記第3の通信ポートに接続される前記第2の通信ポートの識別子とにより特定される第2のパス、及び前記第3の通信ポートの識別子と第1の前記記憶ボリュームの識別子とにより特定される第3のパス、により特定される、前記第1の通信ポートから前記第1の記憶ボリュームへの第1の通信路により第1のデータ入出力要求を送信し、
    前記第1のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信できない場合に、
    前記第1の通信路に対して、
    前記第1のパスが同じで、前記第2のパス及び前記第3のパスが異なる前記第1の記憶ボリュームへの第2の通信路、及び
    前記第1のパス及び前記第2のパスが同じで、前記第3のパスが異なる、第2の前記記憶ボリュームへの第3の通信路、
    により、それぞれ第2乃至第3のデータ入出力要求を送信し、
    前記第1の通信路上の前記第1の通信ポートとは異なる前記第1の通信ポートから、前記スイッチに、
    前記第1の通信路上の前記第1の通信ポートに接続される前記第2の通信ポート、及び
    前記第1の通信路上の前記第3の通信ポートに接続される前記第2の通信ポート、
    をそれぞれ検査するための第1及び第2の検査要求を送信し、
    前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第2の通信路により送信された前記第2のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第1の検査要求に対する前記スイッチからの応答を所定時間内に受信した場合には、前記第1の通信路における前記第1の通信ポートを異常と判定すること
    を特徴とする情報処理装置の制御方法。
  10. 前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第2の通信路により送信された前記第2のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第1の検査要求に対する前記スイッチからの応答を所定時間内に受信しない場合には、前記第1の通信路における前記第1の通信ポートに接続される前記第2の通信ポートを異常と判定すること
    を特徴とする請求項9に記載の情報処理装置の制御方法。
  11. 前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第2の通信路により送信された前記第2のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信し、かつ、前記第2の検査要求に対する前記スイッチからの応答を所定時間内に受信しない場合には、前記第1の通信路における前記第3の通信ポートに接続される前記第2の通信ポートを異常と判定すること
    を特徴とする請求項9に記載の情報処理装置の制御方法。
  12. 前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第2の通信路により送信された前記第2のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信し、かつ、前記第2の検査要求に対する前記スイッチからの応答を所定時間内に受信した場合には、前記第1の通信路における前記第3の通信ポートを異常と判定すること
    を特徴とする請求項9に記載の情報処理装置の制御方法。
  13. 前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信した場合には、前記第1の記憶ボリュームを異常と判定すること
    を特徴とする請求項9に記載の情報処理装置の制御方法。
  14. 前記第1のデータ入出力要求は、前記第1の記憶ボリュームに対するデータの読み出し要求、又は書き込み要求であり、
    前記第2のデータ入出力要求及び前記第3のデータ入出力要求は、SCSI規格で定められたTURコマンドであること
    を特徴とする請求項9に記載の情報処理装置の制御方法。
  15. 前記情報処理装置はホストバスアダプタを備え、
    前記第1の通信ポートは、前記ホストバスアダプタが備える通信ポートであること
    を特徴とする請求項9に記載の情報処理装置の制御方法。
  16. 前記判定の結果をユーザインタフェースに表示すること
    を特徴とする請求項9に記載の情報処理装置の制御方法。
  17. 複数の第1の通信ポートを有する情報処理装置と、複数の第2の通信ポートを有するスイッチと、複数の第3の通信ポート及び複数の記憶ボリュームを有するストレージ装置と、を備え、前記第1の通信ポート及び前記第3の通信ポートが前記第2の通信ポートと1対1に通信可能に接続されてなる情報処理システムにおける前記情報処理装置であって、
    前記第1の通信ポートの識別子と、前記第1の通信ポートに接続される前記第2の通信ポートの識別子とにより特定される第1のパス、前記第3の通信ポートの識別子と、前記第3の通信ポートに接続される前記第2の通信ポートの識別子とにより特定される第2のパス、及び前記第3の通信ポートの識別子と第1の前記記憶ボリュームの識別子とにより特定される第3のパス、により特定される、前記第1の通信ポートから前記第1の記憶ボリュームへの第1の通信路により第1のデータ入出力要求を送信する第1のデータ入出力要求送信部と、
    前記第1のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信できない場合に、
    前記第1の通信路に対して、
    前記第1のパスが同じで、前記第2のパス及び前記第3のパスが異なる前記第1の記憶ボリュームへの第2の通信路、及び
    前記第1のパス及び前記第2のパスが同じで、前記第3のパスが異なる、第2の前記記憶ボリュームへの第3の通信路、
    により、それぞれ第2乃至第3のデータ入出力要求を送信する第2のデータ入出力要求送信部と、
    前記第1の通信路上の前記第1の通信ポートとは異なる前記第1の通信ポートから、前記スイッチに、
    前記第1の通信路上の前記第1の通信ポートに接続される前記第2の通信ポート、及び
    前記第1の通信路上の前記第3の通信ポートに接続される前記第2の通信ポート、
    をそれぞれ検査するための第1及び第2の検査要求を送信する検査要求送信部と、
    前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第2の通信路により送信された前記第2のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第1の検査要求に対する前記スイッチからの応答を所定時間内に受信した場合には、前記第1の通信路における前記第1の通信ポートを異常と判定し、
    前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第2の通信路により送信された前記第2のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第1の検査要求に対する前記スイッチからの応答を所定時間内に受信しない場合には、前記第1の通信路における前記第1の通信ポートに接続される前記第2の通信ポートを異常と判定し、
    前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第2の通信路により送信された前記第2のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信し、かつ、前記第2の検査要求に対する前記スイッチからの応答を所定時間内に受信しない場合には、前記第1の通信路における前記第3の通信ポートに接続される前記第2の通信ポートを異常と判定し、
    前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信せず、かつ、前記第2の通信路により送信された前記第2のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信し、かつ、前記第2の検査要求に対する前記スイッチからの応答を所定時間内に受信した場合には、前記第1の通信路における前記第3の通信ポートを異常と判定し、
    前記第3の通信路により送信された前記第3のデータ入出力要求に対する前記ストレージ装置からの応答を所定時間内に受信した場合には、前記第1の記憶ボリュームを異常と判定する異常箇所判定部と、
    前記異常箇所判定部による判定の結果をユーザインタフェースに表示する判定表示部と、
    を備えることを特徴とする情報処理装置。

JP2004063959A 2004-03-08 2004-03-08 情報処理装置、及び情報処理装置の制御方法 Withdrawn JP2005251078A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004063959A JP2005251078A (ja) 2004-03-08 2004-03-08 情報処理装置、及び情報処理装置の制御方法
US10/837,565 US7020089B2 (en) 2004-03-08 2004-05-04 Information processing apparatus and method of controlling the information processing apparatus
US11/302,218 US7519001B2 (en) 2004-03-08 2005-12-14 Information processing apparatus and method of controlling the information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004063959A JP2005251078A (ja) 2004-03-08 2004-03-08 情報処理装置、及び情報処理装置の制御方法

Publications (2)

Publication Number Publication Date
JP2005251078A true JP2005251078A (ja) 2005-09-15
JP2005251078A5 JP2005251078A5 (ja) 2007-03-15

Family

ID=34909331

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004063959A Withdrawn JP2005251078A (ja) 2004-03-08 2004-03-08 情報処理装置、及び情報処理装置の制御方法

Country Status (2)

Country Link
US (2) US7020089B2 (ja)
JP (1) JP2005251078A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007256993A (ja) * 2006-03-20 2007-10-04 Hitachi Ltd 物理リンクの割当てを制御するコンピュータシステム及び方法
JP2007265243A (ja) * 2006-03-29 2007-10-11 Hitachi Ltd 計算機システム及び論理パス切替方法
JP2011108006A (ja) * 2009-11-18 2011-06-02 Nec Corp ディスクアレイ装置の故障診断システム、故障診断方法、故障診断プログラムおよびディスク装置
JP2015510296A (ja) * 2011-12-23 2015-04-02 シーラス・データ・ソリューションズ・インコーポレーテッド ホストエンティティによってアクセスされうる格納データを識別しデータ管理サービスを提供するシステム、装置、および方法
WO2016117008A1 (ja) * 2015-01-19 2016-07-28 株式会社日立製作所 ストレージシステム、計算機システム、及び障害箇所推定方法

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7904599B1 (en) 2003-03-28 2011-03-08 Cisco Technology, Inc. Synchronization and auditing of zone configuration data in storage-area networks
US7433300B1 (en) * 2003-03-28 2008-10-07 Cisco Technology, Inc. Synchronization of configuration data in storage-area networks
US7619979B2 (en) * 2004-06-15 2009-11-17 International Business Machines Corporation Fault isolation in a network
JP2006178720A (ja) * 2004-12-22 2006-07-06 Hitachi Ltd ストレージシステム
US7489639B2 (en) * 2005-03-23 2009-02-10 International Business Machines Corporation Root-cause analysis of network performance problems
US7826380B2 (en) * 2005-03-30 2010-11-02 International Business Machines Corporation Apparatus, system, and method for data tracking
JP2007257180A (ja) * 2006-03-22 2007-10-04 Hitachi Ltd ネットワークノード、スイッチ及びネットワーク障害回復方法
JP5179031B2 (ja) 2006-09-13 2013-04-10 株式会社日立製作所 空きポートを有効に活用したストレージシステム
JP4935666B2 (ja) * 2007-12-19 2012-05-23 富士通株式会社 ネットワーク中継装置
WO2009122831A1 (ja) * 2008-03-31 2009-10-08 日本電気株式会社 秘匿処理装置、秘匿処理方法、および秘匿処理プログラム
US8838850B2 (en) * 2008-11-17 2014-09-16 Violin Memory, Inc. Cluster control protocol
US8417895B1 (en) 2008-09-30 2013-04-09 Violin Memory Inc. System for maintaining coherency during offline changes to storage media
US8442059B1 (en) * 2008-09-30 2013-05-14 Gridiron Systems, Inc. Storage proxy with virtual ports configuration
US8443150B1 (en) 2008-11-04 2013-05-14 Violin Memory Inc. Efficient reloading of data into cache resource
US8214608B2 (en) * 2008-11-04 2012-07-03 Gridiron Systems, Inc. Behavioral monitoring of storage access patterns
US8775741B1 (en) 2009-01-13 2014-07-08 Violin Memory Inc. Using temporal access patterns for determining prefetch suitability
US8214599B2 (en) * 2008-11-04 2012-07-03 Gridiron Systems, Inc. Storage device prefetch system using directed graph clusters
US8788758B1 (en) 2008-11-04 2014-07-22 Violin Memory Inc Least profitability used caching scheme
US8285961B2 (en) 2008-11-13 2012-10-09 Grid Iron Systems, Inc. Dynamic performance virtualization for disk access
US8650362B2 (en) 2009-04-17 2014-02-11 Violin Memory Inc. System for increasing utilization of storage media
US8667366B1 (en) 2009-04-17 2014-03-04 Violin Memory, Inc. Efficient use of physical address space for data overflow and validation
US8958795B2 (en) * 2009-05-04 2015-02-17 Qualcomm Incorporated Proximity based access control
US8713252B1 (en) 2009-05-06 2014-04-29 Violin Memory, Inc. Transactional consistency scheme
US9069676B2 (en) 2009-06-03 2015-06-30 Violin Memory, Inc. Mapping engine for a storage device
US8402198B1 (en) 2009-06-03 2013-03-19 Violin Memory, Inc. Mapping engine for a storage device
US8402246B1 (en) 2009-08-28 2013-03-19 Violin Memory, Inc. Alignment adjustment in a tiered storage system
CN102263807A (zh) * 2010-05-31 2011-11-30 国际商业机器公司 在存储区域网络保持通信路径畅通的方法和存储区域网络
US8959288B1 (en) 2010-07-29 2015-02-17 Violin Memory, Inc. Identifying invalid cache data
US8832384B1 (en) 2010-07-29 2014-09-09 Violin Memory, Inc. Reassembling abstracted memory accesses for prefetching
JP5370591B2 (ja) * 2010-09-01 2013-12-18 富士通株式会社 システムおよび障害処理方法
CN102129400B (zh) * 2010-12-29 2013-12-04 华为数字技术(成都)有限公司 存储系统连接配置方法、设备及其存储系统
US8972689B1 (en) 2011-02-02 2015-03-03 Violin Memory, Inc. Apparatus, method and system for using real-time performance feedback for modeling and improving access to solid state media
US8635416B1 (en) 2011-03-02 2014-01-21 Violin Memory Inc. Apparatus, method and system for using shadow drives for alternative drive commands
US9846609B2 (en) * 2015-12-11 2017-12-19 Yokogawa Electric Corporation System and method for testing configuration and operation of I/O devices
CN105577436B (zh) * 2015-12-21 2019-02-12 成都华为技术有限公司 一种更改zone信息的方法、设备
CN110768814B (zh) * 2018-07-26 2022-08-19 中车株洲电力机车研究所有限公司 一种通信端口故障检测方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6260120B1 (en) 1998-06-29 2001-07-10 Emc Corporation Storage mapping and partitioning among multiple host processors in the presence of login state changes and host controller replacement
US6421711B1 (en) * 1998-06-29 2002-07-16 Emc Corporation Virtual ports for data transferring of a data storage system
US6542961B1 (en) 1998-12-22 2003-04-01 Hitachi, Ltd. Disk storage system including a switch
US6757242B1 (en) * 2000-03-30 2004-06-29 Intel Corporation System and multi-thread method to manage a fault tolerant computer switching cluster using a spanning tree
US6601187B1 (en) 2000-03-31 2003-07-29 Hewlett-Packard Development Company, L. P. System for data replication using redundant pairs of storage controllers, fibre channel fabrics and links therebetween
US6775230B1 (en) * 2000-07-18 2004-08-10 Hitachi, Ltd. Apparatus and method for transmitting frames via a switch in a storage area network
US6922414B1 (en) * 2000-08-21 2005-07-26 Hewlett-Packard Development Company, L.P. Apparatus and method for dynamic command queue depth adjustment for storage area network nodes
US6925578B2 (en) * 2001-09-29 2005-08-02 Hewlett-Packard Development Company, L.P. Fault-tolerant switch architecture
JP3950679B2 (ja) 2001-11-29 2007-08-01 株式会社日立製作所 Sanのアクセスパスの診断システム
US7886298B2 (en) 2002-03-26 2011-02-08 Hewlett-Packard Development Company, L.P. Data transfer protocol for data replication between multiple pairs of storage controllers on a san fabric
JP2003296037A (ja) 2002-04-05 2003-10-17 Hitachi Ltd 計算機システム
JP2003316522A (ja) * 2002-04-26 2003-11-07 Hitachi Ltd 計算機システムおよび計算機システムの制御方法
US7260628B2 (en) * 2002-09-06 2007-08-21 Hitachi, Ltd. Event notification in storage networks
US7272674B1 (en) * 2003-06-30 2007-09-18 Veritas Operating Corporation System and method for storage device active path coordination among hosts
JP4080970B2 (ja) * 2003-07-30 2008-04-23 株式会社日立製作所 パス切替えを提供するスイッチ
JP4516306B2 (ja) * 2003-11-28 2010-08-04 株式会社日立製作所 ストレージネットワークの性能情報を収集する方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007256993A (ja) * 2006-03-20 2007-10-04 Hitachi Ltd 物理リンクの割当てを制御するコンピュータシステム及び方法
US8275938B2 (en) 2006-03-20 2012-09-25 Hitachi, Ltd. Computer system for controlling allocation of physical links and method thereof
US8543762B2 (en) 2006-03-20 2013-09-24 Hitachi, Ltd. Computer system for controlling allocation of physical links and method thereof
JP2007265243A (ja) * 2006-03-29 2007-10-11 Hitachi Ltd 計算機システム及び論理パス切替方法
JP2011108006A (ja) * 2009-11-18 2011-06-02 Nec Corp ディスクアレイ装置の故障診断システム、故障診断方法、故障診断プログラムおよびディスク装置
JP2015510296A (ja) * 2011-12-23 2015-04-02 シーラス・データ・ソリューションズ・インコーポレーテッド ホストエンティティによってアクセスされうる格納データを識別しデータ管理サービスを提供するシステム、装置、および方法
WO2016117008A1 (ja) * 2015-01-19 2016-07-28 株式会社日立製作所 ストレージシステム、計算機システム、及び障害箇所推定方法

Also Published As

Publication number Publication date
US20060092848A1 (en) 2006-05-04
US20050195736A1 (en) 2005-09-08
US7020089B2 (en) 2006-03-28
US7519001B2 (en) 2009-04-14

Similar Documents

Publication Publication Date Title
JP2005251078A (ja) 情報処理装置、及び情報処理装置の制御方法
US9697087B2 (en) Storage controller to perform rebuilding while copying, and storage system, and control method thereof
US9542272B2 (en) Write redirection in redundant array of independent disks systems
US7610515B2 (en) Disk array device and failure response verification method thereof
US7631157B2 (en) Offsite management using disk based tape library and vault system
US9886451B2 (en) Computer system and method to assist analysis of asynchronous remote replication
EP1755028A1 (en) Storage system, formatting method and computer program product.
US20090265510A1 (en) Systems and Methods for Distributing Hot Spare Disks In Storage Arrays
JP2009530728A (ja) Raidアダプタからのディスク関連タスクのオフロードのための方法、システム、プログラム(raidアダプタからのディスク関連タスクのオフロード)
US10223221B2 (en) Enclosure-encapsulated RAID rebuild
CN103136075A (zh) 磁盘系统、数据保存装置以及磁盘设备
US7315922B2 (en) Disk array apparatus, information processing apparatus, data management system, method for issuing command from target side to initiator side, and computer product
JP2006313410A (ja) ストレージネットワークの管理情報管理方法、ストレージ管理システム及びストレージ管理ソフトウェア
JP2017174238A (ja) 制御プログラム、制御方法、および制御装置
CN106610788B (zh) 硬盘阵列控制方法及装置
US20150046601A1 (en) Network system, maintenance work management method, processing apparatus, and non-transitory computer-readable recording medium recording program
JP5760585B2 (ja) ストレージシステムおよび異常発生箇所判定方法
US9582385B2 (en) Surviving write errors by using copy-on-write to another system
US6272442B1 (en) Taking in-use computer drives offline for testing
JP4080629B2 (ja) アクセス制御装置及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体
EP2367099A2 (en) Odd raid driving method
KR100856675B1 (ko) 제1 정보 기억 및 검색 시스템으로부터 제2 정보 기억 및검색 시스템으로 정보를 제공하기 위한 장치 및 방법
US20110185137A1 (en) Concurrent copy of system configuration global metadata
US20090138630A1 (en) Storage system and external volume connection path searching method for storage system
JP2007128551A (ja) ストレージエリアネットワークシステム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070126

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070126

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090525