JP2011164777A - スイッチ装置、スイッチ制御方法、及びストレージシステム - Google Patents

スイッチ装置、スイッチ制御方法、及びストレージシステム Download PDF

Info

Publication number
JP2011164777A
JP2011164777A JP2010024538A JP2010024538A JP2011164777A JP 2011164777 A JP2011164777 A JP 2011164777A JP 2010024538 A JP2010024538 A JP 2010024538A JP 2010024538 A JP2010024538 A JP 2010024538A JP 2011164777 A JP2011164777 A JP 2011164777A
Authority
JP
Japan
Prior art keywords
error response
unit
error
control signal
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010024538A
Other languages
English (en)
Other versions
JP5532987B2 (ja
Inventor
Yusuke Kurasawa
祐輔 倉澤
Toshiaki Takeuchi
利明 竹内
Masakazu Sakamoto
眞和 坂元
Tetsuya Kinoshita
徹哉 木下
Jun Takeuchi
順 竹内
Atsushi Shinohara
敦史 篠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010024538A priority Critical patent/JP5532987B2/ja
Priority to US13/020,868 priority patent/US8504881B2/en
Publication of JP2011164777A publication Critical patent/JP2011164777A/ja
Application granted granted Critical
Publication of JP5532987B2 publication Critical patent/JP5532987B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】障害発生時の計算装置の動作に合わせたスイッチの動作の設定を自動的に行うこと。
【解決手段】記憶部12は、ストレージ3を制御する制御信号に対して障害発生時に応答するためのエラー応答を記憶する。エラー応答出力部11は、制御信号の入力を受けて記憶部12に記憶されている各エラー応答を順次出力する。動作情報算出部13は、出力した各エラー応答に対するホスト2の動作を検出し、エラー応答を受けたときのホスト2の動作の条件である動作情報を求める。動作設定部14は、求めた動作情報を基に障害発生時の動作の設定を行う。
【選択図】図1

Description

本発明は、スイッチ装置、スイッチ制御方法、及びストレージシステムに関する。
近年、複数の記憶媒体を用いて大容量のデータ記憶を実現するストレージシステムが一般的になっている。ストレージシステムには、例えばストレージエリアネットワーク(Storage Area Network : SAN)と呼ばれるものがある。ストレージシステムでは、計算装置と記憶装置(記憶媒体)との間に、スイッチ装置(以下では単に「スイッチ」と呼ぶ。)やケーブルなどによるネットワークが構築される。この計算装置はサーバなどであり、ホストとも呼ばれる。また、記憶装置はハードディスクなどの記憶媒体を有する装置であり、ストレージとも呼ばれる。そして、データやコマンドを含むフレームが、計算装置と記憶装置の間のネットワーク上で送受信されることにより、データの書き込みや読み出しが行われる。このとき、計算装置は、イニシエータとして、データの書き込みまたは読み出しのターゲットとなる記憶装置へコマンドを送信する。すなわち、計算装置がストレージシステム内の処理を主導しており、記憶装置は、受動的に動作する。
また、近年では、計算装置と記憶装置との間のデータの送受信を光で行うために、ファイバチャネル(Fibre Channel : FC)が接続ケーブルとして使われることもある。ファイバチャネルを用いた場合、計算装置には、データの光伝送の送受信のポートを有するHost Bus Adapter(HBA)が配置される。このファイバチャネルを用いた構成に用いられるスイッチは特に、ファイバチャネルスイッチ(FCスイッチ)と呼ばれる。
さらに、スイッチの中でも、1つ又は複数の物理的な記憶媒体を仮想化して1つ又は複数の仮想ディスクを構成する機能を備えた仮想化スイッチが提案されている。そして、この仮想化スイッチは、構成した仮想ディスクを記憶媒体として計算装置に提供する。具体的には、仮想化スイッチは、当該仮想化スイッチに接続された物理的な記憶媒体の任意の領域を仮想記憶媒体として構成する。そして、仮想化スイッチは、構成した仮想記憶媒体に対する制御信号の送受信などの制御を行う機能を有する。以下の説明では、「記憶媒体」には仮想記憶媒体を含むものとして説明する。
ストレージエリアネットワーク上には、様々な種類の計算装置(例えば、製造元や構成などが異なる計算装置)が配置されている。そして、記憶媒体へのデータのやり取りにおいて障害が発生した際の計算装置における再試行やフェイルオーバーの動作(挙動)は、計算装置の種類によって異なる。また、この再試行やフェイルオーバーの動作には計算装置に設けられた記憶媒体との通信を行う通信部(HBAなど)の種類によっても異なる。そのため、仮想化スイッチから障害が発生した旨の通知を計算装置に送信する際、仮想化スイッチは、通信経路の切り替えなどのエラーハンドリングの制御を計算装置の動作に合わせて行う必要がある。そのため、操作者はこのエラーハンドリングの制御のためにスイッチの動作を計算装置の動作に合わせて設定する必要がある。
ここで、従来の計算装置と記憶装置との接続時の作業を説明する。以下では、計算装置と記憶装置との接続時の作業を行う者を「作業者」と呼ぶ。まず、新しく計算装置と記憶装置とを接続する際、作業者は、実際に運用する計算装置、スイッチ、及び記憶装置を用いてデータの送受信の試験を行い、計算装置の動作についての情報を採取する。そして、作業者は、採取した情報を基に、スイッチ側で計算装置の動作に合わせてスイッチが適切に動作するように、スイッチの動作制御を行うソフトウェア(ファームウェア)を作成する。さらに、作業者は、再度データ通信の試験、ファームウェアの作成を繰り返す。そして、作業者は、最終的に作成したファームウェアにスイッチのファームウェアを入れ替えることにより、その計算装置と記憶装置との間のデータ通信の動作が可能となる。
また従来、計算装置のSCSI(Small Computer System Interface)インタフェースの試験を行うにあたって、擬似I/Oを接続した状態で、SCSIインタフェースの試験を行う技術が提供されている。
特開平6−52072号公報
しかしながら、上述した方法では、操作者は、計算装置の動作を一つずつ確認し、その確認した動作への対応を行い、さらに次の動作確認を行う必要があった。また、計算装置の種類、スペック、及び通信部の種類の組み合わせによって、計算装置の動作が変わるため、それらについても考慮した動作確認を行う必要があった。このような方法では、操作者にとって非常に多くの手間と時間が必要になってしまっていた。また、上述した擬似I/Oを接続して試験を行う技術は、スイッチの動作を設定するには、従来と同様に個々の計算装置の動作に合わせて操作者が一つ一つ手動でその挙動に対する対応を行わなければならなかった。
開示の技術は、上記に鑑みてなされたものであって、障害発生時の計算装置の挙動に合わせたスイッチの動作の設定を自動的に行う、スイッチ装置、スイッチ制御方法、及びストレージシステムを提供することを目的とする。
本願の開示するスイッチ装置は、一つの態様において、自装置に接続された記憶装置を制御する制御信号に対して障害発生時に応答するためのエラー応答を記憶する記憶部と、前記制御信号の入力を受けて前記記憶部に記憶されている各エラー応答を順次出力するエラー応答出力部と、出力した各エラー応答に対する自装置に接続された計算装置の動作を検出し、前記各エラー応答を受けたときの前記計算装置の動作を規定する条件である動作情報を求める動作情報算出部と、前記動作情報を基に障害発生時の動作の設定を行う動作設定部とを備える。
また、本願の開示するスイッチ制御方法は、自装置に接続された記憶装置を制御する制御信号に対して障害発生時に応答するためのエラー応答をエラー事象別に記憶する記憶ステップと、前記制御信号の入力を受けて、前記記憶部に記憶されている各エラー応答を順次出力するエラー応答出力ステップと、前記エラー応答出力ステップで出力された各エラー応答に対する自装置に接続された計算装置の動作を検出し、前記各エラー応答を受けたときの前記計算装置の動作を規定する条件を動作情報として求める動作情報算出ステップと、前記動作情報を基に障害発生時の動作の設定を行う動作設定ステップとを含む。
また、本願の開示するストレージシステムは、一つの態様において、計算装置、記憶装置、及びスイッチ装置を有し、前記計算装置は前記スイッチ装置を介して前記記憶装置に対してデータの読み書きを行うストレージシステムであって、前記スイッチ装置は、自装置に接続された記憶装置を制御する制御信号に対して障害発生時に応答するためのエラー応答をエラー事象別に記憶する記憶部と、前記制御信号の入力を受けて、前記記憶部に記憶されている各エラー応答を順次出力するエラー応答出力部と、前記エラー応答出力部が出力した各エラー応答に対する自装置に接続された計算装置の動作を検出し、前記各エラー応答を受けたときの前記計算装置の動作を規定する条件を動作情報として求める動作情報算出部と、前記動作情報を基に障害発生時の動作の設定を行う動作設定部とを備え、前記計算装置は、前記スイッチ装置に前記制御信号を出力する制御信号出力部と、前記制御信号出力部が出力した前記制御信号に対する前記スイッチ装置からの前記エラー応答を受けて、該エラー応答に対処する動作を実施するエラー対処部とを備える。
本願の開示するスイッチ装置、スイッチ制御方法、及びストレージシステムの一つの態様によれば、障害発生時の計算装置の動作に合わせたスイッチの動作の設定が、操作者によるファームの交換なしで自動的に行えるという効果を奏する。
図1は、実施例1に係るスイッチを用いたストレージシステムの機能を表すブロック図である。 図2は、実施例2に係る仮想化FCスイッチを用いたストレージシステムの構成を示す図である。 図3は、実施例2に係るホスト、スイッチ、及びストレージの接続図である。 図4は、実施例2に係る仮想化FCスイッチを用いたストレージシステムの機能を表すブロック図である。 図5は、ホスト挙動データテーブルの一例の図である。 図6は、エラーセンスを用いたデータ採取を説明するためのシーケンス図である。 図7は、SCSIステータスを用いたデータ採取を説明するためのシーケンス図である。 図8は、コマンドタイムアウトを用いたデータ採取を説明するためのシーケンス図である。 図9は、ファームウェアの設定変更の動作を説明するためのシーケンス図である。 図10は、実施例2に係るスイッチを用いたストレージシステムの各動作モードにおける動作のフローチャートである。
以下に、本願の開示するスイッチ装置、スイッチ制御方法、及びストレージシステムの実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
図1は、実施例1に係るストレージシステムの機能を示すブロック図である。
スイッチ1はスイッチ装置の一例であり、ホスト2は計算装置の一例であり、ストレージ3は記憶装置の一例である。そして、スイッチ1はエラー応答出力部11、記憶部12、動作情報算出部13、及び動作設定部14を有している。以下では、ホスト2が出力するストレージ3を制御する制御信号として、SCSIコマンドを例に説明する。ただし、この制御信号はSCSIコマンドに限られない。
記憶部12は、メモリやハードディスクなどの情報記憶媒体である。そして、記憶部12は、エラー応答を記憶する。エラー応答は、ホスト2から送られてくるストレージ3を制御するためのSCSIコマンドに対して、障害発生時にストレージ3が応答する情報である。
エラー応答出力部11は、ホスト2からSCSIコマンドを受けて、記憶部12に記憶されている各エラー応答をホスト2へ順次出力し、さらに、エラー応答出力部11は、ホスト2からSCSIコマンドを受けて、記憶部12に記憶されている各エラー応答をホスト2へ順次出力していく。
動作情報算出部13は、各エラー応答の入力を受けた時のホスト2の動作を検出し、その動作を規定する条件である動作情報を求める。そして、動作情報算出部13は、求めた動作情報を動作設定部14へ出力する。
動作設定部14は、入力された動作情報を基に、スイッチ1の障害発生時の動作の設定を行う。
上述してきたように、本実施例では、障害発生時のホストの動作に合わせたFCスイッチの動作の設定が、操作者によるファームウェアの交換なしで自動的に設定できる。
まず、図2及び図3を参照して、本実施例に係るストレージシステムの構成の概要を説明する。図2は、実施例2に係る仮想化FCスイッチ(仮想化ファイバチャネルスイッチ)を用いたストレージシステムの構成を示す図である。図3は、実施例2に係るホスト、スイッチ、及びストレージの接続図である。本実施例では計算装置であるホスト2と記憶装置であるストレージ3との間のデータの送受信を、ファイバチャネルを用いて光データの送受信を行う構成で説明する。以下では仮想化ファイバチャネルスイッチを単に「FCスイッチ」と呼ぶ。
本実施例に係るFCスイッチ1a及びFCスイッチ1b(以下では、それぞれのFCスイッチを区別しない場合には単に「FCスイッチ1」と言う。)は、運用モードとデータ採取モードという2つのモードを有している。運用モードとはホスト2からストレージ3へのデータの読み書きが行われるモードであり、実際の運用時の動作を行うモードである。データ採取モードとは、ホスト2を新規に追加するなど、新しくホスト2とストレージ3とを接続するときに、障害発生時のホスト2の動作を検出し収集してFCスイッチ1の動作設定を行うモードである。ここで、「ホスト2の動作」とは、障害発生時のホスト2のSCSIコマンドの出力や、ホスト2のSCSIコマンドの出力タイミングなどのことを指す。ここで、本実施例2ではホスト2が出力する制御信号としてSCSIコマンドを例に説明するが、この制御信号はSCSIコマンドに限られない。そして、ホスト2の動作を検出し、その検出した動作の情報を収集することを「ホスト2の動作のデータ採取」という。ここで、「採取」とはホスト2がどのような動作を行うかを検出し、その検出した動作の情報を収集することを表している。データ採取モードにおいてFCスイッチ1を適切な動作設定に変更することで、運用モード時においてFCスイッチ1が各ホスト2に対して適切な動作を行うことができる。そこで、まずは図2を参照して、通常の運用形態である運用モード時の各装置の動作を説明する。
(運用モード)
図2に示すように、本実施例のストレージシステムには、ホスト2、FCスイッチ1a及びFCスイッチ1b、並びにストレージ3が配置されている。ホスト2は、FCスイッチ1aが使用できる場合には、FCスイッチ1aを介してストレージ3とデータの送受信を行う。そして、FCスイッチ1aが使用できない場合には、ホスト2は、FCスイッチ1bを介してストレージ3とデータの送受信を行う。
さらに詳細に、ホスト2とストレージ3とのデータの送受信について説明する。以下では、FCスイッチ1aを介したデータの送受信について説明する。ここで、FCスイッチ1aとFCスイッチ1bとは同様の構成を有し、データの送受信においても同様の動作を行うので、以下の説明はFCスイッチ1bについても同様である。
ホスト2にはHost Bass Adopter(HBA)20が設けられている。HBA20はファイバチャネルを用いてストレージ3とデータの光伝送の送受信を行うための通信部である。すなわち、ホスト2は、HBA20を用いてストレージ3とのデータの光伝送の送受信を行う。また、ストレージ3には物理ディスク31a〜31cが搭載されている。また、ストレージ3には実際には図3に示すChannel Adapter(CA)32がデータの光伝送において、物理ディスクへのデータの受け渡しを行う通信口として設けられている。実際にはこのCA32を介してデータの光伝送の送受信が行われている。ただし、図2では説明を簡単にするためCA32を表示していない。また、以下の説明では、説明の都合上FCスイッチ1aとストレージ3との間のデータの送受信においてCA32を介していることを特に明記しない。
FCスイッチ1a及びFCスイッチ1bはそれぞれ、仮想化構成100a及び仮想化構成100bを構成している。仮想化構成100aは、ホスト2に仮想ディスクを提供するための構成である。仮想化構成100aは、仮想化ターゲット(Virtual Target : VT)101a及び仮想ディスク102で構成されている。仮想化ターゲット101aとは、ホスト2とのデータの送受信を行う仮想的な入出力ポートである。また、仮想ディスク102は、ストレージ3に搭載された物理ディスク31a〜31cの1つ又はいくつかを用いて構成された仮想的な記憶媒体である。本実施例では、仮想ディスク102は、物理ディスク31a及び物理ディスク31bで構成されている。ただし、仮想ディスクに使用される物理ディスクの数に特に制限はない。ここで、図2の仮想化構成100a及び仮想化構成100bにはそれぞれ仮想ディスク102が記載されているが、この仮想ディスク102はどちらも同じ仮想ディスクであり、単にホスト2からアクセスする経路が異なるものである。すなわち、ホスト2は、FCスイッチ1a又はFCスイッチ1bのいずれを経由しても仮想ディスク102とデータの送受信を行うことができる。
ホスト2は、HBA20を用いて、仮想化構成100aの仮想化ターゲット101aを経由して仮想ディスク102に接続する。この接続が確立した状態で、ホスト2は、FCスイッチ1aに対し制御信号を送信することで、仮想ディスク102へのデータの読み出しや書き込みといった制御を行う。本実施例では、制御信号はSCSIコマンドである。このSCSIコマンドは、0x00から0xffまでのコードで表されるデータである。
図3を参照してさらに各装置の接続について説明する。図3ではホスト2を表す1枚の絵が、1台のホストを表しており、ホスト2が複数配置されていることを示している。すなわち、様々なホスト2がFCスイッチ1aに接続している。そして、ホスト2は、ドライバ201を用いてHBA20を動作させる。そして、FCスイッチ1aは、HBA20からデータの読み書きといった命令を受け取る。そして、FCスイッチ1aは、仮想化ターゲット101aを介して仮想ディスク102に対しデータの読み書きを行う。この時、FCスイッチ1aとストレージ3との間では、実際のデータはCA32を介して物理ディスク31から読み出されたり、物理ディスク31に対して書き込まれたりする。例えば、ホスト2は、読み出しのSCSIコマンドをFCスイッチ1aに送ると、FCスイッチ1aはそのSCSIコマンドを基にストレージ3を制御し、仮想ディスク102から指定されたデータの読み出しを行い、読み出したデータをホスト2へ出力する。図3に記載されているTP(テストプログラム)200については後で説明する。
(障害発生時)
次に、運用モードにおいて、ストレージ3やFCスイッチ1aに障害が発生した場合の動作を説明する。
ストレージ3は、障害が発生すると、FCスイッチ1aにエラー応答を出力する。FCスイッチ1aは、ファームウェア161の設定に従い、必要であれば出力されたエラー応答の変換を行う。そして、FCスイッチ1aは、エラー応答をホスト2に出力する。ホスト2は、エラー応答を受けて、予め決められている繰り返し回数や再試行間隔に従って、エラー応答に対応する動作を行う。ここで、繰り返し回数とは、同一のSCSIコマンドを何回出力したときにホスト2がエラーと判断するかの回数である。また、再試行間隔とは、ホスト2があるコマンドを送信してから次に同一のコマンドを送信するまでの時間である。言い換えれば、ホスト2が同一のコマンドを再送するまでの間隔である。
ここで、エラー応答とは、ストレージ制御部19からの制御命令に対する障害発生時のストレージ3からの応答である。本実施例では、エラー応答の種類には、発生したエラー内容を表すエラーセンス、及びストレージ3の状態などを示すSCSIステータスがある。より具体的には、エラーセンスとは、0x1/0x00/0x00から0xf/0xff/0xffまでのコードで表されるデータである。そして、各コードに対してエラーセンスの種別が定義されている。また、SCSIステータスとは、0x1から0xfまでのコードで表されるデータである。そして、各コードに対してSCSIステータスの種別が定義されている。
また、ストレージ制御部19からの制御命令に対するストレージ3からの応答が所定時間内に無い場合も障害の発生であり、これをコマンドタイムアウトという。以下では、コマンドタイムアウトも含めて「エラー応答」と表す場合がある。
繰り返し回数や再試行間隔などのエラー応答やコマンドタイムアウトに対する動作は、ホスト2毎に異なってくる。また、上述したように、ファームウェア161によって障害発生時におけるFCスイッチ1aの動作が決定される。そのため、後述するようにデータ採取モードにおいてこのファームウェア161の設定を適切に変更することで、各ホスト2に対してFCスイッチ1aの動作を適切に行うことが可能となる。
また、FCスイッチ1aとFCスイッチ1bとは、経路103で互いに通信可能に接続されている。FCスイッチ1aはFCスイッチ1bに対して、経路103経由でハートビート(自己が動作していることを示す信号)を送信している。そして、FCスイッチ1aからFCスイッチ1bに対するハートビートが送信されなくなると、FCスイッチ1bは、FCスイッチ1aでLAN障害が発生したと判断して、FCスイッチ1b経由でのホスト2とストレージ3との間のデータ通信に切り替える。これは「パス切り替え」と呼ばれる。さらに、FCスイッチ1aとホスト2との間の通信が切れた場合、又はFCスイッチ1aとFCスイッチ1bとの間のHUBを介したネットワーク接続が切れた場合にも、パス切り替えが行われる。
(データ採取モード)
データ採取モードとは、FCスイッチ1aからエラー応答を受けたとき及びコマンドタイムアウトが発生したときのホスト2の動作に合わせて、FCスイッチ1aが適切な対応を行えるようにFCスイッチ1aのファームウェア161の設定を自動的に更新するモードである。データ採取モードの動作の概要としては、FCスイッチ1aが、ストレージ3からのエラー応答やコマンドタイムアウトを受けてホスト2がストレージ3に対してどのような動作を行うかの情報を採取する。そして、FCスイッチ1aは、その採取した動作の情報を基にFCスイッチ1aのファームウェア161の設定を変更する。このデータ採取モードについては次に詳細に説明する。ここで、データ採取モード時の各エラー応答及びコマンドタイムアウトに対するホスト2の動作のデータ採取における通信は、実際には図3に示すようにホスト2で実行されるTP200とFCスイッチ1aで実行されるファームウェア161との通信により行われる。しかし、以下の説明では説明の都合上各機能部が直接通信を行っているように説明する。
図4を参照して、本実施例に係るストレージシステムの全体構成を説明する。図4は、実施例2に係るFCスイッチを用いたストレージシステムの機能を表すブロック図である。
図4に示すように、FCスイッチ1aは、エラー応答出力部15、記憶部16、動作情報算出部17、動作設定部18、ストレージ制御部19、及び統括制御部40を備えている。また、ホスト2は、制御信号出力部21、エラー対処部22、動作情報記憶部23、実行処理部24、及び記憶部25を備えている。これらの機能部のうち、エラー応答出力部15、動作情報算出部17、動作設定部18、及び動作情報記憶部23はデータ採取モードにおいて動作する機能部である。
データ採取モードでは、エラー応答出力部15は、制御信号出力部21からSCSIコマンドを受ける。このSCSIコマンドとは、例えばREADコマンドやWRITEコマンドなどである。そして、エラー応答出力部15は、動作情報算出部17へSCSIコマンドを受けた旨の通知を行う。そして、エラー応答出力部15は、統括制御部40により指定された特定のエラー応答を記憶部16から取得し、エラー対処部22へ出力する。さらに、エラー応答出力部15は、統括制御部40により指定された特定のエラー応答を動作情報算出部17へ出力する。また、エラー応答出力部15は、コマンドタイムアウト時のホスト2の動作の情報を採取の場合には、制御信号出力部21からのSCSIコマンドの入力を受けるとそのまま破棄する。そして、エラー応答出力部15は、統括制御部40からのホスト2の動作のデータ採取の終了の指示を受けると、エラー応答の出力又はSCSIコマンドの破棄を停止する。さらに、エラー応答出力部15は、動作情報算出部17にホスト2の動作のデータ採取終了の通知を出力する。ただし、統括制御部40が、このホスト2の動作のデータ採取終了の通知を動作情報算出部17に出力してもよい。
記憶部16は、メモリやハードディスクなど情報記憶媒体を有している。そして、記憶部16には、ファームウェア161が記憶されている。このファームウェア161は、FCスイッチ1aの動作制御を行うソフトウェアである。ファームウェア161には、SCSIコマンドのタイムアウト監視時間、LAN障害時のパス切り替え監視時間、エラーセンス内容の変換情報などの設定が記載されている。ここで、SCSIコマンドのタイムアウト監視時間とは、ホスト2からSCSIコマンドの入力を受けてからストレージ3がそのSCSIコマンドの処理が行えないとFCチャネル1aが判断するまでの時間である。また、LAN障害時のパス切り替え監視時間とは、LAN障害が発生している場合に、ホスト2からSCSIコマンドの入力を受けてからパス切り替えが発生するとFCチャネル1aが判断するまでの時間である。また、エラーセンス内容の変換情報とは、FCチャネル1が、あるSCSIコマンドを受けた場合に他のSCSIコマンドに変換する情報である。また、記憶部16は、エラー応答を記憶する。
動作情報算出部17は、カウンタ及びタイマーを備えている。データ採取モードにおいて、動作情報算出部17は、エラー応答出力部15からSCSIコマンドを受けた旨の通知を受けると、自己のカウンタをインクリメントして各SCSIコマンドの入力回数を数える。さらに、動作情報算出部17は、自己のタイマーを使用して、エラー応答出力部15からのSCSIコマンドを受けた旨の通知を受信したタイミングから指定された特定のエラー応答が入力されたタイミングまでの時間を計測する。また、動作情報算出部17は、コマンドタイムアウトの場合、エラー応答出力部15からのSCSIコマンドを受けた旨の通知を受信したタイミングから次のSCSIコマンドをエラー応答出力部15が受けた旨の通知を受信したタイミングまでの時間を計測する。
動作情報算出部17は、エラー応答出力部15からのホスト2の動作のデータ採取終了の通知を受けて、各SCSIコマンドの入力回数を求めることで、各SCSIコマンドに対する各エラー応答又はコマンドタイムアウトのリトライ回数を求める。さらに、動作情報算出部17は、計測した時間を各SCSIコマンドに対する各エラー応答又はコマンドタイムアウトのリトライ間隔とする。ここで、計測した時間とは、エラー応答出力部15からエラー応答の出力がある場合には、エラー応答出力部15からのSCSIコマンドを受けた旨の通知を受信したタイミングから指定された特定のエラー応答が入力されたタイミングまでの時間を指す。また、コマンドタイムアウトの場合には、エラー応答出力部15からのSCSIコマンドを受けた旨の通知を受信したタイミングから次のSCSIコマンドをエラー応答出力部15が受けた旨の通知を受信したタイミングまでの間隔である。
この求めたリトライ回数及びリトライ情報がホスト2の「動作情報」である。そして、採取したホスト2の動作から動作情報を求めることを「動作情報の採取」という。
動作情報算出部17は、求めたリトライ回数及びリトライ間隔を、対応するSCSIコマンド、及びエラー応答の情報又はコマンドタイムアウトの情報とともにホスト2の動作情報記憶部23へ出力する。そして、動作情報算出部17は、ホスト挙動データテーブル231にホスト2の動作情報を登録させる。ここで、ホスト2が多数ある場合、FCスイッチ1aがホスト挙動データテーブル231をまとめて記憶するためには大きな記憶容量が必要となってしまう。そこで、本実施例では、FCスイッチ1aの記憶容量を抑えるため、ホスト2に自己の動作情報を記載したホスト挙動データテーブル231を記憶させている。したがって、FCスイッチ1aが十分な記憶容量を有している場合には、ホスト挙動データテーブル231をFCスイッチ1が記憶しても良い。
ここで、本実施例では1つのSCSIコマンドに対するすべてのエラー応答又はコマンドタイムアウトにおけるホスト2の動作のデータ採取が終わった段階で、リトライ回数及びリトライ間隔を出力している。しかし、動作情報算出部17は、すべてのSCSIコマンド又はコマンドタイムアウトに対するホスト2の動作のデータ採取が終わった段階で、リトライ回数及びリトライ間隔を出力するように構成にしても良い。
さらに、動作情報算出部17は、統括制御部40からホスト2の動作のデータ採取終了の通知を受ける。そして、動作情報算出部17は、動作のデータ採取終了を受けるまでに採取したホスト2の動作に基づく動作情報の採取が完了すると、動作設定部18に動作情報の採取終了の通知を出力する。
動作設定部18は、データ採取モードにおいて、動作情報算出部17からのホスト2の動作情報の採取終了の通知を受ける。そして、動作設定部18は、ホスト2の動作情報記憶部23からホスト挙動データテーブル231を取得する。そして、動作設定部18は、ホスト挙動データテーブル231に登録された情報を用いて、ファームウェア161を更新することで、障害発生時のFCチャネル1aの動作の設定を行う。このファームウェア161の更新とは具体的には、各ホスト2に対するSCSIコマンドタイムアウト監視時間の設定、LAN障害時のパス切り替え監視時間の設定、エラーセンス内容の変換情報の設定などの更新である。
運用モードでは、ストレージ制御部19は、制御信号出力部21からSCSIコマンドの入力を受けて、SCSIコマンドで指示された制御をストレージ3に対して実行する。さらに、ストレージ制御部19は、ストレージ3から受けた応答をホスト2の実行処理部24へ出力する。例えば、所定のデータの読み出しのSCSIコマンドを受けた場合には、ストレージ制御部19は、指定されたデータを提供するようストレージ3を制御する。そして、ストレージ制御部19は、ストレージ3から取得したデータをホスト2の実行処理部24へ出力する。ここでの説明では、ストレージ制御部19が単にストレージ3に対する命令を実行するとして説明しているが、これは実際には上述したように仮想ディスク31への読み書きの実施を指している。
また、ストレージ制御部19は、運用モードにおいてストレージ3に障害が発生した場合などに、ストレージ3からのエラー応答を受ける。エラー応答を受けると、ストレージ制御部19は、ファームウェア161を参照する。そして、ストレージ制御部19は、ストレージ3から受けたエラー応答を必要であれば変換情報により変換し、ホスト2へ出力するエラー情報を作成する。そして、ストレージ制御部19は、各監視時間などにより出力タイミングを調整してホスト2のエラー対処部22へエラー情報を出力する。
統括制御部40は、各機能部の動作タイミングの調整などFCスイッチ1aの動作の全体的な制御を行う。統括制御部40から各機能部へ向かう点線矢印は制御命令の流れを表している。
データ採取モードでは、統括制御部40は、制御信号出力部21からの特定のエラー応答の継続的な出力の命令(「特定のエラー応答を出力し続ける」という命令)を受けて、指定されたエラー応答のみを出力するようにエラー応答出力部15を制御する。また、統括制御部40は、制御信号出力部21からのコマンドタイムアウトの命令を受けて、エラー応答を出力しないようにエラー応答出力部15を制御する。また、統括制御部40は、制御信号出力部21からホスト2の動作のデータ採取終了の通知を受信した場合、動作情報算出部17に対しその旨の通知を送信する。また、統括制御部40は、制御信号出力部21からホスト2の動作のデータ採取終了の通知を受信の通知を受信すると、エラー応答を出力しないようエラー応答出力部15を制御する。本実施形態では、このホスト2の動作のデータ採取終了の通知がデータ採取モードの終了の通知を兼ねており、統括制御部40は、前述した動作設定部18の動作が完了すると各機能部にデータ採取モード終了の通知を行う。
制御信号出力部21は、メモリなどの記憶媒体を有している。そして、制御信号出力部21は、自己の記憶領域にストレージ3を制御するための制御信号を予め記憶している。本実施例では、制御信号出力部21は、制御信号としてSCSIコマンド(0x00〜0xff)を記憶している。
運用モードでは、制御信号出力部21は、実行処理部24からの要求を受けて、要求された制御(データの読み書きなど)をストレージ3に対して行うための制御信号をスイッチ1aのストレージ制御部19へ出力する。上述したように、本実施例ではこの制御信号はSCSIコマンドである。
データ採取モードでは、制御信号出力部21は、実行処理部24からの入力を受けて、FCスイッチ1aの統括制御部40に対しモードへの切り替え命令を出力する。さらに、制御信号出力部21は、統括制御部40に対し出力するエラー応答を指定又はコマンドタイムアウトの実行を命令する。具体的には、本実施例では、制御信号出力部21は、特定のエラー応答の継続的な出力の命令を統括制御部40に対して送信することで、データ採取モードへの切り替え命令及びエラー応答の指定やコマンドタイムアウトの実行の命令を行っている。データ採取モードへの切り替え命令及びエラー応答の指定の通知は、使用していない特定のSCSIコマンドを用いて行う。
そして、制御信号出力部21は、エラー対処部22において一つのSCSIコマンドに対するエラー対処が終了するまで、その一つのSCSIコマンドをエラー応答出力部15に出力する。そして、エラー対処が終了すると、制御信号出力部21は、エラー対処部22からエラー対処終了の通知を受ける。制御信号出力部21は、エラー対処終了の通知を受けて、まだホスト2の動作のデータ採取を行っていないSCSIコマンドのうちの一つを出力する。このようにして制御信号出力部21は、すべてのSCSIコマンドのホスト2の動作のデータ採取をFCスイッチ1aに実施させる。本実施形態では、一つのエラー応答に対し、0x00のSCSIコマンドから初めて、0x01、0x02と順次SCSIコマンドを変更して、0xffのSCSIコマンドまでホスト2の動作のデータ採取を行っていく。
制御信号出力部21は、実行処理部24で指定されたエラー応答又はコマンドタイムアウトに対するホスト2の動作のデータ採取が終了すると、実行処理部24に対して指定されたエラー応答に対するホスト2の動作のデータ採取の終了を通知する。ここで、エラー応答に対する動作のデータ採取の終了とは、指定されたエラー応答に対するホスト2の動作のデータ採取を、記憶しているすべてのSCSIコマンドに対して行ったことを指す。また、制御信号出力部21は、指定されたエラー応答に対するホスト2の動作のデータ採取の終了に伴い、FCスイッチ1aの統括制御部40に対し、ホスト2の動作のデータ採取終了の通知を含むデータ採取モード終了の通知を送信する。このデータ採取モード終了の通知は、使用していない特定のSCSIコマンドを用いて行う。
エラー対処部22は、メモリなどの記憶媒体を有している。そして、エラー対処部22は、自己の記憶領域に、各エラー応答及びコマンドタイムアウトに対する自装置における再試行間隔及び繰り返し回数を予め記憶している。また、エラー対処部22はカウンタ及びタイマーを有している。
運用モードにおける障害発生時には、エラー対処部22は、ストレージ制御部19からエラー応答の入力を受ける。エラー対処部22は、エラー応答の入力を受けると、自己が有するカウンタをインクリメントして入力回数をカウントしていく。そして、エラー対処部22は、入力回数が繰り返し回数以下の場合は、入力されたエラー応答に対する再試行間隔経過後に制御信号出力部21に制御信号の出力を行うよう指示する。そして、入力回数が記憶している繰り返し回数を超えた場合には、制御信号出力部21にエラー対処終了の通知を送信する。
また、コマンドタイムアウトの場合は、エラー対処部22は、所定時間内にエラー応答の入力を受けないと、自己が有するカウンタをインクリメントして入力回数をカウントしていく。そして、エラー対処部22は、入力回数が繰り返し回数以下の場合は、コマンドタイムアウトに対する再試行間隔経過後に制御信号出力部21に制御信号の出力を行うよう指示する。そして、入力回数が記憶している繰り返し回数を超えた場合には、制御信号出力部21にエラー対処終了の通知を送信する。
データ採取モードでは、エラー対処部22は、エラー応答出力部15からエラー応答の入力を受ける。エラー対処部22は、エラー応答の入力を受けると、自己のカウンタをインクリメントして入力回数をカウントしていく。そして、エラー対処部22は、入力回数が繰り返し回数以下の場合は、自己のタイマーを基に入力されたエラー応答に対する再試行間隔経過を待つ。そして、エラー対処部22は、再試行間隔経過後に、制御信号出力部21に制御信号の出力を行う要求を送信する。また、入力回数が繰り返し回数を超えた場合には、制御信号出力部21にエラー対処終了の通知を送信する。
また、エラー対処部22は、エラー応答出力部15からエラー応答の入力が所定時間内に無いとコマンドタイムアウトと判定する。そして、エラー対処部22は、コマンドタイムアウトと判定すると、自己のカウンタをインクリメントして入力回数をカウントしていく。そして、エラー対処部22は、入力回数が繰り返し回数以下の場合は、自己のタイマーを基にコマンドタイムアウトに対する再試行間隔経過を待つ。そして、エラー対処部22は、再試行間隔経過後に、制御信号出力部21に制御信号の出力を行う要求を送信する。ここで、再試行間隔がコマンドタイムアウトと判定する所定時間と同じであれば、コマンドタイムアウトと判定した後直ぐに制御信号出力部21に対して制御信号の出力を行う要求を送信する。また、入力回数が繰り返し回数を超えた場合には、制御信号出力部21にエラー対処終了の通知を送信する。
動作情報記憶部23は、メモリやハードディスクなどの情報記憶媒体である。ここで、図5を参照して、動作情報記憶部23に記憶されるホスト挙動データテーブル231について説明する。図5は、ホスト挙動データテーブルの一例の図である。動作情報記憶部23は、図5に示すようなホスト挙動データテーブル231のフォーマットを予め記憶している。そして、動作情報記憶部23は、後述するFCスイッチ1aの動作情報算出部17から、特定のSCSIコマンド及びエラー応答の組み合わせに対応するリトライ回数及びリトライ間隔の情報の入力を受ける。また、動作情報記憶部23は、動作情報算出部17から、特定のSCSIコマンドのコマンドタイムアウトに対応するリトライ回数及びリトライ間隔の情報の入力を受ける。そして、動作情報記憶部23は、記憶しているホスト挙動データテーブル231におけるSCSIコマンド及びエラーに対応付けて、入力されたリトライ回数及びリトライ間隔を記憶する。
記憶部25は、メモリやハードディスクなどの情報記憶媒体である。記憶部25には、ストレージ3に対するデータの書き込みや読み出しを行うアプリケーションなどが記憶されている。
また、記憶部25には、図3に示すTP(テストプログラム)200が予め記憶されている。TP200は、エラー応答及びコマンドタイムアウトに対するホスト2の動作情報の採取の実行をFCスイッチ1aのファームウェア161に指示する。
実行処理部24は、運用モードでは、記憶部25に記憶されているアプリケーションを実行する。実行処理部24は、アプリケーションの実行においてストレージ3とのデータの送受信が必要な場合、制御信号出力部21に対して所望のデータの送受信を行うための制御信号の出力を要求する。そして、実行処理部24は、要求したデータなどを含む応答をFCスイッチ1aのストレージ制御部19から受信する。
実行処理部24は、データ採取モードでは、図3に示すTP200を実行する。実行処理部24は、TP200を実行すると、制御信号出力部21に対して、FCスイッチ1aに対するデータ採取モードへの切り替え命令を出力するよう指示する。さらに、実行処理部24は、制御信号出力部21に対し、FCスイッチ1aが返答するエラー応答を指定又はコマンドタイムアウトの実行の命令を行う制御信号を出力するよう命令する。そして、エラー応答を受信する場合、実行処理部24は、1つのエラー応答に対するホスト2の動作のデータ採取がすべてのSCSIコマンドにおいて終了したという通知を制御信号出力部21から受ける。そして、実行処理部24は、制御信号出力部21に対し、ホスト2の動作のデータ採取を実施していない他のエラー応答の指定を出力するように命令する。そして、実行処理部24は、制御信号出力部21に対し、ホスト2の動作のデータ採取を実施していない他のエラー応答の指定を出力するように命令する。このようにして、実行処理部24は、ホスト2の動作のデータ採取を行うエラー応答を順次変更していき、すべてのエラー応答に対するホスト2の動作のデータ採取をFCスイッチ1aに実施させる。また、コマンドタイムアウトの場合、実行処理部24は、コマンドタイムアウトに対するホスト2の動作のデータ採取をすべてのSCSIコマンドについてFCスイッチ1aに実施させる。本実施例では、エラー応答に対するホスト2の動作のデータ採取として、各SCSIコマンドに対して、各エラーセンス、各SCSIステータス、及びコマンドタイムアウトにおけるホスト2の動作のデータ採取をそれぞれ実行する。
(動作情報の採取)
次に、図6、図7、及び図8を用いて各エラー応答でのホスト2の動作情報の採取について説明する。図6は、エラーセンスを用いた動作情報の採取を説明するためのシーケンス図である。図7は、SCSIステータスを用いた動作情報の採取を説明するためのシーケンス図である。図8は、コマンドタイムアウトを用いた動作情報の採取を説明するためのシーケンス図である。図6、図7、及び図8のいずれも、左の縦軸がホスト2の経時的な動作を表し、右の縦軸がFCスイッチ1aの経時的な動作を表す。それぞれの縦軸は下に向かって時間が経過していることを表している。
まず図6を用いて、エラーセンスでの動作情報の採取について説明する。最初に、制御信号出力部21が、応答するエラーセンスとして0x1/0x00/0x00の指定を含むデータ採取モードの開始命令を統括制御部40に送信する(ステップS101)。これに対して、統括制御部40は、命令受諾の信号を送信する(ステップS102)。すると、制御信号出力部21は、エラー応答出力部15に対して0x00のSCSIコマンドを送信する(ステップS103)。これに対し、エラー応答出力部15は、0x1/0x00/0x00のエラーセンスを送信する(ステップS104)。これを受けて、制御信号出力部21は、予め決められた再試行間隔が経過した後に、エラー応答出力部15に向けて再度0x00のSCSIコマンドを送信する(ステップS105)。これに対し、エラー応答出力部15は、0x1/0x00/0x00のエラーセンスを送信する(ステップS106)。制御信号出力部21は、このデータのやり取りを予め決められた繰り返し回数繰り返す。制御信号出力部21は、再試行回数の最後の0x00のSCSIコマンドの送信を行う(ステップS107)。これに対して、エラー応答出力部15は、0x1/0x00/0x00のエラーセンスを送信する(ステップS108)。そしてこの間、動作情報算出部17は、間隔601で表される時間をリトライ間隔として求める。さらに、動作情報算出部17は、間隔602の間に繰り返された0x00のSCSIコマンドの受信回数をリトライ回数として求める。制御信号出力部21は、動作情報算出部17に対して動作情報のデータの提出の要求(以下では、これを「データ採取要求」という。)を行う(ステップS109)。ここで、この制御信号出力部21のデータ採取要求は、実際には上述したように、統括制御部40に対して動作のデータ採取終了の通知を行うことで実行される。これを受けて、動作情報算出部17は、リトライ間隔及びリトライ回数を、SCSIコマンド0x00及びエラーセンス0x1/0x00/0x00と対応させて動作情報記憶部23に記憶させる(ステップS110)。
次に、同様にして、0x01のSCSIコマンドに対するホスト2の動作のデータ採取を開始する(ステップS111)。この時、動作情報算出部17は、0x00の場合と同様にして、間隔603を0x01のSCSIコマンドのリトライ間隔として取得する。また、動作情報算出部17は、間隔604の間に繰り返された0x01のSCSIコマンドの受信回数をリトライ回数として求める。このような各SCSIコマンドに対するホスト2の動作情報の採取を、0xffのSCSIコマンドまで順番に繰り返す。制御信号出力部21は、0xffのSCSIコマンドへの最後の0x1/0x00/0x00のエラーセンスの送信を行う(ステップS112)。
そして、0xffのSCSIコマンドまでの動作のデータ採取が終わると、実行処理部24は、統括制御部40に対してデータ採取モードの終了命令を送信する(ステップS113)。統括制御部40は、命令受諾の信号を送信する(ステップS114)。
以上では、0x1/0x00/0x00のエラーセンスを使用した動作情報の採取を説明したが、これと同様の処理を0x1/0x00/0x00から0xf/0xff/0xffまで繰り返す。これにより、すべてのSCSIコマンドに対するすべてのエラーセンスの応答におけるホスト2のリトライ間隔やリトライ回数などの動作情報を採取することができる。
次に、図7を用いて、SCSIステータスでの動作情報の採取について説明する。最初に、制御信号出力部21が、応答するSCSIステータスとして0x1の指定を含むデータ採取モードの開始命令を統括制御部40へ送信する(ステップS201)。これに対して、統括制御部40は、命令受諾の信号を送信する(ステップS202)。すると、制御信号出力部21は、エラー応答出力部15に対して0x00のSCSIコマンドを送信する(ステップS203)。これに対し、エラー応答出力部15は、0x1のSCSIステータスを送信する(ステップS204)。これを受けて、制御信号出力部21は、予め決められた再試行間隔が経過した後に、エラー応答出力部15に向けて再度0x00のSCSIコマンドを送信する(ステップS205)。これに対し、エラー応答出力部15は、0x1のSCSIステータスを送信する(ステップS206)。制御信号出力部21は、このデータのやり取りを予め決められた繰り返し回数繰り返す。制御信号出力部21は、繰り返し回数の最後の0x00のSCSIコマンドの送信を行う(ステップS207)。これに対して、エラー応答出力部15は、0x1のSCSIステータスを送信する(ステップS208)。そしてこの間、動作情報算出部17は、間隔701で表される時間をリトライ間隔として求める。さらに、動作情報算出部17は、間隔702の間に繰り返された0x00のSCSIコマンドの受信回数をリトライ回数として求める。制御信号出力部21は、動作情報算出部17に対してデータ採取要求を行う(ステップS209)。これを受けて、動作情報算出部17は、リトライ間隔及びリトライ回数を、SCSIコマンド0x00及びSCSIステータス0x1と対応させて動作情報記憶部23に記憶させる(ステップS210)。
次に、同様にして、0x01のSCSIコマンドに対するホスト2の動作のデータ採取を開始する(ステップS211)。この時0x00の場合と同様にして、間隔703が0x01のSCSIコマンドのリトライ間隔として取得される。また、間隔704の間に繰り返された0x01のSCSIコマンドの受信回数がリトライ回数として求められる。このような各SCSIコマンドに対するホスト2の動作情報の採取を、0xffのSCSIコマンドまで順番に繰り返す。制御信号出力部21は、0xffのSCSIコマンドへの最後の0x1のSCSIステータスを送信する(ステップS212)。
そして、0xffのSCSIコマンドまでの動作のデータ採取が終わると、実行処理部24は、統括制御部40に対してデータ採取モードの終了命令を送信する(ステップS213)。統括制御部40は、命令受諾の信号を送信する(ステップS214)。
以上では、0x1のSCSIステータスを使用した動作情報の採取を説明したが、これと同様の処理を0x1から0xfまで繰り返す。これにより、すべてのSCSIコマンドに対するすべてのSCSIステータスの応答におけるホスト2のリトライ間隔やリトライ回数などの動作情報を採取することができる。
次に、図8を用いて、コマンドタイムアウトでの動作情報の採取について説明する。最初に、制御信号出力部21が、エラー応答としてコマンドタイムアウトの指定を含むデータ採取モードの開始命令を統括制御部40へ送信する(ステップS301)。これに対して、統括制御部40は、命令受諾の信号を送信する(ステップS302)。すると、制御信号出力部21は、エラー応答出力部15に対して0x00のSCSIコマンドを送信する(ステップS303)。これに対し、エラー応答出力部15は、0x00のSCSIコマンドに対する応答を何も返さない。これを受けて、制御信号出力部21は、予め決められたコマンドタイムアウト時間が経過した後に、エラー応答出力部15に向けて再度0x00のSCSIコマンドを送信する(ステップS304)。これに対しても、エラー応答出力部15はエラー応答を何も返さない。制御信号出力部21は、このデータの送信を予め決められた繰り返し回数繰り返す。制御信号出力部21は、繰り返し回数の最後の0x00のSCSIコマンドの送信を行う(ステップS305)。そしてこの間、動作情報算出部17は、間隔801で表される時間をコマンドタイムアウト時間として求める。さらに、動作情報算出部17は、間隔802の間に繰り返された0x00のSCSIコマンドの受信回数をリトライ回数として求める。制御信号出力部21は、動作情報算出部17に対してデータ採取要求を行う(ステップS306)。この、データ採取要求とは、FCスイッチ1aが求めた、コマンドタイムアウト時間及びリトライ回数を一時的にホスト2に記憶しておくために、FCスイッチ1aからデータを送ってもらう要求である。これを受けて、動作情報算出部17は、コマンドタイムアウト時間及びリトライ回数を、SCSIコマンド0x00と対応させて動作情報記憶部23に記憶させる(ステップS307)。
次に、同様にして、0x01のSCSIコマンドに対するホスト2の動作のデータ採取を開始する(ステップS308)。この時0x00の場合と同様にして、動作情報算出部17は、間隔803を0x01のSCSIコマンドのリトライ間隔として取得する。また、動作情報算出部17は、間隔804の間に繰り返された0x01のSCSIコマンドの受信回数をリトライ回数として求める。このような各SCSIコマンドに対するホスト2の動作情報の採取を、0xffのSCSIコマンドまで順番に繰り返す。制御信号出力部21は、0xffのSCSIコマンドの送信を行う(ステップS309)。
そして、0xffのSCSIコマンドまでの動作のデータ採取が終わると、実行処理部24は、統括制御部40に対してデータ採取モードの終了命令を送信する(ステップS310)。統括制御部40は、命令受諾の信号を送信する(ステップS311)。
これにより、ホスト2は、すべてのSCSIコマンドに対するコマンドタイムアウトにおけるホスト2のコマンドタイムアウト時間やリトライ回数などの情報を一時的に保存するための採取を実行することができる。
(ファームウェアの設定変更)
さらに、図9を参照して、ファームウェア161の設定変更について説明する。図9は、ファームウェアの設定変更の動作を説明するためのシーケンス図である。
実行処理部24は、ホスト挙動データテーブル231が完成すると、動作設定部18に対しデータ反映の指示を送信する(ステップS401)。ここでは、ステップS401のタイミングの以前に、ホスト挙動データテーブル231に対して、すべてのSCSIコマンドに対する各エラー応答におけるホスト2のリトライ間隔やリトライ回数といった動作情報の登録が完成しているものとする。
動作設定部18は、動作情報記憶部23に記憶されているホスト挙動データテーブル231を基に、ファームウェア161におけるSCSIコマンドタイムアウト監視時間の設定、LAN障害時のパス切り替え監視時間の設定、及びエラーセンス内容の変換情報を更新する。動作設定部18は、ファームウェア161の設定が終了した旨の通知を実行処理部24へ送信する(ステップS402)。すなわち、ファームウェア161の更新はステップS401とステップS402との間で行われている。
さらに、動作設定部18によるファームウェア161の各種設定変更についてそれぞれ詳細に説明する。
まず、SCSIコマンドタイムアウト監視時間の設定について説明する。動作設定部18は、取得したホスト挙動データテーブル231から各SCSIコマンドに対するコマンドタイムアウト時間を抽出する。このコマンドタイムアウト時間はリトライ間隔の一種である。具体的には、コマンドタイムアウト時間は、あるSCSIコマンドを送信してから応答が返ってこないと判断した後に同じSCSIコマンドを再送信するまでの時間である。そして、動作設定部18は、その取得した各コマンドタイムアウト時間の中からコマンドタイムアウト時間の最小値を取得する。そして、動作設定部18は、取得したコマンドタイムアウト時間の最小値からマージン(本実施例では5秒)を引いた値を求める。ここで、マージンを取るのはコマンドタイムアウトまでの間にFCスイッチ1aが行う必要な終了処理を完了させるためである。すなわち、本実施例では5秒でFCスイッチ1aは必要な終了処理を完了させることができる。このマージンは動作設定部18が予め記憶している。
そして、求めた値がSCSIコマンドタイムアウト監視時間の基準値(本実施例では25秒)よりも小さい場合は、動作設定部18は、そのホスト2用のSCSIコマンドタイムアウト監視時間を求めた値に設定する。また、求めた値がSCSIコマンドタイムアウト監視時間の基準値以上の場合は、動作設定部18は、そのホスト2用のSCSIコマンドタイムアウト監視時間を基準値に設定する。この基準値は動作設定部18が予め記憶している値であり、当初はこの基準値がSCSIコマンドタイムアウト監視時間としていずれのSCSIコマンドにも用いられる。動作設定部18は、求めた各SCSIに対するSCSIコマンドタイムアウト監視時間をファームウェア161に設定する。
これにより、コマンドタイムアウト時間からマージンを取った値が基準値以上の場合には、基準値でコマンドタイムアウトと判断してもFCスイッチ1aは終了処理を完了することができるため問題がない。また、コマンドタイムアウト時間からマージンを取った値が基準値より小さい場合には、その求めた値でコマンドタイムアウトと判断するため、実際にコマンドタイムアウトが起こるまでにFCスイッチ1aは終了処理を完了することができる。
次に、LAN障害時のパス切り替え監視時間の設定について説明する。動作設定部18は、全てのホスト2における上述のように求めたSCSIコマンドタイムアウト監視時間のうち、最小値を有するSCSIコマンドタイムアウト監視時間の値を求める。
動作設定部18は、求めた値がSCSIコマンドタイムアウト監視時間の基準値(本実施例では25秒)と同じ値である場合は、LAN障害時のパス切り替え監視時間として基準値(本実施例では15秒)を設定する。この基準値は動作設定部18が予め記憶している。また、求めた値がSCSIコマンドタイムアウト監視時間の基準値よりも小さい場合は、動作設定部18は、SCSIコマンドタイムアウト監視時間からマージン(本実施例では10秒)を引いた値をLAN障害時のパス切り替え監視時間として設定する。ただし、設定する値は10秒を最小値とする。ここで、このマージンはFCスイッチ1aで切り替え処理を行うのに必要な時間である。すなわち本実施例では、FCスイッチ1aは10秒で切り替え処理を完了する。
これにより、コマンドタイムアウトが発生するよりも以前に、パス切り替えを行うことが可能となる。
次に、エラーセンスの変換情報の設定について説明する。動作設定部18は、すべてのエラーセンスのリトライ回数をチェックする。そして、動作設定部18は、リトライ回数が0回のエラーセンスを求める。ここで、リトライ回数が0回とは、1回エラーセンスが応答されただけでエラーと確定してしまう状態である。
動作設定部18は、求めたリトライ回数が0回のエラーセンスから1回の応答でエラーを確定してよいエラーセンス(本実施形態ではでは0x5)を除き、変換の対象となるエラーセンスを求める。このようにすることで、1回の応答でエラーが確定することが許されないエラーセンスを抽出できる。
ここで、センスキーとは、スラッシュで区切られたコードの中の先頭部分を指す。例えば、0x1/0x00/0x00であれば0x1の部分である。そして、動作設定部18は、変換の対象となるエラーセンスについて、センスキーを0x0から0xfまでのそれぞれに変換したエラーセンスを求める。そして、動作設定部18は、求めたエラーセンスでリトライ回数が最も多いエラーセンスを求め、そのエラーセンスのセンスキーを取得する。ここで、本実施形態では、リトライ回数を最大のリトライ回数とすれば十分なリトライ回数を満たせるため上述した構成にしたが、これは他のリトライ回数を選んでもよく、運用上の要求に合わせて設定することが好ましい。
そして、動作設定部18は、変換の対象となる各エラーセンスのセンスキーを、それぞれのエラーセンスに対応する取得したリトライ回数が最も多いエラーセンスのセンスキーへと変換するようにファームウェア161のエラーセンス内容の変換情報を設定する。
これにより、ホスト2から出力されたSCSIコマンドに対し、変換の対象となるエラーセンスが応答された場合、登録されたセンスキーに変換してホスト2に対して応答するように制御できる。すなわち、1回の応答でエラーが確定してしまう不具合を防ぐことができる。
(全体の動作の流れ)
次に、図10を参照してデータ採取モードにおけるファームウェア更新の動作、及び運用モードにおけるデータ送受信の動作を説明する。ここで、図10は、本実施例に係るスイッチを用いたストレージシステムにおける各動作モードの動作のフローチャートである。ここで、図10のフローチャートでは既に記憶部16にファームウェア161及びSCSIコマンドに応答するためのエラー応答が記憶されている。ここでは、説明を簡単にするためエラー応答を単に数値00〜ffで表す。また、SCSIコマンドは0x01から0xffまでのコマンドであるとする。
まず、実行処理部24は、操作者からの指示などにより、データ採取モードで動作するか否かを判断する。また、統括制御部40は、制御信号出力部21からのデータ採取モード起動の命令の有無により、データ採取モードか否かを判断する(ステップS501)。
データ採取モードの場合(ステップS501Yes)、実行処理部24は、SCSIコマンド0xMにおける値を初期値(M=01)とする(ステップS502)。さらに、実行処理部24は、指定するエラー応答Nの値を初期値(N=00)とする(ステップS503)。
制御信号出力部21は、Nがffより大きいか否かを判断する(ステップS504)。
Nがff以下の場合(ステップS504No)、制御信号出力部21は、統括制御部40にエラー応答Nを送信するよう要求する(ステップS505)。そして制御信号出力部21は、SCSIコマンド0xMをエラー応答出力部15に送信する(ステップS506)。エラー応答出力部15は、統括制御部40により指定されたエラー応答Nをエラー対処部22に送信する(ステップS507)。
エラー対処部22は、予め記憶している繰り返し回数を超えたかを判断する(ステップS508)。繰り返し回数を超えていない場合(ステップS508No)、ステップS506に戻る。繰り返し回数を超えている場合(ステップS508Yes)、動作情報算出部17は、SCSIコマンド0xMに対するエラー応答Nの場合のリトライ回数及びリトライ間隔を求める(ステップS509)。そして、動作情報算出部17は、求めたリトライ回数及びリトライ間隔をホスト2の動作情報記憶部23に記憶されているホスト挙動データテーブルに登録する(ステップS510)。そして、制御信号出力部21はN=N+1とする(ステップS511)。その後ステップS504に戻る。
一方、Nがffより大きい場合(ステップS504Yes)、実行処理部24はMがffより大きいかを判断する(ステップS512)。Mがff以下の場合(ステップS512No)は、実行処理部24はM=M+1とする(ステップS513)。また、Mがffより大きい場合(ステップS512Yes)、動作設定部18は、ホスト挙動データテーブル231を参照し、ホスト挙動データテーブルの情報に合わせてファームウェアを更新する(ステップS514)。
一方、動作モードがデータ採取モードでない、すなわち運用モードの場合(ステップS501No)、制御信号出力部21は、ストレージ制御部19に対し必要なSCSIコマンドを出力する(ステップS515)。ストレージ制御部19は、入力されたSCSIコマンドを処理するようにストレージ3を制御する(ステップS516)。そして、ストレージ制御部19はストレージ3からの応答を実行処理部24へ出力する(ステップS517)。
ここで、本実施例では、FCスイッチ1aの記憶容量を考慮し、各ホスト2のホスト挙動データテーブル231は一度各ホスト2に記憶させて、その各ホスト2に記憶させてあるホスト挙動データテーブル231を用いてファームウェア161の設定を行った。しかし、FCスイッチ1aの記憶容量が十分に確保できる場合には、各ホスト2のホスト挙動データテーブル231をすべてFCスイッチ1aで記憶し、それを基にファームウェア161の設定を行う構成にしても良い。
さらに、本実施例ではFCスイッチ1a及びFCスイッチ1bという2つのFCスイッチを配置してパス経路切り替えを行ったが、FCスイッチが1台のみの構成でもよい。ただし、FCスイッチが1台のみの場合には、ファームウェア161はLAN障害時のパス切り替え監視時間の設定を有さず、その設定を更新する必要がない。その場合には、ファームウェア161における、SCSIコマンドタイムアウト監視時間及びエラーセンス内容の変更情報を更新する構成となる。
また、本実施例では仮想化FCスイッチを例に説明したが、これは特に仮想化していない状態、すなわち通常のFCスイッチでも動作可能である。
上述してきたように、本実施例では、新規に接続する計算装置の動作情報を自動的に採取でき、障害発生時のホストの動作に合わせたFCスイッチの動作の設定が、操作者によるファームウェアの交換なしで自動的に設定できる。
また、本実施例においては、動作情報としてエラーセンスなどのエラー情報及びコマンドタイムアウトを通知する情報を用いているが、これはどちらか一方でも良い。エラー情報のみを用いた場合には、エラー情報の内容の変更の設定が行える。また、コマンドタイムアウトを通知する情報のみを用いた場合には、前記タイムアウトの監視時間の設定及び通信経路の切り替え監視時間のいずれか一方又は両方の設定を行なえる。
ただし、コマンドタイムアウトのみを用いる場合には、記憶部16にエラー応答を記憶しておく必要は無く、またエラー応答出力部15を設けなくても良い。エラー応答出力部15を設けない場合、動作情報算出部17は、制御信号出力部21からSCSIコマンドの入力を受けた後、制御信号出力部21から次のSCSIコマンドの入力があるまで待機すれば良い。そしてこの場合には、エラー応答以外の応答もFCスイッチ1aは出力しない。これは実施例1においても同様であり、その場合図1におけるエラー応答出力部11及び記憶部12を設けなくても良い。
このように、いずれか一つの設定を自動化するとしても、その設定に対しては、障害発生時のホストの動作に合わせたFCスイッチの動作の設定が、操作者によるファームウェアの交換なしで自動的に設定できる。
以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)自装置に接続された記憶装置を制御する制御信号に対して障害発生時に応答するためのエラー応答をエラー事象別に記憶する記憶部と、
前記制御信号の入力を受けて、前記記憶部に記憶されている各エラー応答を順次出力するエラー応答出力部と、
前記エラー応答出力部が出力した各エラー応答に対する自装置に接続された計算装置の動作を検出し、前記各エラー応答を受けたときの前記計算装置の動作を規定する条件を動作情報として求める動作情報算出部と、
前記動作情報を基に障害発生時の動作の設定を行う動作設定部と
を備えることを特徴とするスイッチ装置。
(付記2)前記動作情報算出部は、前記制御信号の入力に対する前記エラー応答出力部からのエラー応答がない場合の前記計算装置の動作を検出し、前記エラー応答を受けたときの計算装置の動作を規定する条件に加えて、前記エラー応答を受けないときの前記計算装置の動作を規定する条件を動作情報として求めることを特徴とする付記1に記載のスイッチ装置。
(付記3)前記エラー応答には、少なくともエラー情報を含み、
前記エラー応答出力部がエラー応答を出力した場合の前記動作情報には、少なくとも各前記エラー情報に対する再試行回数を含み、
前記動作設定部は、少なくとも前記エラー情報の内容の変更を行う
ことを特徴とする付記1及び付記2に記載のスイッチ装置。
(付記4)前記エラー応答出力部がエラー応答を出力しない場合の前記動作情報には、少なくとも前記各エラー応答を受けないときの前記計算装置の再試行回数を含み、
前記動作設定部は、少なくとも前記タイムアウトの監視時間の設定又は通信経路の切り替え監視時間の設定のいずれか一方を行うことを特徴とする付記2又は付記3に記載のスイッチ装置。
(付記5)前記動作設定部は、少なくとも前記タイムアウトの監視時間の設定、通信経路の切り替え監視時間の設定、及び前記エラー情報の内容の変更を行うことを特徴とする付記4に記載のスイッチ装置。
(付記6)自装置に接続された記憶装置を制御する制御信号の入力を受信して待機し、前記制御信号に対する応答がないことに対する前記計算装置の動作を検出し、前記制御信号に対する応答を受けないときの前記計算装置の動作を規定する条件を動作情報として求める動作情報算出部と、
前記動作情報を基に障害発生時の動作の設定を行う動作設定部と
を備えることを特徴とするスイッチ装置。
(付記7)自装置に接続された記憶装置を制御する制御信号に対して障害発生時に応答するためのエラー応答をエラー事象別に記憶する記憶ステップと、
前記制御信号の入力を受けて、前記記憶部に記憶されている各エラー応答を順次出力するエラー応答出力ステップと、
前記エラー応答出力ステップで出力された各エラー応答に対する自装置に接続された計算装置の動作を検出し、前記各エラー応答を受けたときの前記計算装置の動作を規定する条件を動作情報として求める動作情報算出ステップと、
前記動作情報を基に障害発生時の動作の設定を行う動作設定ステップと
を含むことを特徴とするスイッチ制御方法。
(付記8)計算装置、記憶装置、及びスイッチ装置を有し、前記計算装置は前記スイッチ装置を介して前記記憶装置に対してデータの読み書きを行うストレージシステムであって、
前記スイッチ装置は、
自装置に接続された記憶装置を制御する制御信号に対して障害発生時に応答するためのエラー応答をエラー事象別に記憶する記憶部と、
前記制御信号の入力を受けて、前記記憶部に記憶されている各エラー応答を順次出力するエラー応答出力部と、
前記エラー応答出力部が出力した各エラー応答に対する自装置に接続された計算装置の動作を検出し、前記各エラー応答を受けたときの前記計算装置の動作を規定する条件を動作情報として求める動作情報算出部と、
前記動作情報を基に障害発生時の動作の設定を行う動作設定部とを備え、
前記計算装置は、
前記スイッチ装置に前記制御信号を出力する制御信号出力部と、
前記制御信号出力部が出力した前記制御信号に対する前記スイッチ装置からの前記エラー応答を受けて、該エラー応答に対処する動作を実施するエラー対処部と
を備えることを特徴とするストレージシステム。
1a、1b FCスイッチ
2 ホスト
3 ストレージ
11 エラー応答出力部
12 記憶部
13 動作情報算出部
14 動作設定部
15 エラー応答出力部
16 記憶部
17 動作算出部
18 動作設定部
19 ストレージ制御部
21 制御信号出力部
22 エラー対処部
23 動作情報記憶部
24 実行処理部
25 記憶部
40 統括制御部

Claims (7)

  1. 自装置に接続された記憶装置を制御する制御信号に対して障害発生時に応答するためのエラー応答をエラー事象別に記憶する記憶部と、
    前記制御信号の入力を受けて、前記記憶部に記憶されている各エラー応答を順次出力するエラー応答出力部と、
    前記エラー応答出力部が出力した各エラー応答に対する自装置に接続された計算装置の動作を検出し、前記各エラー応答を受けたときの前記計算装置の動作を規定する条件を動作情報として求める動作情報算出部と、
    前記動作情報を基に障害発生時の動作の設定を行う動作設定部と
    を備えることを特徴とするスイッチ装置。
  2. 前記動作情報算出部は、前記制御信号の入力に対する前記エラー応答出力部からのエラー応答がない場合の前記計算装置の動作を検出し、前記エラー応答を受けたときの計算装置の動作を規定する条件に加えて、前記エラー応答を受けないときの前記計算装置の動作を規定する条件を動作情報として求めることを特徴とする請求項1に記載のスイッチ装置。
  3. 前記エラー応答には、少なくともエラー情報を含み、
    前記エラー応答出力部がエラー応答を出力した場合の前記動作情報には、少なくとも各前記エラー情報に対する再試行回数を含み、
    前記動作設定部は、少なくとも前記エラー情報の内容の変更を行う
    ことを特徴とする請求項1又は請求項2に記載のスイッチ装置。
  4. 前記エラー応答出力部がエラー応答を出力しない場合の前記動作情報には、少なくとも前記エラー応答を受けないときの前記計算装置の再試行回数を含み、
    前記動作設定部は、少なくとも前記タイムアウトの監視時間の設定又は通信経路の切り替え監視時間の設定のいずれか一方を行う
    ことを特徴とする請求項2又は請求項3に記載のスイッチ装置。
  5. 自装置に接続された記憶装置を制御する制御信号の入力を受信して待機し、前記制御信号に対する応答がないことに対する前記計算装置の動作を検出し、前記制御信号に対する応答を受けないときの前記計算装置の動作を規定する条件を動作情報として求める動作情報算出部と、
    前記動作情報を基に障害発生時の動作の設定を行う動作設定部と
    を備えることを特徴とするスイッチ装置。
  6. 自装置に接続された記憶装置を制御する制御信号に対して障害発生時に応答するためのエラー応答をエラー事象別に記憶する記憶ステップと、
    前記制御信号の入力を受けて、前記記憶部に記憶されている各エラー応答を順次出力するエラー応答出力ステップと、
    前記エラー応答出力ステップで出力された各エラー応答に対する自装置に接続された計算装置の動作を検出し、前記各エラー応答を受けたときの前記計算装置の動作を規定する条件を動作情報として求める動作情報算出ステップと、
    前記動作情報を基に障害発生時の動作の設定を行う動作設定ステップと
    を含むことを特徴とするスイッチ制御方法。
  7. 計算装置、記憶装置、及びスイッチ装置を有し、前記計算装置は前記スイッチ装置を介して前記記憶装置に対してデータの読み書きを行うストレージシステムであって、
    前記スイッチ装置は、
    自装置に接続された記憶装置を制御する制御信号に対して障害発生時に応答するためのエラー応答をエラー事象別に記憶する記憶部と、
    前記制御信号の入力を受けて、前記記憶部に記憶されている各エラー応答を順次出力するエラー応答出力部と、
    前記エラー応答出力部が出力した各エラー応答に対する自装置に接続された計算装置の動作を検出し、前記各エラー応答を受けたときの前記計算装置の動作を規定する条件を動作情報として求める動作情報算出部と、
    前記動作情報を基に障害発生時の動作の設定を行う動作設定部とを備え、
    前記計算装置は、
    前記スイッチ装置に前記制御信号を出力する制御信号出力部と、
    前記制御信号出力部が出力した前記制御信号に対する前記スイッチ装置からの前記エラー応答を受けて、該エラー応答に対処する動作を実施するエラー対処部と
    を備えることを特徴とするストレージシステム。
JP2010024538A 2010-02-05 2010-02-05 スイッチ装置、スイッチ制御方法、及びストレージシステム Expired - Fee Related JP5532987B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010024538A JP5532987B2 (ja) 2010-02-05 2010-02-05 スイッチ装置、スイッチ制御方法、及びストレージシステム
US13/020,868 US8504881B2 (en) 2010-02-05 2011-02-04 Switch device, switch control method and storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010024538A JP5532987B2 (ja) 2010-02-05 2010-02-05 スイッチ装置、スイッチ制御方法、及びストレージシステム

Publications (2)

Publication Number Publication Date
JP2011164777A true JP2011164777A (ja) 2011-08-25
JP5532987B2 JP5532987B2 (ja) 2014-06-25

Family

ID=44354610

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010024538A Expired - Fee Related JP5532987B2 (ja) 2010-02-05 2010-02-05 スイッチ装置、スイッチ制御方法、及びストレージシステム

Country Status (2)

Country Link
US (1) US8504881B2 (ja)
JP (1) JP5532987B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014182739A (ja) * 2013-03-21 2014-09-29 Nec Corp 通信制御システム、通信制御装置、通信制御方法、及びそのためのプログラム
JP2018156218A (ja) * 2017-03-16 2018-10-04 日本電気株式会社 パス切替装置、パス切替方法及びパス切替プログラム、並びに、コンピュータシステム
US10866862B2 (en) 2015-09-18 2020-12-15 Alibaba Group Holding Limited Method and apparatus for job operation retry

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013206001A (ja) * 2012-03-27 2013-10-07 Fujitsu Ltd 制御プログラム、制御方法および記憶装置
US10101945B1 (en) * 2013-05-29 2018-10-16 EMC IP Holding Company LLC Method and apparatus for enhancing command burst tolerance
US9716611B1 (en) * 2013-05-29 2017-07-25 EMC IP Holding Company LLC Method and apparatus for enhancing link anomaly tolerance in a SCSI system
JP2020067899A (ja) * 2018-10-25 2020-04-30 株式会社日立製作所 データ処理装置、データ処理方法、及びデータ処理プログラム
CN113590016A (zh) * 2020-04-30 2021-11-02 伊姆西Ip控股有限责任公司 用于管理存储盘的方法、电子设备和计算机程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003257130A (ja) * 2002-02-28 2003-09-12 Toshiba Corp Av用途のディスク記憶装置及び同装置におけるセクタエラー時の処理方法
JP2005051335A (ja) * 2003-07-30 2005-02-24 Hitachi Ltd パス切替えを提供するスイッチ
JP2005165556A (ja) * 2003-12-01 2005-06-23 Fujitsu Ltd 情報システム
JP2007122396A (ja) * 2005-10-27 2007-05-17 Hitachi Ltd ディスクアレイ装置及びその障害対応検証方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2793087B2 (ja) 1992-08-04 1998-09-03 株式会社ピーエフユー Scsi_i/f試験装置
JP2008071417A (ja) * 2006-09-14 2008-03-27 Fujitsu Ltd 記憶装置、制御方法及び制御回路
US8627163B2 (en) * 2008-03-25 2014-01-07 Micron Technology, Inc. Error-correction forced mode with M-sequence

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003257130A (ja) * 2002-02-28 2003-09-12 Toshiba Corp Av用途のディスク記憶装置及び同装置におけるセクタエラー時の処理方法
JP2005051335A (ja) * 2003-07-30 2005-02-24 Hitachi Ltd パス切替えを提供するスイッチ
JP2005165556A (ja) * 2003-12-01 2005-06-23 Fujitsu Ltd 情報システム
JP2007122396A (ja) * 2005-10-27 2007-05-17 Hitachi Ltd ディスクアレイ装置及びその障害対応検証方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014182739A (ja) * 2013-03-21 2014-09-29 Nec Corp 通信制御システム、通信制御装置、通信制御方法、及びそのためのプログラム
US10866862B2 (en) 2015-09-18 2020-12-15 Alibaba Group Holding Limited Method and apparatus for job operation retry
JP2018156218A (ja) * 2017-03-16 2018-10-04 日本電気株式会社 パス切替装置、パス切替方法及びパス切替プログラム、並びに、コンピュータシステム

Also Published As

Publication number Publication date
US8504881B2 (en) 2013-08-06
JP5532987B2 (ja) 2014-06-25
US20110197091A1 (en) 2011-08-11

Similar Documents

Publication Publication Date Title
JP5532987B2 (ja) スイッチ装置、スイッチ制御方法、及びストレージシステム
US8032793B2 (en) Method of controlling information processing system, information processing system, direct memory access control device and program
JP5463267B2 (ja) 仮想計算機システムおよび仮想計算機の移行方法
US8560878B2 (en) System and method for failure detection by a storage expander preceding an expander experiencing a failure
US7633856B2 (en) Multi-node system, internodal crossbar switch, node and medium embodying program
JP5090022B2 (ja) 計算機システム、アクセス制御方法及び管理計算機
EP2924556B1 (en) Information processing apparatus, storage system, and program
US20120233399A1 (en) Storage apparatus and method of controlling the same
JP2006178720A (ja) ストレージシステム
TWI512490B (zh) 擷取控制台訊息的系統及其方法及非暫態電腦可讀媒體
US8095820B2 (en) Storage system and control methods for the same
JP2009217475A (ja) ストレージシステム,ストレージ装置,ストレージシステムの制御方法および制御プログラム
JP6777848B2 (ja) 制御装置、及びストレージ装置
JP2004334535A (ja) ストレージシステムの制御方法、ストレージシステム、及びストレージ装置
TWI468931B (zh) 磁碟配置方法及伺服器機架系統
JP6810341B2 (ja) 管理装置、情報処理システムおよび管理プログラム
US8745448B2 (en) Storage system, storage control apparatus and method for failure recovery
WO2017081748A1 (ja) ストレージシステム、及び、ストレージ管理方法
JP2006344090A (ja) Sanディザスタリカバリシステム
JP2006031335A (ja) 情報処理システム及び方法
US9246848B2 (en) Relay apparatus, storage system, and method of controlling relay apparatus
JP5920114B2 (ja) ストレージ装置、ストレージ装置の制御方法及び制御プログラム
RU2602376C1 (ru) Устройство jbod, содержащее модуль bmc, и способ управления им
WO2024084776A1 (ja) 監視装置、管理装置、通信システム、および復旧方法
US11023337B2 (en) Information processing system and control apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121005

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131001

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140401

R150 Certificate of patent or registration of utility model

Ref document number: 5532987

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140414

LAPS Cancellation because of no payment of annual fees