JP2004213125A - 高可用ディスク制御装置とその障害処理方法及び高可用ディスクサブシステム - Google Patents

高可用ディスク制御装置とその障害処理方法及び高可用ディスクサブシステム Download PDF

Info

Publication number
JP2004213125A
JP2004213125A JP2002378956A JP2002378956A JP2004213125A JP 2004213125 A JP2004213125 A JP 2004213125A JP 2002378956 A JP2002378956 A JP 2002378956A JP 2002378956 A JP2002378956 A JP 2002378956A JP 2004213125 A JP2004213125 A JP 2004213125A
Authority
JP
Japan
Prior art keywords
cache memory
unit
disk
failure
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002378956A
Other languages
English (en)
Other versions
JP4107083B2 (ja
Inventor
Mutsumi Hosoya
睦 細谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2002378956A priority Critical patent/JP4107083B2/ja
Priority to US10/626,049 priority patent/US6970972B2/en
Publication of JP2004213125A publication Critical patent/JP2004213125A/ja
Application granted granted Critical
Publication of JP4107083B2 publication Critical patent/JP4107083B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • G06F11/2092Techniques of failing over between control units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1666Error detection or correction of the data by redundancy in hardware where the redundant component is memory or memory area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/557Error correction, e.g. fault recovery or fault tolerance

Abstract

【課題】ストレージ・システムの性能劣化や、ホスト・アプリケーションの動作不良を引き起こすことのない高可用性ディスク制御装置を提供する。
【解決手段】複数のホストインターフェース部及び複数のディスクインターフェース部とキャッシュメモリ部との間を、1つ以上のスイッチで構成されるスイッチ網を介して接続し、スイッチにスイッチ網内での経路を指定するためのフォワーディングテーブルと該テーブルを変更する変更手段を設け、また、ホストインターフェース部、ディスクインターフェース部及びキャッシュメモリ部に、スイッチ網内で一意に決まるローカルIDと該IDを変更する変更手段を設け、さらに複数のキャッシュメモリ部に、その障害発生の有無を監視するための障害監視機構と障害発生時に障害部位を回避するように前記スイッチ内のフォワーディングテーブルを制御するためのパス制御機構を設ける。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、データを複数の磁気ディスク装置に格納するディスクシステム装置の制御装置に関する。
【0002】
【従来の技術】
企業間の電子商取引や社会基盤としての金融システムなどでは、高度な信頼性が要求され、その根幹をなす基幹ストレージ・システムに対しても、極めて高い可用性が求められている。これら基幹ストレージ・システムでは、その可用性を高めるために、内部を冗長構成とし、障害発生時には自動的に故障個所を切り離して、正常な冗長部分で動作を継続するための自動障害回復機能を備えたディスク制御装置が広く使われている。
【0003】
例えば、図9に示した、従来より知られているディスク制御装置は、ホストコンピュータ60との間のデータ転送を実行する複数のホストインターフェース部1Xと、磁気ディスク装置70との間のデータ転送を実行する複数のディスクインターフェース部2Xと、磁気ディスク装置70のデータを一時的に格納するキャッシュメモリ部3Xと、ディスク制御装置104に関する制御情報(例えば、ホストインターフェース部1X及びディスクインターフェース部2Xとキャッシュメモリ部3Xとの間のデータ転送制御に関する情報、磁気ディスク装置70に格納するデータの管理情報)を格納するリソース管理部5Xとを備えている。
ホストインターフェース部1X及びディスクインターフェース部2Xとキャッシュメモリ部3Xとの間は、データインターフェース信号6により接続される。ホストインターフェース部1Xとキャッシュメモリ部3Xとの間、及び、ディスクインターフェース部2Xとキャッシュメモリ部3Xとの間の接続にスイッチ4Xを用いることもある。ホストインターフェース部1X及びディスクインターフェース部2Xとリソース管理部5Xとの間は、管理インターフェース信号7により接続される。リソース管理部5Xと、ホストインターフェース部1X, 及び、ディスクインターフェース部2Xとの接続は、スイッチを介しても、介さなくても良い。これにより、リソース管理部5Xおよびキャッシュメモリ部3Xは全てのホストインターフェース部1X及びディスクインターフェース部2Xからアクセス可能な構成となる。
【0004】
図12に示すように、ホストインターフェース部1Xは、ホストインターフェース信号1との入出力を処理するチャネルプロトコル処理部90、データインターフェース信号6との入出力を処理するための内部プロトコル処理部8X、管理インターフェース信号7との入出力を処理するためのプロセッサインターフェース17、及びホストコンピュータ60に対する入出力を制御するプロセッサ14とローカルメモリ15を有している。
ディスクインターフェース部2Xも、構造としては、ホストインターフェース部と同様であるが、ホストインターフェース信号1の代わりにディスクインターフェース信号2がチャネルプロトコル処理部90に接続され、プロセッサ14においては、ホストインターフェース部で行われる制御に加えて、RAID機能の実行も行う。
ホストインターフェース部1X、及び、ディスクインターフェース部2Xが、キャッシュメモリ部3Xと通信を行う場合、データの先頭に宛先アドレスを付加したパケットを使用してパケット転送を行う。
ホストインターフェース部1X、もしくは、ディスクインターフェース部2X内のプロセッサ14の制御で生成されたパケットは、データインターフェース信号6を介して、スイッチ4Xに送られる。スイッチ4Xは、図10で示したように、データインターフェース信号6に接続した複数のパスインターフェース41Xと、パケットバッファ43とアドレスラッチ44とセレクタ48を備えている。パスインターフェース41X内には、パケットからアドレス情報を取り出すヘッダ解析部42Xが含まれており、それによって解析抽出されたパケットアドレスがアドレスラッチ44に取り込まれる。一方、送られてきたパケットは、パスインターフェース41Xを通して、パケットバッファ43に格納される。アドレスラッチ44からは、パケット宛先に応じたセレクタ制御信号47が生成され、パケットバッファ43に格納されたパケットの送出先をセレクタ48によって切り換える。
【0005】
スイッチ4Xで、宛先ごとに振り分けられたパケットは、再び、データインターフェース信号6を介して、目的のキャッシュメモリ部3Xに転送される。キャッシュメモリ部3Xは、図11で示したように、データインターフェース信号6に接続した複数のデータパスインターフェース31Xと、パケットバッファ33と調停回路39とセレクタ38を備えている。データパスインターフェース31X内には、パケットからアドレス情報を取り出すヘッダ解析部32Xが含まれており、それによって解析抽出されたパケットアドレスは、調停回路39に取り込まれる。一方、送られてきたパケットは、パスインターフェース31Xを通して、パケットバッファ33に格納される。調停回路39は、複数のデータパスインターフェース31Xの中から、いずれかを選択し、その選択結果に応じたセレクタ制御信号を生成する。このセレクタ制御信号で、セレクタ38を切り換えることにより、所望のパケットバッファ33の内容をキャッシュメモリ37に、メモリ制御回路35を介して、書き込むことができる。パケットバッファ33に格納されたパケットがメモリ読み出しの要求であった場合、指定された領域のキャッシュメモリ37の内容を、上記と逆の経路をたどることによって、ホストインターフェース部1X、もしくは、ディスクインターフェース部2Xに返送する。
【0006】
ホストインターフェース部1X、及び、ディスクインターフェース部2Xが、リソース管理部5Xと通信を行う場合も、データインターフェース信号6の代わりに、管理インターフェース信号7が用いられる以外は、キャッシュメモリ部との通信と同様なパケット転送が行われる。リソース管理部5Xは、図11に示したキャッシュメモリ部と、インターフェース信号を除いて同等な構成になっている。
ここで、キャッシュメモリ部3X、及び、リソース管理部5Xは、複数のホストインターフェース部1X、ディスクインターフェース部2Xからアクセスされるシステム共通のリソースであり、その可用性がシステムの信頼性に大きな影響を与えるため、同等機能を複数備えた冗長構成となっており、たとえ、一方に障害が発生しても、残りの正常な部分で動作を継続できるように設計されている。具体的には、ホストインターフェース部1X、もしくは、ディスクインターフェース部2X内のいずれかのプロセッサ14が、複数あるキャッシュメモリ部3X、もしくは、リソース管理部5Xのいずれかの障害を検知した場合、障害を検知したプロセッサ制御で、障害部分を閉塞して残りのキャッシュメモリ部3X、もしくは、リソース管理部5Xに、その機能を引き継がせるとともに、他の全てのプロセッサ14に対して障害通知を行う。障害通知を受けた全てのプロセッサは、障害に伴うシステム構成・通信経路の変更処理をそれぞれ行うことによって、すべてのホストインターフェース部1Xとディスクインターフェース部2Xで、障害部分の切り離しを実現することが可能となる。
このように従来のディスク制御装置104では、キャッシュメモリ部3X、もしくは、リソース管理部5Xのような共通リソース障害に伴うシステム構成・通信経路の変更処理が、複数あるホストインターフェース1X、および、ディスクインターフェース2X内のプロセッサそれぞれで分散して行われていた。そのため、共通リソースの障害においては、分散配置されたプロセッサ間でのブロードキャスト通信を含む複雑な処理が必要であった。
【0007】
ディスク制御装置を高信頼化する別の従来例として、共有システムリソースとシステムリソース・クライアントとの間で可用性の高いネットワーク通信を提供する障害処理機構が提案されている(例えば、特許文献1参照。)。この従来例においても、さきに説明した従来例と同様、複数あるプロセッサごとに経路変更(ルーティングテーブル変更)を行う方式となっている。
【0008】
また、ディスク制御装置の高可用性を実現する別の従来例として、ホストコンピュータとディスクアレイサブセットとの間に配置して、両者の間のアドレス変換を行うスイッチを備えた記憶装置システムが提案されている(例えば、特許文献2参照。)。この従来例では、複数あるディスクアレイサブセットに障害が発生した場合、スイッチ内でパケットの解釈を行って障害部分への要求を同等の機能を有した冗長部分の宛先に変更することで、経路変更などの障害処理を行う方式となっている。
【特許文献1】
特開2002−41348号公報
【特許文献2】
特開2000−242434号公報
【0009】
【発明が解決しようとする課題】
キャッシュメモリ部、リソース管理部のような共通リソースの障害は、ストレージ・システム、ひいては、ホストコンピュータで実行されているアプリケーションの動作不良を引き起こすため、すみやかな回復処理が行われなければならない。しかし、図9、図10、図11、図12に示した従来技術では、すべてのホストインターフェース部1X、ディスクインターフェース部2Xにおいて経路変更が必要なため、障害処理に時間がかかり、ホストコンピュータとの間でのリード/ライトタスクの継続が行えずに、ストレージシステムの性能劣化やアプリケーション・プログラムの動作不良を引き起こす場合があった。また、この障害処理には、ホストインターフェース部1X、ディスクインターフェース部2Xに高機能プロセッサと複雑な制御プログラムが必要となり、製造コストの増大、信頼性の低下を招いていた。特許文献1に示した別の従来技術においても、複数あるプロセッサごとにルーティングテーブル変更を行う必要があり、同様の課題があった。
【0010】
また、特許文献2で開示されている別の従来技術では、パケット宛先変更機能を有するスイッチを導入することによって、複数あるディスクアレイ・サブセット間で機能を引き継がせる等の障害回避動作をスイッチ内処理のみで行うことが可能となる。しかし、その一方で、パケットごとに宛先の解釈が必要となり、障害発生時のみならず、通常動作時においても、処理に多くの時間を要し、ストレージシステムの性能劣化を招くという課題を有している。
【0011】
本発明の目的は、上記従来技術の欠点を改善し、障害発生時に、迅速かつ高信頼に障害処理を行い、かつ、通常動作時においても性能劣化を起こさない高可用のディスク制御装置、および、その障害処理方法を提供することにある。
より具体的には、本発明の目的は、システム共通リソースの障害時を含め、いかなる場合においても、ストレージ・システムの性能劣化や、ホスト・アプリケーションの動作不良を引き起こすことのない高可用性ディスク制御装置を提供することにある。
【0012】
【課題を解決するための手段】
上記目的を達成するため、本発明では、ホストコンピュータとのインターフェースを有する複数のホストインターフェース部と、磁気ディスク装置とのインターフェースを有する複数のディスクインターフェース部と、磁気ディスク装置に対しリード/ライトされるデータを一時的に格納するキャッシュメモリ部と、ホストインターフェース部及びディスクインターフェース部とキャッシュメモリ部との間のデータ転送に関する制御情報を格納するリソース管理部を有し、各ホストインターフェース部は、ホストコンピュータとのインターフェースとキャッシュメモリ部との間のデータ転送を実行し、各ディスクインターフェース部は、磁気ディスク装置とのインターフェースとキャッシュメモリ部との間のデータ転送を実行するディスク制御装置であって、
複数のホストインターフェース部とキャッシュメモリ部及び複数のディスクインターフェース部とキャッシュメモリ部との間が1つ以上のスイッチで構成されるスイッチ網を介して接続され、スイッチがスイッチ網内での経路を指定するためのフォワーディングテーブルと該テーブルを変更する変更手段を有し、また、ホストインターフェース部、ディスクインターフェース部及びキャッシュメモリ部が、スイッチ網内で一意に決まるローカルIDと該IDを変更する変更手段を有し、さらに複数のキャッシュメモリ部が、その障害発生の有無を相互に監視するための障害監視機構と障害発生時に障害部位を回避するように前記スイッチ内のフォワーディングテーブルを制御するためのパス制御機構を有するディスク制御装置を提供する。
【0013】
【発明の実施の形態】
以下、大容量のデ−タの記憶装置として磁気ディスク装置を例にとって説明するが、大容量記憶装置として磁気ディスクに限られるものではなく、例えばDVDのような大容量記憶装置であって良い。
本発明の実施の形態の1つとして、好ましくは、前記複数のホストインターフェース部と前記キャッシュメモリ部との間、及び前記複数のディスクインターフェース部と前記キャッシュメモリ部との間を、1つ以上のスイッチで構成されるスイッチ網を介して接続し、スイッチにスイッチ網内での経路を指定するためのフォワーディングテーブルと該テーブルを変更する変更手段を設け、また、ホストインターフェース部、ディスクインターフェース部及びキャッシュメモリ部に、スイッチ網内で一意に決まるローカルIDと該IDを変更する変更手段を設け、さらに複数のキャッシュメモリ部に、その障害発生の有無を監視するための障害監視機構と障害発生時に障害部位を回避するように前記スイッチ内のフォワーディングテーブルを制御するためのパス制御機構を設ける。
また、好ましくは、前記複数のホストインターフェース部、前記複数のディスクインターフェース部、前記キャッシュメモリ部、前記リソース管理部との間を1つ以上のスイッチで構成されるスイッチ網を介して接続し、スイッチにスイッチ網内での経路を指定するためのフォワーディングテーブルと該テーブルを変更する変更手段を設け、また、ホストインターフェース部、ディスクインターフェース部及びキャッシュメモリ部に、スイッチ網内で一意に決まるローカルIDと該IDを変更する変更手段を設け、さらに複数のキャッシュメモリ部に、その障害発生の有無を監視するための障害監視機構と障害発生時に障害部位を回避するように前記スイッチ内のフォワーディングテーブルを制御するためのパス制御機構を設ける。
また、好ましくは、前記リソース管理部に、前記キャッシュメモリ部、もしくは、前記リソース管理部の障害を監視するための障害監視機構を設ける。
【0014】
また、好ましくは、前記ホストインターフェース部及び前記ディスクインターフェース部に前記キャッシュメモリ部、もしくは、前記リソース管理部の障害監視機構に対して障害を報告する機能を設ける。
また、好ましくは、前記リソース管理部に、前記キャッシュメモリ部の障害を処理するためのパス制御機構を設ける。
その他、本願が開示する課題、及びその解決方法は、発明の実施形態の欄及び図面により明らかにされる。
【0015】
以下、本発明の実施例を図面を用いて説明する。
《実施例1》
図1、図2、図6、図7、及び図8に、本発明の一実施例を示す。
図2に示したディスク制御装置100は、ホストコンピュータ60とのインターフェース部(ホストインターフェース部)10と、磁気ディスク装置70とのインターフェース部(ディスクインターフェース部)20と、キャッシュメモリ部30、スイッチ40、リソース管理部50を有し、ホストインターフェース部10及びディスクインターフェース部20と、キャッシュメモリ部30及びリソース管理部50との間は、スイッチ40を介して、内部インターフェース信号4で接続されている。すなわち、内部インターフェース信号4を介して、全てのホストインターフェース部10、全てのディスクインターフェース部20から、全てのキャッシュメモリ部30、あるいはリソース管理部50へアクセス可能な構成となっている。
【0016】
図8に示すように、ホストインターフェース部10は、ホストインターフェース信号1との入出力を処理するチャネルプロトコル処理部90、データインターフェース信号との入出力を処理するための内部プロトコル処理部80を有し、ホストコンピュータ60とキャッシュメモリ部30間のデータの転送、及びリソース管理部50との間の制御情報の転送を実行する。
ディスクインターフェース部20も、構造としては、ホストインターフェース部と同様であるが、ホストインターフェース信号1の代わりにディスクインターフェース信号2を有し、磁気ディスク装置70とキャッシュメモリ部30間のデータの転送、及びリソース管理部50との間の制御情報の転送を実行する。
キャッシュメモリ部30は、図7に示すように、内部インターフェース信号4との入出力処理を行う内部プロトコル処理部80とプロセッサ36とキャッシュメモリ37とメモリ制御回路35とDMAエンジン34を有し、磁気ディスク装置70へ記録するデータや磁気ディスク装置から読み出したデータを一時的に格納する。
【0017】
リソース管理部50も、キャッシュメモリ部30と同等の構成を有し、システム構成などの管理制御情報を維持する。
【0018】
スイッチ40は、図6に示すように、内部インターフェース信号4に接続した複数のパスインターフェース41と、パケットバッファ43とアドレスラッチ44とセレクタ48を備え、ホストインターフェース部10およびディスクインターフェース部20と、キャッシュメモリ部30およびリソース管理部40との間の経路接続を行う。
なお、可用性向上のために、ホストインタフェース部10、ディスクインターフェース部20、キャッシュメモリ部30、リソース管理部50を、それぞれ複数のポートを有する構成とし、スイッチ40との間にそれぞれ複数の転送経路を設けることも出来る。
【0019】
ホストインターフェース部10、ディスクインターフェース部20、キャッシュメモリ部30、リソース管理部50の内部プロトコル処理部80には、内部インターフェース信号4の接続しているスイッチ網内での宛先を一意に特定するためのローカルID(LID)を保持するLID情報81が備わっている。
【0020】
一方、スイッチ40内には、ポート番号(パスインターフェース41の位置)とLIDとの対応関係を示すフォワーディング・テーブル46が備わっている。フォワーディング・テーブル46の例を、図1(1)に示す。この例では、2つのホストインターフェース10と2つのディスクインターフェース20が2つのスイッチ40A、40Bを介して、2つのキャッシュメモリ(共通リソース)30A、30Bに接続している。ホストインターフェース10、ディスクインターフェース20、キャッシュメモリ30A、30Bはそれぞれ2つずつの内部インターフェース信号とそれに対応したローカルID(LID)情報を持っている。スイッチ40A、40Bは、それぞれ8つのポート(パスインターフェース41)とそれに対応したポート番号を持っている。フォワーディング・テーブル46とは、このLIDとポート番号との対応表であって、例えば、スイッチ46Aのフォワーディング・テーブルAでは、LID▲1▼、▲3▼、▲5▼、▲7▼、▲9▼、(11)が、それぞれポートa、b、c、d、e、fと接続していることを示している。このフォワーディング・テーブルを参照することにより、パケット宛先(LID)によって、どのポートに送出すればよいかがわかる。
【0021】
内部インターフェース信号の接続しているスイッチ網は、例えば、キャッシュメモリ部30内のプロセッサ36で実行されるネットワーク管理プログラムによって、維持管理されている。ネットワーク内のLID情報81やスイッチ内のフォワーディング・テーブル46は、内部インターフェース信号4を介して、ネットワーク管理プログラムにより、設定更新される。
本発明のディスク制御装置における通常動作の一例として、図2、図6、図7、図8を用い、ホストコンピュータ60からディスク制御装置100を介して磁気ディスク装置70へ読み出し要求を発行する場合の動作について説明する。
まず、ホストコンピュータ60は、自身が接続されているホストインターフェース部10にデータの読出し要求を発行する。 要求を受けたホストインターフェース部10は、リソース管理部50にアクセスし、要求されたデータがどの磁気ディスク装置70内に格納されており、当該磁気ディスクがどのキャッシュメモリ部30に制御されているかを調べる。リソース管理部50には、要求データのアドレスからこれらの情報を検索するためのテーブルが格納されており、要求されたデータをもとに管轄のキャッシュメモリ部を調べることができる。次に、要求を受けたホストインターフェース部10では、要求データを管理しているキャッシュメモリ部30に、読み出し要求を転送する。キャッシュメモリ部30は、キャッシュメモリ37に要求されたデータが格納されているかどうかを確認する。キャッシュメモリ部30内にデータが存在しなかった場合、プロセッサ36は、要求データを磁気ディスク装置70から読出し、キャッシュメモリ37に格納する。キャッシュメモリ部30は、キャッシュメモリ37内に格納された要求データを、ホストインターフェース部10まで転送し、ホストコンピュータ60に送る。
ホストインターフェース部10及びディスクインターフェース部20がキャッシュメモリ部30、及びリソース管理部50とスイッチ40を介して通信する場合、パケット宛先にLID情報を用い、スイッチでの経路変更にフォワーディング・テーブル46を使用する。
例えば、ホストコンピュータ60からの読み出し要求を、スイッチ40を介して、キャッシュメモリ部30に転送する場合、ホストインターフェース部10では、ホストインターフェース信号1を、チャネルプロトコル処理部90と内部プロトコル処理部80を介して、内部インターフェース信号4に変換する。その際、読み出し要求パケットの宛先には、送り先のキャッシュメモリ部のLIDを設定する。ホストインターフェース部からの要求パケットを受けたスイッチ40では、経路変更手段45内のフォワーディング・テーブル46に従い、ヘッダ解析部42で抽出されたパケット宛先に応じたセレクタ制御信号47を生成し、パケットバッファ43に格納されたパケットの送出先をセレクタ48によって切り換えて、所望のキャッシュメモリ部30に向けてパケットを転送する(図16)。
【0022】
ディスクインターフェース部20が、キャッシュメモリ部と通信を行う場合、もしくは、ホストインターフェース部10、及び、ディスクインターフェース部20が、リソース管理部50と通信を行う場合も、ホストインターフェース部とキャッシュメモリ部との間の通信と同様なパケット転送が行われる。
なお、リソース管理部50と、ホストインターフェース部10およびディスクインターフェース部20との接続に使われているスイッチ40を含んだスイッチ網は、キャッシュメモリ部30とホストインターフェース部10およびディスクインターフェース部20との接続に使われているスイッチ網と同じであっても、別の専用ネットワークであっても良い(図17)。また、スイッチ40を使わずに、直接接続する形態であっても構わない。
次に、本発明のディスク制御装置の特徴である障害回復動作の一例として、図1、図2を用い、2つのキャッシュメモリ部30間での障害監視機構とパス制御機構の動作について説明する。
キャッシュメモリ部30は、その可用性向上のため、同等機能を有するマスタとスレーブの2つのキャッシュメモリ部を有している。スレーブキャッシュメモリは、マスタキャッシュメモリに障害が発生した際に、その機能を引き継ぐためのもので、ホットスタンバイで動作している。これらマスタ・キャッシュメモリ部とスレーブ・キャッシュメモリ部は、スイッチ40を介して、相互にその動作を確認するための障害監視機構Cを有している。すなわち、一定間隔ごとに自分の動作状況を報告するパケットを生成し、お互い相手の動作状態を監視することができる。その動作の概要を図13に示す。障害監視機構では通信が行われる度に、正常なシーケンスとACKがチェックされ、異常が発見された場合には、主経路もしくは副経路を介して、パス制御機構に障害通知を行う。図2に示した構成では、マスタおよびスレーブキャッシュメモリ部が、それぞれパス制御機構を有しているので、そのいずれかのキャッシュメモリ部に異常が発生した場合、その障害情報は、ただちにもう一方のキャッシュメモリ部で検知することができる。障害を検知したキャッシュメモリ部では、障害を起こしているキャッシュメモリ部を閉塞するとともに、内部に備えたパス制御機構Pによって、システム構成を変更し、ホストインターフェース部10およびディスクインターフェース部20が、障害キャッシュメモリ部にアクセスしないように制御する。
以下、パス制御機構Pの仕組みを、図14を使って説明する。障害監視機構から障害通知を受けたパス制御機構は、その通知の妥当性を確認した後、可用性向上のため複数個設けてあるパス制御機構間で、障害情報の同期化を行う。その後、障害解析を行い、現時点で障害特定が可能かどうか判断する。特定が出来ない場合、特定可能になるまで障害処理を遅延させる。特定可能になった場合、障害通知情報によりアクセス障害なのか機能障害なのかを判断し、機能障害の場合、障害部位を含んだ冗長部位間で、処理途中のJOBなどの同期化処理を試みる。その後、障害部位に対するアクセス・パスを冗長部位に振り替える交替パス処理を行う。図1で具体的に説明すると、マスタキャッシュメモリ部で機能障害が発生しスレーブキャッシュメモリ部にフェールオーバする場合は、以下のようになる。障害のない正常動作状態における、ホストインターフェース部10、ディスクインターフェース部20、キャッシュメモリ部30A、30B、スイッチ40A、40BのLIDとフォワーディング・テーブルの値は、図1(1)に示した通りである。ここで、マスタ・キャッシュメモリ部30Aに障害が発生し、スレーブ・キャッシュメモリ部30Bの障害監視機構によって、当該障害が検出された場合、30Bのパス制御機構Pにより、30Aの機能を30Bが引き継ぐとともに、30A宛のパケットを30Bに振り替える制御を行う。すなわち、30Aの2つのLID(▲9▼、(10))と30Bの2つのLID((11)、(12))とを交換し、それに対応して、フォワーディング・テーブル46Aと46Bを変更する。その結果、LIDとフォワーディングテーブルは図1(2)のようになり、30Aへのアクセスは、すべて30Bに振り向けられて、障害部位30Aのシステムからの切り離しが完了する。30Aの動作を30Bが引き継ぐには、30Aと30Bの内容が一致している必要があるが、それらは、通常の同期動作により実現される。すなわち、常に30Aと30Bが同じ内容になるよう、両方に対して同じアクセス要求を発生させる方法や、定期的に両者でデータをコピーする方法が考えられる。
なお、リソース管理部50も同様の障害監視機構Cとパス制御機構Pを備え、同様の手順で障害回復動作を行うことができる。これら障害監視機構やパス制御機構は、キャッシュメモリ部30、もしくは、リソース管理部50内のプロセッサ36によって実行される制御プログラムとして実現することができる。また、本実施例では、リソース管理部50を独立に設けた構成としているが、リソース管理部をキャッシュメモリ部30の中に設けることもできる。また、図1で、スレ‐ブキャッシュメモリ部内のLIDとマスタキャッシュメモリ部内のLIDを交換するのではなく、スレーブ側でマスタ側のLIDを追加して持つようにすることも可能である。その場合、障害前のスレーブ側LIDが障害後も有効になるというメリットがある。
【0023】
本実施例によれば、キャッシュメモリ部30もしくはリソース管理部50の障害に対して、スイッチ40のフォワーディング・テーブルとキャッシュメモリ部30もしくはリソース管理部50のLIDの変更のみで、障害部位の切り離しが完了し、従来技術のように、複数のホストインターフェース部10及びディスクインターフェース部20の間でのブロードキャスト通信や複雑な制御は不要である。そのため、障害発生時においても、迅速、かつ、高信頼な障害回復処理を実現することができ、ストレージシステムの性能劣化や、ホストコンピュータ上のアプリケーション動作不良を引き起こすことがない。
また、本実施例のスイッチ内フォワーディング・テーブルは、障害発生時にのみ変更されものであって、従来技術のように、通信を行うたびにパケットの宛先の解釈や変更が行われる複雑なスイッチを必要としない。そのため、障害のない通常の動作においての性能劣化は皆無で、かつ、低コストで高信頼に製造することが可能である。
【0024】
《実施例2》
図3に、本発明の他の実施例を示す。
図3に示した実施例は、キャッシュメモリ部30、及び、リソース管理部50が、それぞれ障害通知のための専用線であるハートビート信号3を備えていることと、内部インターフェース信号のスイッチ網が多段のスイッチ40で構成されていることを除いて、実施例1の図2に示す構成と同様である。ただし、キャッシュメモリ部30は、障害監視機構Cのみを備え、パス制御機構は実装されていない。リソース管理部50は、障害監視機構C、パス制御機構Pともに備えている。
キャッシュメモリ部、および、リソース管理部は、マスタとスレーブにより冗長構成を形成しており、基本的には同じデータ内容を保持している。ただし、キャッシュメモリ部におけるディスクからの読み出しデータについては、マスタとスレーブ間で同一の内容を保持していなくても構わない。
障害が発生した場合の処理は、基本的に、実施例1と同様であるが、その概要を図18で簡単に説明する。マスタ/スレーブ キャッシュメモリ部、および、マスタ/スレーブリソース管理部は、障害監視機構により、相互に障害発生の有無について定期的な確認を行っている。障害監視機構によって発見された障害は、リソース管理部のパス制御機構に通知される。パス制御機構では、通知された障害情報の解析を行い、障害部位の特定を行う。パス制御機構では、障害部位が特定できれば、スイッチ内にあるフォワーディングテーブルを制御することで、障害部位を回避するようにパスの設定を行うことで、障害部位の切り離しが完了する。
本実施例では、専用のハートビート信号3を設けることにより、相互にその動作を確認するための障害監視機構Cを、実施例1より単純な構成で実現することができる。すなわち、ハートビート信号3を通して、お互いの動作状況を、直接、監視することができる。そのため、マスタ、もしくは、スレーブのいずれかのキャッシュメモリ部、もしくはリソース管理部に異常が発生した場合、その障害情報は、より迅速にもう一方のキャッシュメモリ部、もしくは、リソース管理部で検知することができる。
また、本実施例では、キャッシュメモリ部30内で検出された障害情報が、スイッチ40を介して(マスタ)リソース管理部50のパス制御機構Pに通知され、リソース管理部内のパス制御機構Pによってキャッシュメモリ部30の障害回復処理が行われる。これにより、障害情報をリソース管理部50に集めて、より適切な障害回復処理を行うことが可能となる。
また、本実施例では、ホストインターフェース側とディスクインターフェース側でスイッチを分離することにより、ホスト側とディスク側で柔軟な接続数変更が可能になるとともに、より大規模な構成への対応が可能となる。
【0025】
本実施例によれば、前述の実施例と同様、迅速、かつ、高信頼な障害回復処理を実現することができ、ストレージシステムの性能劣化や、ホストコンピュータ上のアプリケーション動作不良を引き起こすことがなく、また、障害のない通常の動作においての性能劣化は皆無で、かつ、低コストで高信頼に製造することが可能である。
【0026】
《実施例3》
図4に、本発明の他の実施例を示す。
図4に示した実施例は、キャッシュメモリ部30、及び、リソース管理部50が、ハートビート信号3を備えていないことと、内部インターフェース信号のスイッチ網が冗長構成になっていることを除いて、実施例2の図3に示す構成と同様である。ただし、キャッシュメモリ部30は、障害監視機構Cとパス制御機構を実装していない。リソース管理部50は、障害監視機構C、パス制御機構Pともに備えている。
本実施例では、キャッシュメモリ部30の障害監視も、リソース管理部50内の障害監視機構Cを用いて行う。その実現方法としては、リソース管理部の障害監視機構Cが、定期的にキャッシュメモリ部30へアクセスを行い、キャッシュメモリ部の動作状況を監視する方法や、ホストインターフェース部10およびディスクインターフェース部20からキャッシュメモリ部30へアクセスした際に障害が検出された場合、その障害情報をリソース管理部に報告する方法などが考えられる。また、本実施例では、各ホストインターフェース部、各ディスクインターフェース部に複数のポートを設け、スイッチも2重化することにより、ホストインターフェース部、および、ディスクインターフェース部とキャッシュメモリ部、もしくは、リソース管理部との間に複数のパスを設けてある。
これにより、リソース管理部、キャッシュメモリ部の機能障害だけでなく、リソース管理部、もしくは、キャッシュメモリ部とホストインターフェース部およびディスクインターフェース部との間のパス障害についても、障害回復を行えることになり、可用性をさらに高めることができる。
また、リソース管理部50に、障害監視機構とパス制御機構を集めることにより、より障害状況の的確な分析が行えることになり、適切かつ高信頼の障害回復処理が可能となる。
【0027】
本実施例によれば、前述の実施例と同様、迅速、かつ、高信頼な障害回復処理を実現することができ、ストレージシステムの性能劣化や、ホストコンピュータ上のアプリケーション動作不良を引き起こすことがなく、また、障害のない通常の動作においての性能劣化は皆無で、かつ、低コストで高信頼に製造することが可能である。
【0028】
《実施例4》
図5に、本発明の他の実施例を示す。
図5に示した実施例は、キャッシュメモリ部30、及び、リソース管理部50が、ハートビート信号3を備えていないことと、複数のディスク制御サブユニット200を備えることを除いて、実施例2の図3に示す構成と同様である。複数のディスク制御サブユニット内のキャッシュメモリ部それぞれが、障害監視機構Cを備えている。リソース管理部50は、障害監視機構C、パス制御機構Pともに備えている。
本実施例では、ディスク制御サブユニット200ごとに、キャッシュを分散配置することで、キャッシュの使用効率(ヒット率)を高めて性能を向上するとともに、ホスト側とディスク側で柔軟にシステム規模を拡張することが可能となり、より高スケーラブルなシステムの提供が可能となる。
また、本実施例では、実施例2と同様、キャッシュメモリ部30の障害に伴う障害回復処理も、リソース管理部50内のパス制御機構Pを用いて行う。実施例2、3と同様、リソース管理部50に、障害情報を集めることにより、より障害状況の的確な分析が行えることになり、ディスク制御サブユニット200の個数を増加させた、より大規模なディスク制御装置においても、適切かつ高信頼な障害回復処理が可能となる。
【0029】
本実施例によれば、前述の実施例と同様、迅速、かつ、高信頼な障害回復処理を実現することができ、ストレージシステムの性能劣化や、ホストコンピュータ上のアプリケーション動作不良を引き起こすことがなく、また、障害のない通常の動作においての性能劣化は皆無で、かつ、低コストで高信頼に製造することが可能である。
【0030】
《実施例5》
図15に、本発明の他の実施例を示す。
図15に示した実施例では、実施例1−4で記載のディスク制御装置が、複数のホストコンピュータとホストコンピュータ間ネットワークを介して接続し、複数の磁気ディスク装置と磁気ディスク装置間ネットワークを介して接続している。ホストコンピュータ間ネットワークには、ファイルシステムの処理を行うサーバ110(NASヘッド)、複数のディスク制御装置が管轄するストレージをまとめて管理するためのサーバ120(ディスク制御装置間仮想化エンジン)、データベース・インターフェース処理を行うためのサーバ130(DB機能付加エンジン)などが接続されることもある。これら、NASヘッド、仮想化エンジン、DB機能付加エンジンは、ディスク制御装置の中に実装しても構わない。
【0031】
本実施例によれば、迅速、かつ、高信頼な障害回復処理を行えるディスク制御装置を用いることにより、極めて可用性が高く、性能劣化や、ホストコンピュータ上のアプリケーション動作不良を引き起こすことのない、ストレージシステムの提供が可能となる。
【0032】
【発明の効果】
以上説明したように、本発明では、キャッシュメモリ部30もしくはリソース管理部50の障害に対して、スイッチ40のフォワーディング・テーブルとキャッシュメモリ部30もしくはリソース管理部50のLIDの変更のみで、障害部位の切り離しが完了し、従来技術のように、複数のホストインターフェース部10及びディスクインターフェース部20の間でのブロードキャスト通信や複雑な制御は不要である。そのため、障害発生時においても、迅速、かつ、高信頼な障害回復処理を実現することができ、ストレージシステムの性能劣化や、ホストコンピュータ上のアプリケーション動作不良を引き起こすことがない。
また、本発明において、スイッチ内フォワーディング・テーブルは、障害発生時にのみ変更されものであって、従来技術のように、通信を行うたびにパケットの宛先の解釈や変更が行われる複雑なスイッチを必要としない。そのため、障害のない通常の動作においての性能劣化は皆無で、かつ、低コストで高信頼に製造することが可能である。
【0033】
本発明では、障害監視機構による障害発生通知を、パス制御機構で解析し、フォワーディングテーブルを制御するので、柔軟なシステム構成に対応可能である。とくに、複数のディスク制御サブユニットが存在する大規模なディスク制御装置の場合でも、複数の障害監視機構からの障害情報をパス制御機構に集めることにより、より障害状況の的確な分析が行え、高信頼な障害回復処理が可能となる
【図面の簡単な説明】
【図1】本発明によるディスク制御装置における障害回復処理の動作原理を示す図である。
【図2】本発明によるディスク制御装置の構成を示す図である。
【図3】本発明によるディスク制御装置の構成を示す図である。
【図4】本発明によるディスク制御装置の構成を示す図である。
【図5】本発明によるディスク制御装置の構成を示す図である。
【図6】本発明によるディスク制御装置内のスイッチの構成を示す図である。
【図7】本発明によるディスク制御装置内のキャッシュメモリ部の構成を示す図である。
【図8】本発明によるディスク制御装置内のホストインターフェース部の構成を示す図である。
【図9】従来のディスク制御装置の構成を示す図である。
【図10】従来のディスク制御装置内のスイッチの構成を示す図である。
【図11】従来のディスク制御装置内のキャッシュメモリ部の構成を示す図である。
【図12】従来のディスク制御装置内のホストインターフェース部の構成を示す図である。
【図13】本発明の障害監視機構の動作を示す図である。
【図14】本発明のパス制御機構の動作を示す図である。
【図15】本発明のディスク制御装置を用いたストレージシステムの例を示す図である。
【図16】本発明のディスク制御装置においてホストコンピュータからキャッシュメモリ部へのコマンド送信の概要を示す図である。
【図17】本発明のディスク制御装置の構成を示す図である。
【図18】本発明のディスク制御装置の障害処理の概要を示す図である。
【符号の説明】
1 ホストインターフェース信号
2 ディスクインターフェース信号
3、5 ハートビート信号
4 内部インターフェース信号
6 データインターフェース信号
7 管理インターフェース信号
10、1X ホストインターフェース部
11 DMAエンジン
12 送信データインターフェース
13 受信データインターフェース
14 プロトコル制御プロセッサ
15 ローカルメモリ
16 バスインターフェース
17 プロセッサインターフェース
20、2X ディスクインターフェース部
30、30A、30B、3X キャッシュメモリ部
31X データパスインターフェース
32X ヘッダ解析部
33 パケットバッファ
34 DMAエンジン
35 メモリ制御回路
36 プロセッサ
37 キャッシュメモリ
38 セレクタ
39 調停回路
40、40A、40B、4X スイッチ
41 パスインターフェース(PORT)
41X データパスインターフェース
42、42X ヘッダ解析部
43 パケットバッファ
44 アドレスラッチ
45 経路変更手段
46、46A、46B フォワーディング・テーブル
47 セレクタ制御信号
48 セレクタ
50 リソース管理部
60 ホストコンピュータ
70 磁気ディスク装置
80、8X 内部プロトコル処理部
81 ローカルID情報(LID)
82 送信PHY
83 受信PHY
84 プロトコル制御プロセッサ
85 ローカルメモリ
86 バッファ
87 リンク処理
88 ヘッダ制御
90 チャネルプロトコル処理部
92 送信PHY
93 受信PHY
96 バッファ
97 リンク処理
98 トランスポート処理
100〜104 ディスク制御装置
110 NASヘッド
120 ディスク制御装置間仮想化エンジン
130 DB機能付加エンジン
200 ディスク制御サブユニット
C 障害監視機構
P パス制御機構。

Claims (17)

  1. ホストコンピュータとのインターフェースを有する複数のホストインターフェース部と、記憶装置とのインターフェースを有する複数のディスクインターフェース部と、前記記憶装置に対しリードまたはライトされるデータを一時的に格納する複数のキャッシュメモリ部を有し、前記複数のホストインターフェース部の各々は、前記ホストコンピュータとのインターフェースと前記キャッシュメモリ部との間のデータ転送を実行し、前記複数のディスクインターフェース部の各々は、前記記憶装置とのインターフェースと前記キャッシュメモリ部との間のデータ転送を実行するディスク制御装置であって、
    前記複数のホストインターフェース部と前記キャッシュメモリ部、及び、前記複数のディスクインターフェース部と前記キャッシュメモリ部との間が1つ以上のスイッチで構成されるスイッチ網を介して接続され、前記ホストインターフェース部、前記ディスクインターフェース部及び前記キャッシュメモリ部は、前記スイッチ網内で一意に決まるローカルIDと該IDを変更する変更手段を有し、前記スイッチは前記スイッチ網内での経路を前記IDを用いて指定するためのフォワーディングテーブルと該テーブルを変更する変更手段を有し、さらに前記複数のキャッシュメモリ部は、該複数のキャッシュメモリ部における障害発生の有無を監視するための障害監視機構と前記スイッチ内のフォワーディングテーブルを制御するためのパス制御機構を有することを特徴とするディスク制御装置。
  2. 前記パス制御機構は前記複数のキャッシュメモリ部における障害発生時に障害部位を回避するように前記スイッチ内のフォワーディングテーブルを制御することを特徴とする請求項1記載のディスク制御装置。
  3. ホストコンピュータとのインターフェースを有する複数のホストインターフェース部と、記憶装置とのインターフェースを有する複数のディスクインターフェース部と、前記記憶装置に対しリードまたはライトされるデータを一時的に格納する複数のキャッシュメモリ部と、ホストインターフェース部及びディスクインターフェース部と前記キャッシュメモリ部との間のデータ転送に関する制御情報を格納する複数のリソース管理部を有し、前記複数のホストインターフェース部の各々は、前記ホストコンピュータとのインターフェースと前記キャッシュメモリ部との間のデータ転送を実行し、前記複数のディスクインターフェース部の各々は、前記記憶装置とのインターフェースと前記キャッシュメモリ部との間のデータ転送を実行するディスク制御装置であって、
    前記複数のホストインターフェース部、前記複数のディスクインターフェース部が1つ以上のスイッチで構成されるスイッチ網を介して前記キャッシュメモリ部と接続され、前記複数のホストインターフェース部、前記複数のディスクインターフェース部が前記スイッチ網を介して前記リソース管理部に接続され、前記ホストインターフェース部、前記ディスクインターフェース部、前記キャッシュメモリ部及び前記リソース管理部は、前記スイッチ網内で一意に決まるローカルIDと該IDを変更する変更手段を有し、前記スイッチは前記スイッチ網内での経路を前記IDを用いて指定するためのフォワーディングテーブルと該テーブルを変更する変更手段を有し、さらに前記複数のキャッシュメモリ部と前記複数のリソース管理部は、その障害発生の有無を監視するための障害監視機構と前記スイッチ内の前記フォワーディングテーブルを制御するためのパス制御機構を有することを特徴とするディスク制御装置。
  4. 前記パス制御機構は前記キャッシュメモリ部または前記リソース管理部における障害発生時に障害部位を回避するように前記スイッチ内の前記フォワーディングテーブルを制御することを特徴とする請求項3記載のディスク制御装置。
  5. 前記キャッシュメモリ部における障害を監視するための前記障害監視機構が、前記キャッシュメモリ部の中にかえて、前記リソース管理部の中にあることを特徴とする請求項3または4記載のディスク制御装置。
  6. 前記障害監視機構が、前記ホストインターフェース部及び前記ディスクインターフェース部でのリードまたはライトとともに動作することを特徴とする請求項1乃至5のいずれかに記載のディスク制御装置。
  7. 前記キャッシュメモリ部における障害を処理するためのパス制御機構が、前記キャッシュメモリ部の中にかえて、前記リソース管理部に備わっていることを特徴とする請求項3乃至6のいずれかに記載のディスク制御装置。
  8. 前記障害監視機構により障害を検出した際、前記パス制御機構により前記障害部位の前記ローカルIDと前記障害部位の機能を引き継ぐ前記交換部位の前記ローカルIDとを交換し、該ローカルID交換に対応して前記スイッチ網内経路を切り換えるよう前記スイッチ内フォワーディングテーブルを変更することを特徴とする請求項1乃至7のいずれかに記載のディスク制御装置。
  9. ホストコンピュータとのインターフェースを有する複数のホストインターフェース部と、記憶装置とのインターフェースを有する複数のディスクインターフェース部と、前記記憶装置に対しリードまたはライトされるデータを一時的に格納する複数のキャッシュメモリ部を有し、各ホストインターフェース部は、前記ホストコンピュータとのインターフェースと前記キャッシュメモリ部との間のデータ転送を実行し、各ディスクインターフェース部は、前記記憶装置とのインターフェースと前記キャッシュメモリ部との間のデータ転送を実行し、
    前記複数のホストインターフェース部と前記キャッシュメモリ部、及び、前記複数のディスクインターフェース部と前記キャッシュメモリ部との間が1つ以上のスイッチで構成されるスイッチ網を介して接続され、前記ホストインターフェース部、前記ディスクインターフェース部及び前記キャッシュメモリ部は、前記スイッチ網内で一意に決まるローカルIDと該IDを変更する変更手段を有し、前記スイッチは前記スイッチ網内での経路を前記IDを用いて指定するためのフォワーディングテーブルと該テーブルを変更する変更手段を有し、さらに前記複数のキャッシュメモリ部は、障害監視機構とパス制御機構を有するディスク制御装置における前記キャッシュメモリ部の障害処理方法であって、
    前記障害監視機構が前記キャッシュメモリ部における障害発生の有無を確認するステップと、該障害監視機構が該障害発生を前記パス制御機構に通知するステップと、該パス制御機構が前記通知された障害情報を解析するステップと、該パス制御機構が障害部位を回避するように前記スイッチ内のフォワーディングテーブルを制御するステップとを有することを特徴とする障害処理方法。
  10. ホストコンピュータとのインターフェースを有する複数のホストインターフェース部と、記憶装置とのインターフェースを有する複数のディスクインターフェース部と、前記記憶装置に対しリードまたはライトされるデータを一時的に格納する複数のキャッシュメモリ部と、ホストインターフェース部及びディスクインターフェース部と前記キャッシュメモリ部との間のデータ転送に関する制御情報を格納する複数のリソース管理部を有し、前記複数のホストインターフェース部の各々は、前記ホストコンピュータとのインターフェースと前記キャッシュメモリ部との間のデータ転送を実行し、前記複数のディスクインターフェース部の各々は、前記記憶装置とのインターフェースと前記キャッシュメモリ部との間のデータ転送を実行し、
    前記複数のホストインターフェース部、前記複数のディスクインターフェース部が1つ以上のスイッチで構成されるスイッチ網を介して前記キャッシュメモリ部と接続され、前記複数のホストインターフェース部、前記複数のディスクインターフェース部が前記スイッチ網を介して前記リソース管理部に接続され、前記ホストインターフェース部、前記ディスクインターフェース部、前記キャッシュメモリ部及び前記リソース管理部は、前記スイッチ網内で一意に決まるローカルIDと該IDを変更する変更手段を有し、前記スイッチは前記スイッチ網内での経路を前記IDを用いて指定するためのフォワーディングテーブルと該テーブルを変更する変更手段を有し、さらに前記複数のキャッシュメモリ部と前記複数のリソース管理部は、障害監視機構とパス制御機構を有するディスク制御装置における前記キャッシュメモリ部および前記リソース管理部の障害処理方法であって、
    前記障害監視機構が、前記キャッシュメモリ部または前記リソース管理部における障害発生の有無を確認するステップと、該障害監視機構が該障害発生を前記パス制御機構に通知するステップと、該パス制御機構が、前記通知された障害情報を解析するステップと、該パス制御機構が障害部位を回避するように前記スイッチ内のフォワーディングテーブルを制御するステップを有することを特徴とする障害処理方法。
  11. 請求項10記載のディスク制御装置の前記キャッシュメモリ部における障害を監視するための前記障害監視機構が、前記キャッシュメモリ部の中にかえて、前記リソース管理部の中にあるディスク制御装置における障害処理方法であって、該障害監視機構が前記キャッシュメモリ部の障害発生の有無を確認するステップが、前記リソース管理部の中で実行されることを特徴とする障害処理方法。
  12. 前記障害監視機構による障害発生の有無を確認するステップが、前記ホストインターフェース部及び前記ディスクインターフェース部でのリードまたはライト動作の際に実行されることを特徴とする請求項9乃至11のいずれかに記載の障害処理方法。
  13. 請求項10乃至12のいずれかに記載のディスク制御装置の前記キャッシュメモリ部における障害を処理するためのパス制御機構が、前記キャッシュメモリ部の中にかえて、前記リソース管理部に備わっているディスク制御装置における障害処理方法であって、前記パス制御機構による前記フォワーディングテーブルを制御するステップが、前記リソース管理部の中で実行されることを特徴とする障害処理方法。
  14. 前記パス制御機構により前記フォワーディングテーブルを制御するステップは、前記障害部位のローカルIDと障害部位の機能を引き継ぐ交換部位のローカルIDとを交換するステップと、該ローカルID交換に対応して前記スイッチ網内経路を切り換えるよう前記スイッチ内フォワーディングテーブルを変更するステップを有することを特徴とする請求項9乃至13のいずれかに記載の障害処理方法。
  15. 前記記憶装置は磁気ディスク装置であることを特徴とする請求項1乃至8のいずれかに記載のディスク制御装置。
  16. 前記記憶装置は磁気ディスク装置であることを特徴とする請求項9乃至14のいずれかに記載の障害処理方法。
  17. 複数のホストコンピュータと第1のネットワークを介して接続され、複数の磁気ディスク装置と第2のネットワークを介して接続されたディスク制御装置を備え、
    上記ディスク制御装置は、
    上記ホストコンピュータとのインターフェースを有する複数のホストインターフェース部と、
    上記磁気ディスク装置とのインターフェースを有する複数のディスクインターフェース部と、
    上記複数のホストインターフェース部及び上記複数のディスクインターフェース部との間が1つ以上のスイッチで構成されるスイッチ網を介して接続された複数のキャッシュメモリ部を備え、
    前記複数のホストインターフェース部、前記複数のディスクインターフェース部及び前記複数のキャッシュメモリ部は、前記スイッチ網内で一意に決まるローカルIDと該IDを変更する変更手段を有し、
    前記スイッチは、前記スイッチ網内での経路を前記IDを用いて指定するためのフォワーディングテーブルと、該テーブルを変更する変更手段を有し、
    前記複数のキャッシュメモリ部は、
    該複数のキャッシュメモリ部における障害発生の有無を監視するための障害監視機構と、
    前記スイッチ内のフォワーディングテーブルを制御するためのパス制御機構を有することを特徴とするディスクアレイサブシステム。
JP2002378956A 2002-12-27 2002-12-27 高可用ディスク制御装置とその障害処理方法及び高可用ディスクサブシステム Expired - Fee Related JP4107083B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002378956A JP4107083B2 (ja) 2002-12-27 2002-12-27 高可用ディスク制御装置とその障害処理方法及び高可用ディスクサブシステム
US10/626,049 US6970972B2 (en) 2002-12-27 2003-07-23 High-availability disk control device and failure processing method thereof and high-availability disk subsystem

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002378956A JP4107083B2 (ja) 2002-12-27 2002-12-27 高可用ディスク制御装置とその障害処理方法及び高可用ディスクサブシステム

Publications (2)

Publication Number Publication Date
JP2004213125A true JP2004213125A (ja) 2004-07-29
JP4107083B2 JP4107083B2 (ja) 2008-06-25

Family

ID=32708359

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002378956A Expired - Fee Related JP4107083B2 (ja) 2002-12-27 2002-12-27 高可用ディスク制御装置とその障害処理方法及び高可用ディスクサブシステム

Country Status (2)

Country Link
US (1) US6970972B2 (ja)
JP (1) JP4107083B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006154880A (ja) * 2004-11-04 2006-06-15 Hitachi Ltd 情報処理システム及びアクセス方法
JP2007207007A (ja) * 2006-02-02 2007-08-16 Hitachi Ltd ストレージシステム、ストレージコントローラ及び計算機システム
JP2008065561A (ja) * 2006-09-06 2008-03-21 Hitachi Ltd ストレージシステムおよびストレージシステムの制御方法
JP2008158666A (ja) * 2006-12-21 2008-07-10 Nec Corp ストレージデバイスのマルチパスシステム、その障害箇所特定方法及びプログラム
JP2009009200A (ja) * 2007-06-26 2009-01-15 Hitachi Ltd ストレージシステム及びストレージシステムの制御方法
US7640365B2 (en) 2006-09-26 2009-12-29 Hitachi, Ltd. Highly reliable disk controller
JP2010231598A (ja) * 2009-03-27 2010-10-14 Nec Corp ディスクアレイ装置、ディスク制御装置、ディスクアレイ装置における負荷分散方法
CN117130952A (zh) * 2023-01-10 2023-11-28 荣耀终端有限公司 预读方法和预读装置

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4155399B2 (ja) * 2003-03-28 2008-09-24 株式会社日立製作所 コンピュータ処理方法及びその実施システム並びにその処理プログラム
US20050015655A1 (en) * 2003-06-30 2005-01-20 Clayton Michele M. Intermediate station
US20050028028A1 (en) * 2003-07-29 2005-02-03 Jibbe Mahmoud K. Method for establishing a redundant array controller module in a storage array network
JP2005056200A (ja) * 2003-08-05 2005-03-03 Hitachi Ltd データ管理方法、ディスク記憶装置およびディスク記憶システム
US7389411B2 (en) * 2003-08-29 2008-06-17 Sun Microsystems, Inc. Secure transfer of host identities
GB2405965B (en) * 2003-08-29 2005-11-02 Sun Microsystems Inc Transferring system identities
US7444396B2 (en) 2003-08-29 2008-10-28 Sun Microsystems, Inc. Transferring system identities
US7136959B1 (en) * 2003-09-30 2006-11-14 Emc Corporation Data storage system having crossbar packet switching network
JP4441286B2 (ja) * 2004-02-10 2010-03-31 株式会社日立製作所 ストレージシステム
US7467238B2 (en) * 2004-02-10 2008-12-16 Hitachi, Ltd. Disk controller and storage system
JP4405277B2 (ja) * 2004-02-16 2010-01-27 株式会社日立製作所 ディスク制御装置
JP4789425B2 (ja) * 2004-03-31 2011-10-12 富士通株式会社 経路テーブル同期方法、ネットワーク機器および経路テーブル同期プログラム
JP2005301419A (ja) 2004-04-07 2005-10-27 Hitachi Ltd ディスクアレイ装置およびそのデータ処理方法
US9201599B2 (en) * 2004-07-19 2015-12-01 Marvell International Ltd. System and method for transmitting data in storage controllers
US9183087B2 (en) * 2005-06-07 2015-11-10 Seagate Technology Llc Data storage subgroup with local and shared resources
US7802019B2 (en) * 2005-06-14 2010-09-21 Microsoft Corporation Hard disk drive condition reporting and error correction
EP1768026B1 (en) * 2005-09-23 2008-06-11 Infortrend Technology, Inc. Redundant storage virtualization subsystem having data path branching functionality
JP2007128437A (ja) * 2005-11-07 2007-05-24 Hitachi Ltd ディスクアレイ装置及びその経路障害検出方法
US7694188B2 (en) * 2007-02-05 2010-04-06 Microsoft Corporation Disk failure prevention and error correction
JP5216376B2 (ja) * 2008-03-10 2013-06-19 株式会社日立製作所 リモートコピーシステム及び確認方法
US7984313B2 (en) * 2008-04-17 2011-07-19 International Business Machines Corporation Method, apparatus and system for reducing power consumption involving data storage devices
US8291245B2 (en) * 2008-04-17 2012-10-16 International Business Machines Corporation Method, apparatus and system for reducing power consumption based on storage device data migration
JP5232602B2 (ja) 2008-10-30 2013-07-10 株式会社日立製作所 ストレージ装置、及びストレージコントローラ内部ネットワークのデータ経路フェイルオーバー方法
CN101562543B (zh) * 2009-05-25 2013-07-31 阿里巴巴集团控股有限公司 一种缓存数据的处理方法、处理系统和装置
US20110185099A1 (en) * 2010-01-28 2011-07-28 Lsi Corporation Modular and Redundant Data-Storage Controller And a Method for Providing a Hot-Swappable and Field-Serviceable Data-Storage Controller
JP4936088B2 (ja) * 2010-03-15 2012-05-23 日本電気株式会社 ディスクアレイ装置、ディスクアレイシステム、及びキャッシュ制御方法
US8990615B1 (en) * 2012-09-28 2015-03-24 Emc Corporation System and method for cache management
US9329938B2 (en) 2013-04-16 2016-05-03 International Business Machines Corporation Essential metadata replication
US9104332B2 (en) 2013-04-16 2015-08-11 International Business Machines Corporation Managing metadata and data for a logical volume in a distributed and declustered system
US9298617B2 (en) 2013-04-16 2016-03-29 International Business Machines Corporation Parallel destaging with replicated cache pinning
US9619404B2 (en) * 2013-04-16 2017-04-11 International Business Machines Corporation Backup cache with immediate availability
US9423981B2 (en) 2013-04-16 2016-08-23 International Business Machines Corporation Logical region allocation with immediate availability
US9104597B2 (en) 2013-04-16 2015-08-11 International Business Machines Corporation Destaging cache data using a distributed freezer
US9298398B2 (en) 2013-04-16 2016-03-29 International Business Machines Corporation Fine-grained control of data placement
US10110700B2 (en) * 2014-03-31 2018-10-23 Oracle International Corporation Multiple on-die communication networks
US9825827B2 (en) * 2014-08-07 2017-11-21 International Business Machines Corporation Network resiliency through memory health monitoring and proactive management
US9866427B2 (en) * 2015-02-16 2018-01-09 Juniper Networks, Inc. Multi-stage switch fabric fault detection and handling
US10303572B2 (en) * 2017-01-23 2019-05-28 Wipro Limited Methods and systems for improving fault tolerance in storage area network
CN107643988B (zh) * 2017-09-15 2020-06-26 苏州浪潮智能科技有限公司 一种具有失效切换机制的存储系统及存储方法
CN109284214B (zh) * 2018-08-15 2021-04-06 英业达科技有限公司 信息共享电路及共享内存状态的方法
CN109597549B (zh) * 2018-10-16 2020-11-03 西北铁道电子股份有限公司 一种基于SelfUI的GYK设备的人机交互系统
US10951527B2 (en) 2018-12-28 2021-03-16 Juniper Networks, Inc. Switch fabric packet flow reordering

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4710926A (en) * 1985-12-27 1987-12-01 American Telephone And Telegraph Company, At&T Bell Laboratories Fault recovery in a distributed processing system
US5386551A (en) * 1993-04-16 1995-01-31 Storage Technology Corporation Deferred resource recovery
JP2972501B2 (ja) * 1993-09-20 1999-11-08 富士通株式会社 I/oサブシステム及びi/oサブシステムにおける排他制御方法
JP3136036B2 (ja) * 1993-11-16 2001-02-19 富士通株式会社 ディスク制御装置の制御方法
GB9422854D0 (en) * 1994-11-12 1995-01-04 Int Computers Ltd High availability data processing system
JP3776496B2 (ja) 1996-01-17 2006-05-17 株式会社日立製作所 データ記憶システム
US5724501A (en) * 1996-03-29 1998-03-03 Emc Corporation Quick recovery of write cache in a fault tolerant I/O system
US6151688A (en) * 1997-02-21 2000-11-21 Novell, Inc. Resource management in a clustered computer system
US6421787B1 (en) * 1998-05-12 2002-07-16 Sun Microsystems, Inc. Highly available cluster message passing facility
JP4049899B2 (ja) * 1998-07-15 2008-02-20 株式会社三共 遊技機
JP2000099277A (ja) * 1998-09-18 2000-04-07 Fujitsu Ltd ファイルユニット間のリモート転送方法
US6826580B2 (en) * 2000-01-20 2004-11-30 Emc Corporation Distributed storage resource management in a storage area network
JP2001337835A (ja) * 2000-05-25 2001-12-07 Hitachi Ltd 制御プログラム内蔵型装置のプログラム更新方式及び制御プログラム内蔵型装置
US6865157B1 (en) 2000-05-26 2005-03-08 Emc Corporation Fault tolerant shared system resource with communications passthrough providing high availability communications
JP2003084919A (ja) * 2001-09-06 2003-03-20 Hitachi Ltd ディスクアレイ装置の制御方法およびディスクアレイ装置
JP2003140837A (ja) * 2001-10-30 2003-05-16 Hitachi Ltd ディスクアレイ制御装置
JP4338068B2 (ja) * 2002-03-20 2009-09-30 株式会社日立製作所 ストレージシステム
JP4014923B2 (ja) * 2002-04-30 2007-11-28 株式会社日立製作所 共有メモリ制御方法および制御システム
JP4189171B2 (ja) * 2002-05-24 2008-12-03 株式会社日立製作所 ディスク制御装置
US6957303B2 (en) * 2002-11-26 2005-10-18 Hitachi, Ltd. System and managing method for cluster-type storage

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8036238B2 (en) 2004-11-04 2011-10-11 Hitachi, Ltd. Information processing system and access method
JP2006154880A (ja) * 2004-11-04 2006-06-15 Hitachi Ltd 情報処理システム及びアクセス方法
JP4617847B2 (ja) * 2004-11-04 2011-01-26 株式会社日立製作所 情報処理システム及びアクセス方法
JP2007207007A (ja) * 2006-02-02 2007-08-16 Hitachi Ltd ストレージシステム、ストレージコントローラ及び計算機システム
US8127077B2 (en) 2006-02-02 2012-02-28 Hitachi, Ltd. Virtual path storage system and control method for the same
JP2008065561A (ja) * 2006-09-06 2008-03-21 Hitachi Ltd ストレージシステムおよびストレージシステムの制御方法
US7640365B2 (en) 2006-09-26 2009-12-29 Hitachi, Ltd. Highly reliable disk controller
US8069272B2 (en) 2006-09-26 2011-11-29 Hitachi, Ltd. Highly reliable disk controller
JP2008158666A (ja) * 2006-12-21 2008-07-10 Nec Corp ストレージデバイスのマルチパスシステム、その障害箇所特定方法及びプログラム
JP2009009200A (ja) * 2007-06-26 2009-01-15 Hitachi Ltd ストレージシステム及びストレージシステムの制御方法
JP2010231598A (ja) * 2009-03-27 2010-10-14 Nec Corp ディスクアレイ装置、ディスク制御装置、ディスクアレイ装置における負荷分散方法
US8356205B2 (en) 2009-03-27 2013-01-15 Nec Corporation Disk array device, disk control device and load distribution method in disk array device
CN117130952A (zh) * 2023-01-10 2023-11-28 荣耀终端有限公司 预读方法和预读装置

Also Published As

Publication number Publication date
US20040139365A1 (en) 2004-07-15
US6970972B2 (en) 2005-11-29
JP4107083B2 (ja) 2008-06-25

Similar Documents

Publication Publication Date Title
JP4107083B2 (ja) 高可用ディスク制御装置とその障害処理方法及び高可用ディスクサブシステム
US6598174B1 (en) Method and apparatus for storage unit replacement in non-redundant array
JP6317856B2 (ja) クラスタ間冗長構成におけるスムーズな制御部交代
US6691209B1 (en) Topological data categorization and formatting for a mass storage system
US6571354B1 (en) Method and apparatus for storage unit replacement according to array priority
US6678788B1 (en) Data type and topological data categorization and ordering for a mass storage system
KR100232247B1 (ko) 클러스터화된 다중처리 시스템 및 시스템내 디스크 액세스 경로의 고장 회복 방법
US7483928B2 (en) Storage operation management program and method and a storage management computer
EP1837750A2 (en) Computer system for controlling allocation of physical links and method thereof
US9823955B2 (en) Storage system which is capable of processing file access requests and block access requests, and which can manage failures in A and storage system failure management method having a cluster configuration
JP2005326935A (ja) 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法
JP2005018510A (ja) データセンタシステム及びその制御方法
KR20110044858A (ko) 데이터 센터들에 걸쳐 데이터 서버들내 데이터 무결정의 유지
JP2006209487A (ja) 計算機システム、計算機、ストレージ装置及び管理端末
WO2001001257A2 (en) Intelligent splitter, system, and methods of use
JP2007094996A (ja) データストレージシステム、データストレージ制御装置及びその障害箇所診断方法
US7937610B2 (en) Fast node failure detection via disk based last gasp mechanism
CN108628717A (zh) 一种数据库系统及监控方法
JP2005018193A (ja) ディスク装置のインタフェースコマンド制御方法ならびに計算機システム
CN107766181B (zh) 一种基于PCIe非透明桥的双控制器存储高可用子系统
JP2008112399A (ja) ストレージ仮想化スイッチおよびコンピュータシステム
JP2000181887A5 (ja)
JP2005196490A (ja) データ多重化のためのシステム及び方法
JP4252551B2 (ja) データストレージシステム及びストレージ制御装置の異常時のログデータ出力方法
US7752340B1 (en) Atomic command retry in a data storage system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040825

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080324

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110411

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110411

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120411

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120411

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130411

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140411

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees