JP4345979B2 - Raid装置、通信接続監視方法及びプログラム - Google Patents

Raid装置、通信接続監視方法及びプログラム Download PDF

Info

Publication number
JP4345979B2
JP4345979B2 JP2005191512A JP2005191512A JP4345979B2 JP 4345979 B2 JP4345979 B2 JP 4345979B2 JP 2005191512 A JP2005191512 A JP 2005191512A JP 2005191512 A JP2005191512 A JP 2005191512A JP 4345979 B2 JP4345979 B2 JP 4345979B2
Authority
JP
Japan
Prior art keywords
processing
communication
time
inter
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005191512A
Other languages
English (en)
Other versions
JP2007011672A (ja
Inventor
明人 小林
秀憲 山田
克彦 長嶋
英明 大村
幸治 内田
晋一 西園
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005191512A priority Critical patent/JP4345979B2/ja
Priority to US11/229,693 priority patent/US7567514B2/en
Priority to CNB200510114555XA priority patent/CN100451978C/zh
Priority to KR1020050115407A priority patent/KR100736647B1/ko
Publication of JP2007011672A publication Critical patent/JP2007011672A/ja
Application granted granted Critical
Publication of JP4345979B2 publication Critical patent/JP4345979B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/382Information transfer, e.g. on bus using universal interface adapter
    • G06F13/387Information transfer, e.g. on bus using universal interface adapter for adaptation of different data processing systems to different peripheral devices, e.g. protocol converters for incompatible systems, open system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、上位装置からの処理要求に対し複数の処理装置で階層的に処理を実行して応答する際の通信タイムアウト時間を監視するRAID装置、通信接続監視方法及びプログラムに関し、特に階層的処理に時間がかかっても上位装置のチャネル接続のタイムアウト時間をオーバーしないように応答するRAID装置、通信接続監視方法及びプログラムに関する。
従来、グローバルサーバやオープンサーバ等のストレージ装置として使用されるRAID装置にあっては、複数の制御モジュール、チャネルアダプタ、デバイスアダプタ、ディスクエンクロージャ及びルータで構成されている。
制御モジュールには、CPU及びキャッシュ等が搭載され、ストレージ装置全体の動作を制御する。チャネルアダプタは、RAID装置と各種サーバとを接続するモジュールであり、ファイバチャネル、iSCSI等のインタフェースを使用している。デバイスアダプタは、制御モジュールと複数の磁気ディスクドライブを搭載したドライブエンクロージャとを接続するモジュールであり、ファイバチャネルインタフェースを使用している。更に、ルータは制御モジュール、チャネルアダプタ及びデバイスアダプタの間を高速に接続するためのモジュールである。
このような従来のRAID装置にあっては、上位装置であるサーバのチャネルによるインタフェース接続により発行された入出力要求のコマンドを受信してボリュームに対する入出力処理をキャッシュを経由して実行している。
通常、チャネルとRAID装置とのインタフェース接続の通信時間は、インタフェース接続チェックICC(Interface Connection Check)により監視されており、チャネルとRAID装置間が接続状態のまま一定時間経過した場合にICCタイムアウトエラーと判定し、チャネル側でRAID装置との接続を強制的に切り離し、RAID装置の異常を判定してその後の入出力要求を抑止させるようにしている。
このようにチャネル側でインタフェース接続チェックICCのタイムアウトエラーが発生する要因の1つに、チャネルからの処理要求に対しRAID装置に設けた2つの制御モジュールで階層的に処理を実行する際のモジュール間通信(装置間通信)によって処理に時間がかかる場合が挙げられる。
そのため従来のRAID装置においては、2つの制御モジュールによる階層的処理のための装置間通信を監視するタイムアウト時間として、チャネル側のインタフェース接続チェックICCのタイムアウト時間よりも短い時間をタイマ値に設定し、2つの制御モジュールによる階層的処理に時間がかかる場合には、チャネルとの通信接続のタイムアウトエラーが発生する前に、2つの制御モジュールにおける装置間通信についてタイムアウトエラーを発生させ、チャネルに対しRAID装置側からインタフェース接続の切り離しを要求し、インタフェース接続チェックICCのエラーが判定される前にインタフェース接続を解除するようにしている。
図11は従来のRAID装置における通信接続監視処理の説明図である。図11において、チャネル200は時刻t1でRAID装置202に設けた制御モジュール204とのインタフェース接続を確立して処理要求208を送信する。制御モジュール204は処理要求208を解読し、制御モジュール206との間に装置間通信を確立して時刻t2で処理要求210を送信する。
制御モジュール206は処理要求210に対応した処理実行215を行い、時刻t4で正常終了の処理応答212を返し、これを受けて制御モジュール204は時刻t6でチャネル200に処理応答214を転送し、チャネル200はRAID装置202との接続を解放する。
このときチャネル200は時刻t1でインタフェース接続チェック(ICC)216のタイムアウト時間T1をタイマ値に設定し、タイムアウト時間T1内にRAID装置202から応答があるか否か監視している。
また制御モジュール204にあっては、時刻t2で装置間通信を開始した際に、モジュール間通信チェック218として、チャネル側のタイムアウト時間T1より短い装置間通信のタイムアウト時間T2をタイマ値に設定して制御モジュール206から処理応答212が得られるか否か監視している。
図11の場合、制御モジュール204,206による階層的処理に遅れはなく、装置間通信のタイムアウト時間T2によるエラー、及びチャネル200側のインタフェース接続チェックICCのタイムアウト時間T1によるエラーはいずれも発生せず、処理を正常に終了させている。
図12は制御モジュール206の階層的な処理に時間がかかった場合である。この場合には、時刻t2から装置間通信を確立して制御モジュール206の処理実行215−1を開始しているが、その処理に時間がかり、時刻t4で処理応答が出る前の時刻t3でモジュール間通信チェック218によるタイムアウト時間T2がオーバーしてタイムアウトエラーとなり、チャネル200に対し接続解除要求220を発行することで、チャネル200とRAID装置202のインタフェース接続を解除し、インタフェース接続チェック216によるタイムアウト時間T1のオーバーによるタイムアウトエラーを発生させないようにしている。
また時刻t3でモジュール間通信のタイムアウトエラーを判別してチャネル200との接続を解除した場合には、制御モジュール206の処理実行215−1がエラーを起こしている可能性が高いので、時刻t2で発行した処理要求210をキャンセルし、再度、同じ内容の処理要求222を装置間通信を確立して制御モジュールに206発行して同じ処理実行215−2を行い、制御モジュール206からの処理応答を待つ。時刻t5で処理応答212が得られると、制御モジュール204は時刻t6でチャネル200に対しインタフェース再接続を要求し、接続が確立されると、処理応答214を転送し、一連の処理を終了している。
なお、タイムアウトエラー後に制御モジュール206から処理要求210に対する処理応答が得られたとしても、時刻t2で発行した処理要求210はタイムアウトエラーの際にキャンセルされているため、処理応答は破棄される。
特開2003−233514号公報 特開平07−006058号公報
しかしながら、このような従来のチャネル側のインタフェース接続チェックのタイムアウト時間T1より短いタイムアウト時間T2を設定した装置間通信の監視にあっては、装置間通信を開始するまでの処理に時間がかかった場合、チャネル側のインタフェース接続チェックによるタイムアウトエラーを発生させてしまう問題がある。
図13は装置間通信を開始するまでの処理が遅延した場合である。図13において、時刻t1でチャネル200から処理要求208を受信した制御モジュール204は何らかの原因により処理遅延224を起こし、経過時間T後の時刻t2で制御モジュール206に処理要求210を発行している。
このため制御モジュール204において装置間通信のタイムアウト時間T2に時刻t4で達する前の時刻t3において、チャネル200のタイムアウト時間T1に達し、インタフェース接続チェック216のタイムアウトエラー224となり、RAID装置202とのインタフェース接続が切り離され、チャネル200側がエラー終了し、その後のRAID装置202に対する要求や応答を受付けなくなってしまう問題がある。
本発明は、装置間通信を伴う処理に時間がかかってもチャネル側のインタフェース接続監視のタイムアウトエラーを発生させることのないRAID装置、通信接続監視方法及びプログラムを提供することを目的とする。
図1は本発明の原理説明図である。本発明は、ボリュームの入出力処理を実行する第1処理装置(制御モジュール18−1)と第2処理装置(制御モジュール18−2)を備え、上位装置(サーバ12)とのインタフェース接続により第1処理装置で受信した処理要求を装置間通信により第2処理装置に送信して階層的に処理させ、第2処理装置から終了応答を第1処理装置を経由して上位装置に転送してインタフェース接続を解放させるRAID装置を対象とする。
このようなRAID装置につき本発明は、第1処理装置が上位装置から処理要求を受信してから装置間通信により第2処理装置に処理要求を送信するまでの経過時間を検出する経過時間検出部60−1と、第1処理装置と第2処理装置の装置間通信を監視する所定の固定タイムアウト時間T2から経過時間Tを差し引いた可変タイムアウト時間Tx(=T2−T)を算出して装置間通信の経過時間を監視する装置間通信監視部62−1とを備えたことを特徴とする。
ここで、固定タイムアウト時間T2は、上位装置と第1処理装置とのインタフェース接続の経過時間を監視する所定のインタフェース接続チェック時間T1より短い時間である。
装置間通信監視部は、装置間通信の経過時間が可変タイムアウト時間を越えた場合、上位装置にインタフェース接続の切り離しを要求し、その後に第2処理装置から終了応答が得られた際に、上位装置にインタフェース再接続を要求して終了応答を送信する。
経過時間検出部は、第1処理装置が上位装置から処理要求を受信してから装置間通信により第2処理装置に第1処理要求(第1トランザクション要求)を送信して終了応答を得るまでの経過時間を検出し、装置間通信監視部は、固定タイムアウト時間から経過時間を差し引いた可変タイムアウト時間を算出し、装置間通信により第2処理装置に第2処理要求(第2トランザクション要求)を送信して終了応答を得るまでの経過時間を監視する。
第1処理装置が装置間通信により第2処理装置に送信する処理要求は、例えば入出力要求に伴う処理情報を2重化する処理要求である。
本発明は、ボリュームの入出力処理を実行する第1処理装置と第2処理装置を備え、上位装置とのインタフェース接続により第1処理装置で受信した処理要求を装置間通信により第2処理装置に送信して階層的に処理させ、第2処理装置から終了応答を第1処理装置を経由して上位装置に転送してインタフェース接続を解放させるRAID装置の通信接続監視方法を対象とする。
このようなRAID装置の通信接続監視方法として本発明は、
第1処理装置が上位装置から処理要求を受信してから装置間通信により第2処理装置に処理要求を送信するまでの経過時間Tを検出する経過時間検出ステップと、
第1処理装置と第2処理装置の装置間通信を監視する所定の固定タイムアウト時間T2から経過時間Tを差し引いた可変タイムアウト時間Txを算出して装置間通信の経過時間を監視する装置間通信監視ステップと、
を備えたことを特徴とする。
本発明は、ボリュームの入出力処理を実行する第1処理装置と第2処理装置を備え、上位装置とのインタフェース接続により第1処理装置で受信した処理要求を装置間通信により第2処理装置に送信して階層的に処理させ、第2処理装置から終了応答を第1処理装置を経由して上位装置に転送してインタフェース接続を解放させるRAID装置に設けた第1処理装置のコンピュータにより実行されるプログラムを対象とする。
このプログラムとして本発明は、RAID装置に設けた第1処理装置のコンピュータに、 上位装置から処理要求を受信してから装置間通信により第2処理装置に処理要求を送信するまでの経過時間Tを検出する経過時間検出ステップと、
第1処理装置と第2処理装置の装置間通信を監視する所定の固定タイムアウト時間T2から経過時間Tを差し引いた可変タイムアウト時間Txを算出して装置間通信の経過時間を監視する装置間通信監視ステップと、
を実行させることを特徴とする。
なお、本発明による通信接続監視方法及びプログラムの詳細は、本発明による通信接続監視装置と基本的に同じになる。
本発明によれば、第1処理装置と第2処理装置の間で装置間通信を開始する前の処理に時間がかかっても、装置間通信を開始するまでの経過時間Tを検出し、この経過時間Tを予め定めた装置間通信を監視する固定タイムアウト時間T2から差し引いて可変タイムアウト時間Txを求め、可変タイムアウト時間Txにより装置間通信を監視しているため、上位装置側のインタフェース接続監視のタイムアウト時間T1に達する前に、RAID装置側で装置間通信のタイムアウトエラーを発生して上位装置との接続を切り離し、上位装置側でのインタフェース接続監視によるタイムアウトエラーの発生を確実に防止することができる。
また本発明による通信接続監視を、RAID装置に設けた2台の処理装置が装置間通信を用いて上位装置の処理要求に対し連続して異なる階層的処理、例えば2重化処理を2回実行する場合についても、1回目の装置間通信を伴う階層的処理の経過時間Tを検出し、2回目の装置間通信を伴う別の階層処理のタイムアウト時間として、装置間通信を監視する固定タイムアウト時間T2から1回目の経過時間Tを差し引いた可変タイムアウト時間Txを求めて装置間通信を監視しているため、同様に、1回目の階層的処理に時間がかかっても、上位装置側のインタフェース接続監視のタイムアウト時間T1に達する前に、RAID装置側で装置間通信のタイムアウトエラーを発生して上位装置とインタフェース接続を切り離し、上位装置側でのインタフェース接続チェック(ICC)によるタイムアウトエラーの発生を確実に防止することができる。
図2は本発明が適用されるRAID装置のハードウェア構成のブロック図である。図2において、RAID装置10はチャネルアダプタ16−11〜16−22、制御モジュール18−1,18−2、ドライブエンクロージャ20−1,20−2を備えている。制御モジュール18−1には例えばチャネルアダプタ16−11によって上位装置としてのサーバ12が接続され、また制御モジュール18−2にはチャネルアダプタ16−21によってサーバ14が接続されている。ここでサーバ12は例えばグローバルサーバであり、サーバ14は例えばオープンサーバである。
制御モジュール18−1,18−2は同じ構成を有し、CPU22、デバイスインタフェース26−11,26−12,26−21、26−22、メモリ28−1、28−2、DMA処理部30−1,30−2を設けている。
更にドライブエンクロージャ20−1,20−2には例えばハードディスクドライブを用いたディスク装置32−11〜32−15,32−21〜32−25が設けられている。尚、RAID装置10は最小構成を例にとっており、最大構成としては2つの制御モジュール18−1,18−2を8つに増設することができ、またドライブエンクロージャについても拡張筐体を使用することで必要に応じて更に増設することができる。
また制御モジュール18−1,18−2に設けたメモリ28−1,28−2にはキャッシュメモリとしての使用領域及び入出力制御に必要な制御テーブルの割り当て領域が確保されている。
図3は本発明によるRAID装置の機能構成のブロック図である。図3において、RAID装置10に設けた制御モジュール18−1,18−2は、チャネルアダプタ16−11,16−21によりサーバ12のチャネル34に接続されている。チャネル34は、サーバ12においてRAID装置10に対する入出力要求が発生した際に、入出力要求に応じたコマンドをチャネルインタフェースの接続を確立した後に発行する。
チャネル34はRAID装置10に対しコマンドを発行した後、RAID装置10からの正常終了応答を待っており、インタフェース接続確立からの経過時間を検出し、これを予め設定したタイムアウト時間T1により監視するインタフェース接続チェックICCによる監視処理を行っている。
チャネル34においてインタフェース接続チェックによるタイムアウト時間T1以内にRAID装置10から発行コマンドに対する正常終了応答が得られない場合は、タイムアウトエラーと判定し、RAID装置10とのインタフェース接続を切り離し、エラー終了とし、それ以降の入出力処理を抑止することになる。
RAID装置10の制御モジュール18−1,18−2は同じ機能構成を備える。これを制御モジュール18−1について説明すると、制御モジュール18−1には入出力制御部35−1が設けられ、入出力制御部35−1に対しては論理的なボリューム36−1が接続されている。
入出力制御部35−1には、リソース処理部38−1、コピー処理部40−1、キャッシュ制御部44−1、RAID制御部46−1が設けられている。
リソース処理部38−1は上位装置であるサーバ12からの入出力要求の排他や監視を行う。コピー処理部40−1はRAID装置内部及び外部の別のRAID装置との間でボリューム単位でのコピー処理を行う。
キャッシュ制御部44−1は、ユーザデータ管理とキャッシュ制御を行う。キャッシュ制御部44−1におけるユーザデータ管理は、ボリューム36−1に対し入出力処理が実行されたユーザファイルを、メモリ28−1に設けたユーザデータ管理テーブル52−1を使用して管理する。
ユーザデータ管理テーブル52−1は2重化されており、同じ内容を持つテーブルが制御モジュール18−2のメモリ28−2にミラーテーブル54−2として設けられている。この点は制御モジュール18−2側についても同様であり、メモリ28−2にユーザデータ管理テーブル52−2が設けられ、これと同じ内容を持つミラーテーブル54−1が制御モジュール18−1のメモリ28−1に設けられている。
このため、制御モジュール18−1のキャッシュ制御部44−1でユーザデータ管理テーブル52−1を更新する際には、更新後にDMA30−1,30−2によるモジュール間通信を使用して、制御モジュール18−2のメモリ28−2に設けたミラーテーブル54−2の内容も同時に更新することで、2重化している。
このようなユーザデータ管理テーブル52−1,52−2に対し同じ内容のミラーテーブル54−1,54−2を設けた二重化は、制御モジュール18−1,18−2のいずれか一方が故障により縮退した際に、正常な制御モジュール側で縮退前の処理を直ちに引き継ぐためである。
またキャッシュ制御部44−1は、サーバ12からのリード要求及びライト要求に対するキャッシュメモリの管理を行っており、リード要求またはライト要求に対するヒットとミスヒットの判定、及びステージングやライトバックなどのスケジュール処理を実行する。キャッシュ制御部44−1が管理するメモリ28−1のキャッシュ領域は、ローカルキャッシュ領域48−1とミラー領域50−1に分けられている。ローカルキャッシュ領域48−1とミラー領域50−1は、全キャッシュ領域の2分の1の領域をそれぞれ割り当てている。
ローカルキャッシュ領域48−1にはサーバ12の入出力要求に伴うユーザデータが格納され、ユーザデータはリードデータとライトデータ(ダーティデータ)に分類される。リードデータは、サーバ12のリード要求によりボリューム36−1からローカルキャッシュ領域48−1にステージングされたデータである。またライトデータ(ダーティデータ)はサーバ12のライト要求により書き込まれたデータであり、別の制御モジュール18−2のミラー領域50−2に対する同じデータの書込みにより2重化してデータの保証を行っている。
メモリ28−1におけるローカルキャッシュ領域48−1とミラー領域50−1の関係は制御モジュール18−2のメモリ28−2についても同様であり、自分自身のローカルキャッシュ領域48−2に対し、サーバ12からの入出力要求に伴うリードデータとライトデータを格納しており、ライトデータについては別の制御モジュール18−1のミラー領域50−1に同じデータを格納して、2重化によりデータ保証を行っている。
ローカルキャッシュ領域48−1,48−2のライトデータのミラー領域50−1,50−2に対する書込みによる2重化は、制御モジュール18−1,18−2のいずれか一方が故障により縮退した際に、正常な制御モジュール側で縮退前のユーザデータをそのまま引き継ぐことを可能とする。
制御モジュール18−1,18−2におけるローカルキャッシュ領域48−1,48−2及びミラー領域50−1,50−2の関係は、RAID装置10に少なくとも3つの制御モジュールを設けた場合に有効に機能するサイクリック構成を採用している。
3つ以上の制御モジュールで構成されるサイクリック構成にあっては、複数の制御モジュールのうちの1つが故障により縮退した場合、縮退した制御モジュール上に存在したライトデータを、そのミラー領域を保持している正常な制御モジュールが引き継ぐことになる。3つ構成の制御モジュールで1つが縮退した場合、残り2つの制御モジュールで2重化構成が継続でき、更に1つが縮退すると、2重化は解除することになる。
RAID制御部46−1は、RAIDレベル3、RAIDレベル4、RAIDレベル5といった各RAIDレベルでのディスクエンクロージャ側に対する入出力処理を制御する。例えば制御モジュール18−1にあっては、ボリューム36−1に対しRAIDレベル4で入出力処理を実行しており、一方、制御モジュール18−2のRAID制御部46−2にあっては、ボリューム36−2に対しRAIDレベル5で入出力処理を実行している。
更に入出力制御部35−1には、本発明の装置間通信接続の監視、即ち制御モジュール18−1,18−2間のモジュール間通信接続を監視するための機能として、経過時間検出部60−1と装置間通信監視部62−1が設けられている。
経過時間検出部60−1は、制御モジュール18−1でサーバ12のチャネル34から処理要求を受信してから、DMA30−1,30−2によるモジュール間通信接続の確立により、制御モジュール18−2に対し階層的な処理要求を送信するまでの経過時間Tを検出する。
この制御モジュール18−1,18−2の間でモジュール間通信を必要とするサーバ12のチャネル34からの処理要求としては、ユーザデータ管理テーブル52−1を2重化するユーザデータ管理処理のための処理要求、及びローカルキャッシュ領域48−1に対するライトデータの書込みを2重化するためのライト要求がある。それ以外にも、制御モジュール18−1に対する処理要求で、その下位に位置する制御モジュール18−2に処理を要求し、制御モジュール18−2の処理結果を応答する適宜の処理要求が含まれる。
装置間通信監視部62−1は、制御モジュール18−1,18−2の間でモジュール間通信接続を確立して通信を開始した際に、モジュール間通信を監視する所定の固定タイムアウト時間T2から経過時間検出部60−1で検出したTを差し引いた可変タイムアウト時間Txを
Tx=T2−T
として算出し、この可変タイムアウト時間Txにより、モジュール間通信の経過時間Tを監視する。
ここで制御モジュール18−1,18−2におけるモジュール間通信を開始するための固定タイムアウト時間T2は、チャネル34側で行っているインタフェース接続チェックICCにおけるタイムアウト時間T1より短い時間を設定しており、サーバ12のチャネル34におけるインタフェース接続チェックのタイムアウト時間T1に達する前にRAID装置10側でタイムアウト時間T2に達して、タイムアウトエラーによりチャネル34との接続を開放する要求を行い、これによってチャネル34側でのタイムアウトエラーが起きないようにしている。
装置間通信監視部62−1は、算出した可変タイムアウト時間Txを使用してモジュール間通信接続の経過時間Tを監視している間に経過時間Tが可変タイムアウト時間Txに達しても制御モジュール18−2側から処理の終了応答が得られない場合には、モジュール間通信接続のタイムアウトエラーを判定し、チャネル34に対しインタフェース接続の切り離しを要求し、これによってチャネル34側におけるインタフェース接続チェック(ICC)によるタイムアウト時間T1がタイムオーバーとなることによるタイムアウトエラーの発生を防いでいる。
モジュール間通信接続の可変タイムアウト時間Txによるタイムアウトエラーにより、チャネル34とのインタフェース接続を切り離した後については、処理依頼先となる制御モジュール18−2からの正常終了応答の受信を監視しており、制御モジュール18−2から正常終了応答が得られると、チャネル34に対しインタフェースの接続要求を行い、これを受けてチャネル34がインタフェースの再接続を確立すると、このとき制御モジュール18−2から受けている正常終了応答を制御モジュール18−1からチャネル34に送信し、チャネル34からの処理要求を正常終了させることになる。
このような制御モジュール18−1側の機能構成は制御モジュール18−2についても同様であり、入出力制御部35−2にはリソース処理部38−2、コピー処理部40−2、キャッシュ制御部44−2及びRAID制御部46−2が設けられる。
また、制御モジュール18−2に対しサーバ12のチャネル34から処理要求が行われた際のモジュール間通信接続を監視するため、経過時間検出部60−2と装置間通信監視部62−2が設けられている。更にメモリ28−2については、自分自身のローカルキャッシュ領域48−2に加え、制御モジュール18−1側のローカルキャッシュ領域48−1に対応したミラー領域50−2を設けている。また自分自身のユーザデータ管理テーブル52−2に加え、制御モジュール18−1のユーザデータ管理テーブル52−1を二重化するためのミラーテーブル54−2を設けている。
図4は、RAID装置10に設けた制御モジュール18−1がサーバ12のチャネル34からの処理要求を実行した際のモジュール間通信接続の監視処理を行う場合の機能構成である。図4において、サーバ12のチャネル34がRAID装置10の制御モジュール18−1に処理要求を行い、これに基づき制御モジュール18−1がDMA30−1,30−2によるモジュール間通信接続を確立して、制御モジュール18−2に階層的な処理を要求した場合のモジュール間通信接続の監視のため、制御モジュール18−1の入出力制御部35−1に設けている経過時間検出部60−1と装置間通信監視部62−1の機能が有効となる。
またサーバ12のチャネル34からの入出力要求がユーザデータのライト要求であった場合には、メモリ28−1のローカルキャッシュ領域48−1に対するライトデータの格納または更新が行われ、また、このユーザデータの更新に伴い、ユーザデータ管理テーブル52−1の登録もしくは更新が行われることから、それぞれを有効な機能として示している。
また二重化のミラー先となる制御モジュール18−2については、メモリ28−2のローカルキャッシュ領域48−1に対応したミラー領域50−2が有効となり、またユーザデータ管理テーブル52−1に対応したミラーテーブル54−2が有効となることから、これらを有効な部分として示している。
図5は図4の機能構成につき、本発明によるモジュール間通信接続の監視処理の説明図である。図5において、チャネル34及びRAID装置10に設けた制御モジュール18−1,18−2の中の処理は、縦軸方向が経過時間tを表わしている。
チャネル34において、時刻t1でRAID装置10に対する処理要求が発生すると、チャネルインタフェース状態64を接続65とし、RAID装置10の制御モジュール18−1に処理要求66を送信する。制御モジュール18−1にあっては、処理要求66をチャネル34から受信した時刻t1でタイマを起動し、時刻t2で制御モジュール18−1から制御モジュール18−2に対しモジュール間通信接続を確立して処理要求72を送信するまでの経過時間Tを検出する。
ここで、時刻t1で処理要求66を受信してから時刻t2でモジュール間通信接続を確立して処理要求72を発行するまでに何らかの理由により処理遅延70が発生していたとすると、経過時間Tは、その分、長くなる。本発明にあっては、時刻t2でモジュール間通信接続を確立した際に検出された経過時間Tに基づき、モジュール間通信について定めた所定の固定タイムアウト時間T2から、時刻t1からt2までの経過時間Tを差し引いた可変タイムアウト時間Txを算出し、この可変タイムアウト時間Txを使用して時刻t2以降のモジュール間通信チェック74を実行する。
一方、チャネル34にあっては、時刻t1でインタフェース接続によりRAID装置10に対し処理要求66を発行すると同時に、所定のタイムアウト時間T1を設定してインタフェース接続チェック(ICC)68を行っている。ここで、時刻t2で可変タイムアウト時間Txの算出に使用しているモジュール間通信の固定タイムアウト時間T2は、チャネル34におけるインタフェース接続チェック68のタイムアウト時間T1より短い時間である。
時刻t2で制御モジュール18−2に対し処理要求72を発行し、制御モジュール18−2で処理実行82−1を行っている途中の時刻t3でモジュール間通信接続の開始時刻t2からの経過時間が可変タイムアウト時間Txを超えると、タイムアウトエラーが発生する。
このモジュール間通信チェック74におけるタイムアウトエラーに基づき、制御モジュール18−1はチャネル34に対し接続解除要求78を行う。これを受けてチャネル34は、チャネルインタフェース状態64を接続解除80とする。このようにRAID装置10側の制御モジュール18−1における処理遅延70により、モジュール間通信チェックにつきタイムアウトエラーが先に発生することで、チャネル34にあっては、インタフェース接続チェック68によるタイムアウト時間T1に達する時刻t4以前の時刻t3で接続解除要求78が行われてインタフェース接続が切り離され、これによってRAID装置10側で処理遅延があっても、チャネル34におけるインタフェース接続チェック68のタイムアウトエラーの発生を未然に防いでいる。
また時刻t3でモジュール間通信のタイムアウトエラーを判別してチャネル34との接続を解除した場合には、制御モジュール18−2の処理実行82−1がエラーを起こしている可能性が高いので、時刻t2で発行した処理要求72をキャンセルし、再度、同じ内容の処理要求76を装置間通信を確立して制御モジュール18−2発行して同じ処理実行82−2を行い、制御モジュール18−2からの処理応答を待つ。時刻t5で処理応答84が得られると、制御モジュール18−1は時刻t6でチャネル34に対しインタフェース再接続を要求し、接続86が確立されると、処理応答85を転送し、一連の処理を終了している。
なお、タイムアウトエラー後に制御モジュール18−2から処理実行82−1の処理応答が得られたとしても、最初の処理要求72はタイムアウトエラーの際にキャンセルされているため、この処理応答は破棄される。
図6は図5におけるモジュール間通信チェックによるタイムアウトエラーが発生した際のチャネルのインタフェース接続の解除と解除後の再接続の詳細を示した説明図である。図6において、制御モジュール18−1でモジュール間通信の経過時間が可変タイムアウト時間Txを超えてタイムアウトエラー88が発生すると、チャネル34に対し接続解除要求78が行われる。この接続解除要求78を受けて、チャネル34はチャネルインタフェース状態64を、それまでの接続65から接続解除80とし、接続解除応答90を制御モジュール18−1に返す。
接続解除応答90を受けた制御モジュール18−1は、図5の時刻t2の処理要求72による制御モジュール18−2の処理実行82−1がエラーを起こしている可能性が高いので、時刻t2で発行した処理要求72をキャンセルし、再度、同じ内容の処理要求76を装置間通信を確立して制御モジュール18−2に発行して同じ内容の処理実行82−2を行い、制御モジュール18−2からの処理応答を待つ。
制御モジュール18−2において、時刻t5で処理実行82が正常終了となると、制御モジュール18−2は接続要求92を制御モジュール18−1に対し発行し、これを受けて制御モジュール18−1は時刻t51でチャネル34に対し接続要求94を発行する。
このためチャネル34は、時刻t52でチャネルインタフェース状態64を接続86としてインタフェース接続を確立し、接続応答96を制御モジュール18−1に返し、接続応答96は更に、そのとき確立されているモジュール間通信を介して制御モジュール18−2に伝えられる。
このチャネルからの接続応答96を受けた制御モジュール18−2は、正常終了の処理応答84をモジュール間通信を介して制御モジュール18−1に伝え、これを受けて制御モジュール18−1は処理応答85をインタフェース接続を介してチャネル34に伝え、RAID装置10側のモジュール間通信でタイムアウトエラーが発生した後の処理正常終了をチャネル34に割込み的に応答し、正常終了を判別したチャネル34は、時刻t7でインタフェース状態を接続解除98とする。
図7は図5及び図6に対応した本発明によるモジュール間通信監視処理のフローチャートであり、図4に示した入出力制御部35−1に設けた経過時間検出部60−1と装置間通信監視部62−1の処理機能として実行される。
図7において、モジュール間通信監視処理は、チャネルからの処理要求を受けた制御モジュール18−1がステップS1でタイマTをリセットスタートした後、ステップS2で受信コマンドを解読し、コマンド内容から制御モジュール18−2に対するモジュール間通信を確立して処理を依頼する内容であることを認識する。
続いて、ステップS3で制御モジュール18−2との間にモジュール間通信を確立して階層化処理を要求し、ステップS4でタイマTを停止する。このときタイマTには、チャネルから処理要求を受信した時刻からモジュール間通信を確立して階層化処理を要求するまでの経過時間が保持されている。
次にステップS5でモジュール間通信監視のための可変タイムアウト時間Txを
Tx=T2−T
として算出する。続いてステップS6でタイマTをリセットスタートし、ステップS7で階層処理の終了応答が制御モジュール18−2からあるか否かチェックし、ない場合には、ステップS8で、時刻t2からの経過時間がステップS5で算出した可変タイムアウト時間Tx以上となったか否か監視している。
ここで、制御モジュール18−1がチャネルからコマンドを受信してから制御モジュール18−2にモジュール間通信を確立して階層処理要求を行うまでに処理遅れがなかった場合には、時刻t2からの経過時間が可変タイムアウト時間Txに達する前に制御モジュール18−2から階層処理の終了応答があり、これがステップS7で判別され、ステップS15に進み、チャネルに対し正常終了を応答することになる。
一方、制御モジュール18−1でチャネルからコマンドを受信してからモジュール間通信接続を確立して制御モジュール18−2に階層的処理要求を発行するまでに処理が遅延して時間がかかった場合には、ステップS7で階層化処理の終了応答が得られる前に、ステップS8で時刻t2からの経過時間が可変タイムアウト時間Txに達し、ステップS9に進んでモジュール間通信のタイムアウトエラーが判定される。
このタイムアウトエラーが判定された場合には、ステップS10でチャネル34に対しインタフェース接続の解除要求を行い、ステップS11でチャネル34からインタフェース接続解除応答が得られると、ステップS12に進み、ステップS3の階層化処理の要求をキャンセルし、再度、階層化処理を制御モジュール18−2に要求する。
ステップS13では、制御モジュール18−2からの階層的処理の終了応答の有無をチェックしており、制御モジュール18−2から処理応答が得られると、ステップS14に進み、チャネル34に対しインタフェース接続を要求し、ステップS15でチャネルからインタフェース接続応答が得られると、ステップS16でチャネル34に対し正常終了を応答することになる。
図8はサーバからの入出力要求に対しRAID装置の制御モジュール18−1,18−2でモジュール間通信により2重化処理を実行する本発明による通信接続監視処理の説明図である。
図8において、チャネル34から時刻t1にRAID装置10の制御モジュール18−1に対しユーザデータのライト要求などの入出力要求100が発生したとする。この入出力要求100の発生に伴い、チャネル34においては、インタフェース接続チェック102の監視機能を有効とし、チャネルインタフェース接続状態64の接続101につき、タイムアウト時間T1による接続経過時間の監視を開始している。
入出力要求100を受けたRAID装置10の制御モジュール18−1は、時刻t2から入出力処理104を実行する。この入出力処理104は、例えば入出力要求100がライト要求であることから、図4のローカルキャッシュ領域48−1に対するライトデータの書込み、または既に書き込んでいるライトデータの更新を実行する。
同時に、制御モジュール18−2に対しモジュール間通信接続を確立し、入出力情報の2重化処理106のトランザクションを実行する。この入出力情報の2重化処理106は、ローカルキャッシュ領域48−1に対応した制御モジュール18−2のミラー領域50−2に、同じライトデータを格納または更新する処理となる。
また制御モジュール18−1にあっては、時刻t2におけるモジュール間通信接続の確立時点でタイマTを起動し、経過時間の検出を開始している。時刻t3で制御モジュール18−1の入出力処理104、及び制御モジュール18−2における入出力情報2重化処理106が終了すると、タイマTを停止することで、タイマTには時刻t2〜t3の入出力処理104と入出力情報二重化処理106のトランザクションに要した経過時間Tが保持される。
そこで本発明にあっては、最初のトランザクションの経過時間Tに基づいて、次のユーザデータ管理に伴うトランザクションにおけるモジュール間通信接続を監視するための可変タイムアウト時間Txを、固定タイムアウト時間T2から経過時間Tを差し引くことで求め、時刻t4で再びモジュール間通信接続を確立して制御モジュール18−1でユーザデータ管理処理110−1を実行すると同時に、モジュール間通信を利用して制御モジュール18−2でユーザデータ管理2重化処理112−1を実行する。
この時刻t4からのユーザデータ管理のトランザクションの開始と同時に、タイマTをスタートして経過時間を検出し、算出した可変タイムアウト時間Txによる監視を開始する。そして、時刻t4のユーザデータ管理のトランザクション開始時刻からの経過時間Tが時刻t5で可変タイムアウト時間Txに達すると、タイムアウトエラー116が判定され、チャネル34に対しインタフェースに対する接続解除要求118が発行される。
これを受けてチャネル34はチャネルインタフェース状態64を接続解除120とする。このため、チャネル34におけるインタフェース接続チェック102によるタイムアウト時間T1に、時刻t6に達する前にRAID装置10側のモジュール間通信接続チェックによるタイムアウトエラーでインタフェース接続が解除され、RAID装置10側でモジュール間通信を伴う2つのトランザクションが連続して行われることで、処理に時間が掛かってもチャネル34においてインタフェース接続チェックによるタイムアウトエラーが発生することはない。
また時刻t5でモジュール間通信接続についてのタイムアウトエラー116が判定されてチャネル34との接続が解除された場合(チャネル34から接続応答が得られた場合)、制御モジュール18−1によるユーザデータ管理処理110−1および制御モジュール18−2によるユーザデータ管理2重化処理112−1はエラーを起こしている可能性が高いので、時刻t4で開始したユーザデータ管理のトランザクションをキャンセルし、再度、ユーザデータ管理処理のトランザクションを開始し、ユーザデータ管理処理110−2を実行すると同時に、モジュール間通信を利用して制御モジュール18−2でユーザデータ管理2重化処理112−2を実行する。
制御モジュール18−2が時刻t7で2重化処理を終了して正常終了の処理応答124を発行すると、これに基づき制御モジュール18−1は時刻t8でチャネル34に対しインタフェースの接続要求126を行い、チャネルインタフェース状態64が接続128に切り替わることによりチャネル34における入出力要求100を正常終了させることができる。
なお図8における時刻t5の接続解除要求118と処理応答126の詳細は、図6に示したのと同じになる。また、タイムアウトエラー後に制御モジュール18−2からユーザデータ管理2重化処理112−1の処理応答が得られたとしても、時刻t4における2重化処理のトランザクションはタイムアウトエラーの際にキャンセルされているため、この処理応答は破棄される。
図9及び図10は、図8に対応した本発明によるモジュール間通信接続監視処理のフローチャートである。図9のフローチャートは、制御モジュール18−1がチャネル34からモジュール間通信による2重化処理を必要とする入出力要求、例えばライトコマンドを受信した際に起動する。
モジュール間通信接続監視処理において、まずステップS1でチャネル34から受信したコマンドを解読した後、ステップS2で例えばライトデータをローカルキャッシュ領域に書き込むための入出力処理を実行する。続いてステップS3で2重化処理が必要か否かをチェックし、2重化処理が必要であれば、ステップS4でモジュール間通信を確立して、制御モジュール18−2に対し入出力情報の2重化処理を要求する。
このときステップS5でタイマTをリセットスタートして経過時間の検出を開始する。続いて、ステップS6で制御モジュール18−2からのミラー領域に対するライトデータの格納についての2重化処理応答が判別されると、ステップS7でタイマTを停止し、これによりタイマTはライト要求に対するローカルキャッシュ領域の格納と2重化のためのミラー領域への格納に要する1回目のトランザクションに要した経過時間が保持される。
続いてステップS8でモジュール間通信監視に使用する可変タイムアウト時間Txを固定タイムアウト時間T2から経過時間Tを差し引いて算出し、ステップS9でユーザデータ管理情報の更新を行った後、ステップS10でモジュール間通信を確立してミラーテーブルに対するユーザ管理情報の2重化処理を要求する。このときステップS11でタイマTをリセットスタートし、経過時間を検出する。
続いてステップS12で、制御モジュール18−2側における2重化終了応答、即ちミラーテーブルに対する2重化処理の終了応答の有無をチェックしており、終了応答がない場合には、ステップS13で経過時間Tが可変タイムアウト時間Txに達したか否か判別している。
経過時間Tが可変タイムアウト時間Txに達する前に制御モジュール18−2側からユーザデータ管理に関する2重化終了応答がステップS12で判別されると、図10のステップS22に進み、チャネル34に対し正常終了を応答して一連の処理を終了する。
これに対し、2重化終了応答が得られる前にステップS13で経過時間Tが可変タイムアウト時間Txに達した場合には、図10のステップS14でモジュール間通信のタイムアウトエラーを判定し、ステップS15でチャネル34に対しインタフェースの接続解除要求を行う。
続いて図10のステップS16に進み、チャネル34からインタフェースの接続解除応答があると、ステップS17に進み、ステップS9,S10のユーザデータ管理情報の更新と2重化要求をキャンセルし、再度、ユーザデータ管理情報の更新と2重化要求を実行する。
続いてステップS18で制御モジュール18−2からユーザデータ管理に関する2重化終了応答を待つ。制御モジュール18−2から2重化終了応答があると、ステップS19でチャネル34に対しインタフェースの接続要求を行い、ステップS20でチャネル34からインタフェース接続が確立されて接続応答が得られると、ステップS21で正常終了を応答して一連の処理を終了する。
なお、ステップS3で受信コマンドから得られた入出力処理が2重化を必要としない処理、例えばリード要求であった場合には、ステップS22でチャネル34に対し正常終了を応答して一連の処理を終了することになる。
また、図5〜図10の実施形態にあっては、図4に示したように、制御モジュール18−1に対しサーバ12から入出力要求が行われ、制御モジュール18−1がプライマリ、制御モジュール18−2がセカンダリとなった場合のモジュール間通信を伴う処理を例に取るものであったが、サーバ12が制御モジュール18−2に対し入出力要求を発行した場合には、制御モジュール18−2側がプライマリ、制御モジュール18−1側がセカンダリとなり、この場合には図4における制御モジュール18−1,18−2のモジュール間通信接続監視のための処理機能は入れ替わることになる。具体的には、プライマリとなる図3の制御モジュール18−2に設けている経過時間検出部60−2と装置間通信監視部62−2の機能が有効となる。
また上記の実施形態は、上位装置としてのサーバからの入出力要求を処理するRAID装置に適用した場合のモジュール間通信の監視を例に取るものであったが、本発明はこれに限定されず、上位装置に対し複数の処理装置を接続し、複数の処理装置間で装置間接続を行って、特定の処理装置に対する上位装置の入出力要求に対し、別の処理装置に対し階層的に処理を要求する場合につき、全く同様に適用することができる。
また本発明は、その目的と利点を損なうことのない適宜の変形を含み、更に上記の実施形態に示した数値による限定は受けない。
ここで本発明の特徴をまとめて列挙すると次の付記のようになる。
(付記)
(付記1)
ボリュームの入出力処理を実行する第1処理装置と第2処理装置を備え、上位装置とのインタフェース接続により前記第1処理装置で受信した処理要求を装置間通信により前記第2処理装置に送信して階層的に処理させ、第2処理装置から終了応答を前記第1処理装置を経由して前記上位装置に転送して前記インタフェース接続を解放させるRAID装置に於いて、
第1処理装置が上位装置から処理要求を受信してから装置間通信により第2処理装置に処理要求を送信するまでの経過時間を検出する経過時間検出部と、
前記第1処理装置と第2処理装置の装置間通信を監視する所定の固定タイムアウト時間から前記経過時間を差し引いた可変タイムアウト時間を算出して装置間通信の経過時間を監視する装置間通信監視部と、
を備えたことを特徴とするRAID装置。(1)
(付記2)
付記1記載のRAID装置に於いて、前記固定タイムアウト時間は、前記上位装置と第1処理装置とのインタフェース接続の経過時間を監視する所定のインタフェース接続チェック時間より短い時間であることを特徴とするRAID装置。
(付記3)
付記1記載のRAID装置に於いて、前記装置間通信監視部は、前記装置間通信の経過時間が前記可変タイムアウト時間を越えた場合、前記上位装置にインタフェース接続の切り離しを要求し、その後に前記第2処理装置から終了応答が得られた際に、前記上位装置にインタフェース再接続を要求して前記終了応答を送信することを特徴とするRAID装置。(2)
(付記4)
付記1記載のRAID装置に於いて、
前記経過時間検出部は、第1処理装置が上位装置から処理要求を受信してから装置間通信により第2処理装置に第1処理要求を送信して終了応答を得るまでの経過時間を検出し、
装置間通信監視部は、固定タイムアウト時間から前記経過時間を差し引いた可変タイムアウト時間を算出し、装置間通信により第2処理装置に第2処理要求を送信して終了応答を得るまでの経過時間を監視することを特徴とするRAID装置。(3)
(付記5)
付記4記載のRAID装置に於いて、前記第1処理装置が装置間通信により第2処理装置に送信する処理要求は、前記入出力要求に伴う処理情報を2重化する処理要求であることを特徴とするRAID装置。
(付記6)
上位装置とのインタフェース接続により第1処理装置で受信した処理要求を装置間通信により第2処理装置に送信して階層的に処理させ、第2処理装置から終了応答を前記第1処理装置を経由して前記上位装置に転送して前記インタフェース接続を解放させるシステムに於いて、
第1処理装置が上位装置から処理要求を受信してから装置間通信により第2処理装置に処理要求を送信するまでの経過時間を検出する経過時間検出部と、
前記第1処理装置と第2処理装置の装置間通信を監視する所定の固定タイムアウト時間から前記経過時間を差し引いた可変タイムアウト時間を算出して装置間通信の経過時間を監視する装置間通信監視部と、
を備えたことを特徴とするシステム。
(付記7)
ボリュームの入出力処理を実行する第1処理装置と第2処理装置を備え、上位装置とのインタフェース接続により前記第1処理装置で受信した処理要求を装置間通信により前記第2処理装置に送信して階層的に処理させ、第2処理装置から終了応答を前記第1処理装置を経由して前記上位装置に転送して前記インタフェース接続を解放させるRAID装置の通信接続監視方法に於いて、
第1処理装置が上位装置から処理要求を受信してから装置間通信により第2処理装置に処理要求を送信するまでの経過時間を検出する経過時間検出ステップと、
前記第1処理装置と第2処理装置の装置間通信を監視する所定の固定タイムアウト時間から前記経過時間を差し引いた可変タイムアウト時間を算出して装置間通信の経過時間を監視する装置間通信監視ステップと、
を備えたことを特徴とする通信接続監視方法。(4)
(付記8)
付記7記載の通信接続監視方法に於いて、前記固定タイムアウト時間は、前記上位装置と第1処理装置とのインタフェース接続の経過時間を監視する所定のインタフェース接続チェック時間より短い時間であることを特徴とする通信接続監視方法。
(付記9)
付記7記載の通信接続監視方法に於いて、前記装置間通信監視ステップは、前記装置間通信の経過時間が前記可変タイムアウト時間を越えた場合、前記上位装置にインタフェース接続の切り離しを要求し、その後に前記第2処理装置から終了応答が得られた際に、前記上位装置にインタフェース再接続を要求して前記終了応答を送信することを特徴とする通信接続監視方法。
(付記10)
付記7記載の通信接続監視方法に於いて、
前記経過時間検出ステップは、第1処理装置が上位装置から処理要求を受信してから装置間通信により第2処理装置に第1処理要求を送信して終了応答を得るまでの経過時間を検出し、
装置間通信監視ステップは、固定タイムアウト時間から前記経過時間を差し引いた可変タイムアウト時間を算出し、装置間通信により第2処理装置に第2処理要求を送信して終了応答を得るまでの経過時間を監視することを特徴とする通信接続監視方法。
(付記11)
付記10記載の通信接続監視方法に於いて、前記第1処理装置が装置間通信により第2処理装置に送信する処理要求は、前記入出力要求に伴う処理情報を2重化する処理要求であることを特徴とする通信接続監視方法。
(付記12)
上位装置とのインタフェース接続により第1処理装置で受信した処理要求を装置間通信により第2処理装置に送信して階層的に処理させ、第2処理装置から終了応答を前記第1処理装置を経由して前記上位装置に転送して前記インタフェース接続を解放させる通信接続監視方法に於いて、
第1処理装置が上位装置から処理要求を受信してから装置間通信により第2処理装置に処理要求を送信するまでの経過時間を検出する経過時間検出ステップと、
前記第1処理装置と第2処理装置の装置間通信を監視する所定の固定タイムアウト時間から前記経過時間を差し引いた可変タイムアウト時間を算出して装置間通信の経過時間を監視する装置間通信監視ステップと、
を備えたことを特徴とする通信接続監視方法。
(付記13)
ボリュームの入出力処理を実行する第1処理装置と第2処理装置を備え、上位装置とのインタフェース接続により前記第1処理装置で受信した処理要求を装置間通信により前記第2処理装置に送信して階層的に処理させ、第2処理装置から終了応答を前記第1処理装置を経由して前記上位装置に転送して前記インタフェース接続を解放させるRAID装置に設けた前記第1処理装置のコンピュータに、
上位装置から処理要求を受信してから装置間通信により第2処理装置に処理要求を送信するまでの経過時間を検出する経過時間検出ステップと、
前記第1処理装置と第2処理装置の装置間通信を監視する所定の固定タイムアウト時間から前記経過時間を差し引いた可変タイムアウト時間を算出して装置間通信の経過時間を監視する装置間通信監視ステップと、
を実行させることを特徴とする通信接続監視プログラム。(5)
(付記14)
付記13記載の通信接続監視プログラムに於いて、前記固定タイムアウト時間は、前記上位装置と第1処理装置とのインタフェース接続の経過時間を監視する所定のインタフェース接続チェック時間より短い時間であることを特徴とする通信接続監視プログラム。
(付記15)
付記13記載の通信接続監視プログラムに於いて、前記装置間通信監視ステップは、前記装置間通信の経過時間が前記可変タイムアウト時間を越えた場合、前記上位装置にインタフェース接続の切り離しを要求し、その後に前記第2処理装置から終了応答が得られた際に、前記上位装置にインタフェース再接続を要求して前記終了応答を送信することを特徴とする通信接続監視プログラム。
(付記16)
付記13記載の通信接続監視プログラムに於いて、
前記経過時間検出ステップは、前記上位装置から処理要求を受信してから装置間通信により第2処理装置に第1処理要求を送信して終了応答を得るまでの経過時間を検出し、
装置間通信監視ステップは、固定タイムアウト時間から前記経過時間を差し引いた可変タイムアウト時間を算出し、装置間通信により第2処理装置に第2処理要求を送信して終了応答を得るまでの経過時間を監視することを特徴とする通信接続監視プログラム。
(付記17)
付記16記載の通信接続監視プログラムに於いて、前記装置間通信により第2処理装置に送信する処理要求は、前記入出力要求に伴う処理情報を2重化する処理要求であることを特徴とする通信接続監視プログラム。
(付記18)
上位装置とのインタフェース接続により第1処理装置で受信した処理要求を装置間通信により第2処理装置に送信して階層的に処理させ、第2処理装置から終了応答を前記第1処理装置を経由して前記上位装置に転送して前記インタフェース接続を解放させるシステムに設けた前記第1処理装置のコンピュータに、
第1処理装置が上位装置から処理要求を受信してから装置間通信により第2処理装置に処理要求を送信するまでの経過時間を検出する経過時間検出スステップと、
前記第1処理装置と第2処理装置の装置間通信を監視する所定の固定タイムアウト時間から前記経過時間を差し引いた可変タイムアウト時間を算出して装置間通信の経過時間を監視する装置間通信監視ステップと、
を実行させることを特徴とする通信接続監視方法。
本発明の原理説明図 本発明が適用されたRAID装置のハードウェア構成のブロック図 本発明によるRAID装置の機能構成のブロック図 モジュール間通信を必要とする処理要求を実行する際の本発明の機能構成のブロック図 本発明によるモジュール間通信接続の監視処理の説明図 図5におけるチャネルのインタフェース接続の解除と解除後の再接続の詳細を示した説明図 図5及び図6に対応した本発明によるモジュール間通信監視処理のフローチャート モジュール間通信により2重化処理を実行する際の本発明による通信接続監視処理の説明図 図8に対応した本発明によるモジュール間通信監視処理のフローチャート 図9に続くモジュール間通信監視処理のフローチャート 従来のチャネル側のインタフェース接続チェックとRAID装置側のモジュール間通信接続監視の連携処理の説明図 図11の従来例でモジュール間通信接続がタイムアウトした場合の処理の説明図 図11の従来例でモジュール間通信接続がタイムアウトする前に、チャネルとのインタフェース接続チェックがタイムアウトする問題の説明図
符号の説明
10:RAID装置
12,14:サーバ
16−11,16−12,16−21,16−22:チャネルアダプタ
18−1,18−2:制御モジュール
20−1,20−2:ドライブエンクロージャ
22,22−1,22−2:CPU
26−11,26−12,26−21,26−22:デバイスインタフェース
28−1,28−2:メモリ
30−1,30−2:DMA処理部
32−11〜32−15,32−21〜32−25:ディスク装置
34:チャネル
35−1,35−2:入出力制御部
36−1,36−2:ボリューム
38−1,38−2:リソース処理部
40−1,40−2:コピー処理部
42−1,42−2:ユーザデータ管理部
44−1,44−2:キャッシュ制御部
46−1,46−2:RAID制御部
48−1,48−2:ローカルキャッシュ領域
50−1,50−2:ミラー領域
52−1,52−2:ユーザデータ管理テーブル
60−1,60−2:経過時間検出部
54−1,54−2:ミラーテーブル
62−1,62−2:装置間通信監視部
64:チャネルインタフェース状態

Claims (4)

  1. ボリュームの入出力処理を実行する第1処理装置と第2処理装置を備え、上位装置とのインタフェース接続により前記第1処理装置で受信した処理要求を装置間通信により前記第2処理装置に送信して階層的に処理させ、第2処理装置から終了応答を前記第1処理装置を経由して前記上位装置に転送して前記インタフェース接続を解放させ、かつ上位装置側で所定のタイムアウト時間内に前記終了応答を検出できないとき前記インタフェース接続を切り離すRAID装置に於いて、
    第1処理装置が上位装置から処理要求を受信してから装置間通信により第2処理装置に処理要求を送信するまでの経過時間を検出する経過時間検出部と、
    前記第1処理装置と第2処理装置の装置間通信を監視する前記上位装置のタイムアウト時間より短い固定タイムアウト時間から前記経過時間を差し引いた可変タイムアウト時間を算出して装置間通信の経過時間を監視する装置間通信監視部と、
    を備え、
    前記装置間通信監視部は、前記装置間通信の経過時間が前記可変タイムアウト時間を越えた場合、前記上位装置にインタフェース接続の切り離しを要求し、その後に前記第2処理装置から終了応答が得られた際に、前記上位装置にインタフェース再接続を要求して前記終了応答を送信することを特徴とするRAID装置。
  2. 請求項1記載のRAID装置に於いて、
    前記経過時間検出部は、第1処理装置が上位装置から処理要求を受信してから装置間通信により第2処理装置に第1処理要求を送信して終了応答を得るまでの経過時間を検出し、
    装置間通信監視部は、固定タイムアウト時間から前記経過時間を差し引いた可変タイムアウト時間を算出し、装置間通信により第2処理装置に第2処理要求を送信して終了応答を得るまでの経過時間を監視することを特徴とするRAID装置。
  3. ボリュームの入出力処理を実行する第1処理装置と第2処理装置を備え、上位装置とのインタフェース接続により前記第1処理装置で受信した処理要求を装置間通信により前記第2処理装置に送信して階層的に処理させ、第2処理装置から終了応答を前記第1処理装置を経由して前記上位装置に転送して前記インタフェース接続を解放させ、かつ上位装置側で所定のタイムアウト時間内に前記終了応答を検出できないとき前記インタフェース接続を切り離すRAID装置の通信接続監視方法に於いて、
    第1処理装置が上位装置から処理要求を受信してから装置間通信により第2処理装置に処理要求を送信するまでの経過時間を検出する経過時間検出ステップと、
    前記第1処理装置と第2処理装置の装置間通信を監視する前記上位装置のタイムアウト時間より短い固定タイムアウト時間から前記経過時間を差し引いた可変タイムアウト時間を算出して装置間通信の経過時間を監視する装置間通信監視ステップと、
    を備え、
    前記装置間通信監視ステップは、前記装置間通信の経過時間が前記可変タイムアウト時間を越えた場合、前記上位装置にインタフェース接続の切り離しを要求し、その後に前記第2処理装置から終了応答が得られた際に、前記上位装置にインタフェース再接続を要求して前記終了応答を送信することを特徴とする通信接続監視方法。
  4. ボリュームの入出力処理を実行する第1処理装置と第2処理装置を備え、上位装置とのインタフェース接続により前記第1処理装置で受信した処理要求を装置間通信により前記第2処理装置に送信して階層的に処理させ、第2処理装置から終了応答を前記第1処理装置を経由して前記上位装置に転送して前記インタフェース接続を解放させ、かつ上位装置側で所定のタイムアウト時間内に前記終了応答を検出できないとき前記インタフェース接続を切り離すRAID装置に設けた前記第1処理装置のコンピュータに、
    上位装置から処理要求を受信してから装置間通信により第2処理装置に処理要求を送信するまでの経過時間を検出する経過時間検出ステップと、
    前記第1処理装置と第2処理装置の装置間通信を監視する前記上位装置のタイムアウト時間より短い固定タイムアウト時間から前記経過時間を差し引いた可変タイムアウト時間を算出して装置間通信の経過時間を監視する装置間通信監視ステップと、
    を実行させ、
    前記装置間通信監視ステップは、前記装置間通信の経過時間が前記可変タイムアウト時間を越えた場合、前記上位装置にインタフェース接続の切り離しを要求し、その後に前記第2処理装置から終了応答が得られた際に、前記上位装置にインタフェース再接続を要求して前記終了応答を送信することを特徴とするプログラム。
JP2005191512A 2005-06-30 2005-06-30 Raid装置、通信接続監視方法及びプログラム Expired - Fee Related JP4345979B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2005191512A JP4345979B2 (ja) 2005-06-30 2005-06-30 Raid装置、通信接続監視方法及びプログラム
US11/229,693 US7567514B2 (en) 2005-06-30 2005-09-20 RAID apparatus, and communication-connection monitoring method and program
CNB200510114555XA CN100451978C (zh) 2005-06-30 2005-10-26 Raid设备和通信-连接监控方法及程序
KR1020050115407A KR100736647B1 (ko) 2005-06-30 2005-11-30 Raid 장치, 통신 접속 감시 방법 및 프로그램 기록매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005191512A JP4345979B2 (ja) 2005-06-30 2005-06-30 Raid装置、通信接続監視方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2007011672A JP2007011672A (ja) 2007-01-18
JP4345979B2 true JP4345979B2 (ja) 2009-10-14

Family

ID=37591163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005191512A Expired - Fee Related JP4345979B2 (ja) 2005-06-30 2005-06-30 Raid装置、通信接続監視方法及びプログラム

Country Status (4)

Country Link
US (1) US7567514B2 (ja)
JP (1) JP4345979B2 (ja)
KR (1) KR100736647B1 (ja)
CN (1) CN100451978C (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101566931B (zh) 2003-08-14 2011-05-18 克姆佩棱特科技公司 虚拟磁盘驱动系统和方法
US9489150B2 (en) 2003-08-14 2016-11-08 Dell International L.L.C. System and method for transferring data between different raid data storage types for current data and replay data
US8041468B2 (en) * 2006-03-16 2011-10-18 Dell Products L.P. Method for dynamically cooling when detecting RAID controller with battery present in computer system
US7886111B2 (en) 2006-05-24 2011-02-08 Compellent Technologies System and method for raid management, reallocation, and restriping
CN101467122B (zh) * 2006-05-24 2012-07-04 克姆佩棱特科技公司 数据分级磁盘位置优化系统和方法
JP4639223B2 (ja) * 2007-12-27 2011-02-23 株式会社日立製作所 ストレージサブシステム
US7930438B2 (en) * 2008-08-11 2011-04-19 International Business Machines Corporation Interrogate processing for complex I/O link
US8355297B2 (en) * 2009-11-05 2013-01-15 Devon Works, LLC Watch assembly having a plurality of time-coordinated belts
JP5454177B2 (ja) 2010-02-01 2014-03-26 富士通株式会社 ディスクアレイ装置及びディスクアレイ装置制御方法
JP2011238038A (ja) * 2010-05-11 2011-11-24 Nec Corp ディスクアレイ装置、ディスクアレイ装置制御方式、及び、ディスクアレイ装置制御プログラム
WO2012116369A2 (en) * 2011-02-25 2012-08-30 Fusion-Io, Inc. Apparatus, system, and method for managing contents of a cache
JP5760632B2 (ja) * 2011-04-19 2015-08-12 富士通株式会社 ストレージ装置、制御装置及び制御方法
JP5903774B2 (ja) * 2011-04-19 2016-04-13 富士通株式会社 ストレージ装置、制御装置及び制御方法
JP5741544B2 (ja) * 2012-09-27 2015-07-01 日本電気株式会社 キャッシュ制御装置、ディスクアレイ装置、アレイコントローラおよびキャッシュ制御方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06121002A (ja) 1992-10-09 1994-04-28 Fujitsu Ltd 動的タイムアウト時間制御方式
JPH06161828A (ja) * 1992-11-18 1994-06-10 Fujitsu Ltd プロセッサ状態監視部
JP2826442B2 (ja) 1993-06-18 1998-11-18 株式会社エフ・エフ・シー 処理走行時間監視方法
US6078956A (en) * 1997-09-08 2000-06-20 International Business Machines Corporation World wide web end user response time monitor
US6411998B1 (en) * 1997-09-08 2002-06-25 International Business Machines Corporation World wide web internet delay monitor
JPH11120091A (ja) 1997-10-16 1999-04-30 Fuji Xerox Co Ltd タイムアウト制御方式
JP2000267894A (ja) 1999-03-17 2000-09-29 Nec Corp タイムアウト処理システム、処理方法及び記録媒体
JP3580355B2 (ja) 1999-07-29 2004-10-20 日本電気株式会社 情報処理システムおよびデータコピー方法
JP2001325165A (ja) 2000-05-16 2001-11-22 Hitachi Electronics Service Co Ltd ハードウエア障害監視システム及び障害監視コンピュータと監視センタ用コンピュータ並びに記録媒体
JP2002324014A (ja) 2001-04-26 2002-11-08 Meidensha Corp 監視制御システム
JP2003233514A (ja) 2002-02-12 2003-08-22 Hitachi Ltd 分散コンピュータシステム及びタイムアウト値の設定方法
JP2003303055A (ja) * 2002-04-09 2003-10-24 Hitachi Ltd ディスクアダプタとディスクアレイをスイッチを介して接続したディスク装置
JP2005100259A (ja) * 2003-09-26 2005-04-14 Hitachi Ltd ドライブの2重障害を防止するアレイ型ディスク装置、プログラム、及び方法
JP4317436B2 (ja) * 2003-12-16 2009-08-19 株式会社日立製作所 ディスクアレイシステム及びインターフェイス変換装置
JP4555029B2 (ja) * 2004-09-01 2010-09-29 株式会社日立製作所 ディスクアレイ装置
JP2006227964A (ja) * 2005-02-18 2006-08-31 Fujitsu Ltd ストレージシステム、処理方法及びプログラム

Also Published As

Publication number Publication date
US7567514B2 (en) 2009-07-28
CN100451978C (zh) 2009-01-14
CN1892610A (zh) 2007-01-10
US20070005885A1 (en) 2007-01-04
KR20070003516A (ko) 2007-01-05
KR100736647B1 (ko) 2007-07-09
JP2007011672A (ja) 2007-01-18

Similar Documents

Publication Publication Date Title
JP4345979B2 (ja) Raid装置、通信接続監視方法及びプログラム
US7587627B2 (en) System and method for disaster recovery of data
US6389555B2 (en) System and method for fail-over data transport
JP5090022B2 (ja) 計算機システム、アクセス制御方法及び管理計算機
US8607230B2 (en) Virtual computer system and migration method of virtual computer
US8433862B2 (en) Storage system for adjusting asynchronous copy load based on cache activity rate
JP4319017B2 (ja) ストレージシステムの制御方法、ストレージシステム、及び記憶装置
US7386760B2 (en) Method, system, and program for error handling in a dual adaptor system where one adaptor is a master
EP1760591B1 (en) System and method of managing access path
US7302615B2 (en) Method and system for analyzing loop interface failure
US7194562B2 (en) Method, system, and program for throttling data transfer
JP4317436B2 (ja) ディスクアレイシステム及びインターフェイス変換装置
JP2005196490A (ja) データ多重化のためのシステム及び方法
US20100064164A1 (en) Autonomic Component Service State Management for a Multiple Function Component
US20090228672A1 (en) Remote copy system and check method
US20040139196A1 (en) System and method for releasing device reservations
US20060265523A1 (en) Data transfer circuit and data transfer method
JP2006146302A (ja) 情報処理システム,ストレージ装置,ストレージ制御プログラム,及びストレージ制御プログラムを記録したコンピュータ読取可能な記録媒体
US20070226547A1 (en) Disk controller and controlling method of the same
JP4572138B2 (ja) サーバ装置、サーバシステム、及びサーバシステムでの系切り換え方法
JP2007334668A (ja) メモリダンプ方法、クラスタシステム、それを構成するノードおよびプログラム
JP2018116477A (ja) 情報処理装置および情報処理システム
JP6012479B2 (ja) 情報処理システム、制御方法および制御プログラム
JP2006134207A (ja) ストレージ仮想化装置およびそれを用いたコンピュータシステム
JP4193754B2 (ja) データ二重化方法とプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090120

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090616

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090709

R150 Certificate of patent or registration of utility model

Ref document number: 4345979

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130724

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees