JP2004094433A - フォールトトレラントコンピュータ及びそのディスク管理機構及びディスク管理プログラム - Google Patents

フォールトトレラントコンピュータ及びそのディスク管理機構及びディスク管理プログラム Download PDF

Info

Publication number
JP2004094433A
JP2004094433A JP2002252461A JP2002252461A JP2004094433A JP 2004094433 A JP2004094433 A JP 2004094433A JP 2002252461 A JP2002252461 A JP 2002252461A JP 2002252461 A JP2002252461 A JP 2002252461A JP 2004094433 A JP2004094433 A JP 2004094433A
Authority
JP
Japan
Prior art keywords
storage device
disk
multiplexing
access
access path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002252461A
Other languages
English (en)
Other versions
JP3862011B2 (ja
Inventor
Hiroaki Obara
小原 浩昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2002252461A priority Critical patent/JP3862011B2/ja
Priority to US10/652,030 priority patent/US20040153741A1/en
Publication of JP2004094433A publication Critical patent/JP2004094433A/ja
Application granted granted Critical
Publication of JP3862011B2 publication Critical patent/JP3862011B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • G06F11/201Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media between storage system components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1675Temporal synchronisation or re-synchronisation of redundant processing components
    • G06F11/1679Temporal synchronisation or re-synchronisation of redundant processing components at clock signal level

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

【課題】フォールトトレラントコンピュータにおいて記憶装置の故障などの障害が発生した場合、ディスク多重化の設定/復旧のための操作をエンドユーザが特別な技術的知識を要することなく簡単な操作で行うことができるディスク管理機構を提供する。
【解決手段】複数の記憶装置21、22を多重化するディスク多重化機構40と、複数の記憶装置に対して複数のアクセスパスを設定して多重化するアクセスパス多重化機構31、32を備えるフォールトトレラントコンピュータ10であって、記憶装置の故障などの障害が発生した場合、記憶装置の物理位置情報と当該記憶装置に対する操作内容を入力することにより、記憶装置の切り離しや組み込み操作を含む復旧操作を前記ディスク多重化機構40に対して指示するディスク管理機構50を備える。
【選択図】  図2

Description

【0001】
【発明の属する技術分野】
本発明は、複数のコンピューティングモジュールで、同じ命令列をクロック同期させて全く同じに処理するロックステップ方式のフォルトトレラントコンピュータ(fault tolerant computer)に関し、特に、ディスクの多重化設定/復旧に要する操作を簡易化するフォルトトレラントコンピュータのディスク管理機構に関する。
【0002】
【従来の技術】
従来のこの種のフォールトトレラントコンピュータ(fault tolerant computer)では、低価格化を図るためディスク多重化機能がソフトウェアによって実現されている場合が多い。
【0003】
例えば、オペレーティングシステムやユーザプログラムやユーザデータを格納するための2つの記憶装置によってディスク二重化を実現するフォールトトレラントコンピュータにおいては、2つの記憶装置のそれぞれに対して2経路以上設けられたアクセスパスをオペレーティングシステムに1つと見せるためのアクセスパス二重化機能と、オペレーティングシステムから2つの記憶装置を1つの仮想記憶装置として認識させるディスク二重化機能が設けられており、低価格化を図るフォールトトレラントコンピュータでは、これらの機能をソフトウェアによって実現しているものである。
【0004】
ところで、記憶装置の故障などの障害が発生した場合、仮想記憶装置は障害に対してシングルポイントと化してしまうため、フォールトトレラントコンピュータの特性から、速やかに故障した記憶装置を切り離して正常な記憶装置を組み込み、再度ディスクの二重化を行う必要がある。
【0005】
しかし、上記のように、ディスク二重化のための機能をソフトウェアによって実現しているフォールトトレラントコンピュータにおいて、エンドユーザが自らディスクの多重化設定や復旧操作を行う場合、故障した記憶装置の切り離しや組み込みに際して広範な技術的知識を要する煩雑な操作を行う必要があった。
【0006】
【発明が解決しようとする課題】
上述したように、従来のディスク二重化のための機能をソフトウェアによって実現しているフォールトトレラントコンピュータにおいて、エンドユーザが故障した記憶装置の切り離しや組み込みを行う場合、ハードウェアによって実現されている場合と比較し、広範な技術的知識を要する煩雑な操作を行うことが必要となり、エンドユーザが独自に当該操作を行うことは非常に困難になっている。
【0007】
このため、エンドユーザが自ら操作して障害が発生したディスク(記憶装置)の換装を行うことが困難であることから、フォールトトレラントコンピュータの特徴である大きなMTBF(Mean Time Between Failure:コンピュータシステムが故障してから次に故障するまでの平均時間)が小さくなり、フォールトトレラントコンピュータ本来の目的が損なわれてしまう結果となる。
【0008】
すなわち、従来においては、低価格のためにディスク二重化のための機能をソフトウェアによって実現したフォールトトレラントコンピュータでは、ディスクの多重化設定や復旧操作の操作性が劣化し、結果としてフォールトトレラントコンピュータの特徴を失ってしまうという問題点が存在している。
【0009】
本発明の目的は、フォールトトレラントコンピュータにおいて記憶装置の故障などの障害が発生した場合、ディスク多重化の設定/復旧のための操作をエンドユーザが特別な技術的知識を要することなく簡単な操作で行うことができるディスク管理機構を提供することにある。
【0010】
【課題を解決するための手段】
上記目的を達成する本発明のフォールトトレラントコンピュータは、複数の記憶装置を多重化するディスク多重化機構と、前記複数の記憶装置に対して複数のアクセスパスを設定して多重化するアクセスパス多重化機構を備えるフォールトトレラントコンピュータであって、前記記憶装置の故障などの障害が発生した場合、前記記憶装置の物理位置情報と当該記憶装置に対する操作内容を入力することにより、前記記憶装置の切り離しや組み込み操作を含む復旧操作を前記ディスク多重化機構に対して指示するディスク管理機構を備えることを特徴とする。
【0011】
請求項2の本発明のフォールトトレラントコンピュータは、前記ディスク管理機構は、前記記憶装置の前記物理位置情報と前記記憶装置へのアクセス経路情報を、前記記憶装置毎に対応付けて格納するデータベースを備え、前記データベースから取得した前記物理位置情報に対応する前記アクセス経路情報を前記操作内容と共に、前記ディスク多重化機構に送ることで前記記憶装置の切り離しや組み込み操作を含む復旧操作を指示することを特徴とする。
【0012】
請求項3の本発明のフォールトトレラントコンピュータは、前記データベースから取得した前記物理位置情報に対応する前記アクセス経路情報を前記アクセスパス多重化機構に送り、前記アクセス経路情報を管理する前記アクセスパス多重化機構から前記複数のアクセスパスを1つにまとめた仮想アクセスパスであって、前記ディスク多重化機構が前記記憶装置を認識するための前記仮想アクセスパスを受け取る第1のアクセス手段と、前記第1のアクセス手段によって受け取った前記仮想アクセスパスからなる経路情報と前記操作内容を、前記ディスク多重化機構に送る第2のアクセス手段を備えることを特徴とする。
【0013】
請求項4の本発明のフォールトトレラントコンピュータは、前記ディスク管理機構は、前記記憶装置の物理位置情報と当該記憶装置に対する操作内容の入力を受け付けると共に、前記ディスク多重化機構からの前記操作内容に対する操作結果を受け取るインタフェース手段を備えることを特徴とする。
【0014】
請求項5の本発明は、複数の記憶装置を多重化するディスク多重化機構と、前記複数の記憶装置に対して複数のアクセスパスを設定して多重化するアクセスパス多重化機構を備えるフォールトトレラントコンピュータのディスク管理機構であって、前記記憶装置の故障などの障害が発生した場合、前記記憶装置の物理位置情報と当該記憶装置に対する操作内容を入力することにより、前記記憶装置の切り離しや組み込み操作を含む復旧操作を前記ディスク多重化機構に対して指示することを特徴とする。
【0015】
請求項6の本発明のフォールトトレラントコンピュータのディスク管理機構は、前記記憶装置の前記物理位置情報と前記記憶装置へのアクセス経路情報を、前記記憶装置毎に対応付けて格納するデータベースを備え、前記データベースから取得した前記物理位置情報に対応する前記アクセス経路情報を前記操作内容と共に、前記ディスク多重化機構に送ることで前記記憶装置の切り離しや組み込み操作を含む復旧操作を指示することを特徴とする。
【0016】
請求項7の本発明のフォールトトレラントコンピュータのディスク管理機構は、前記データベースから取得した前記物理位置情報に対応する前記アクセス経路情報を前記アクセスパス多重化機構に送り、前記アクセス経路情報を管理する前記アクセスパス多重化機構から前記複数のアクセスパスを1つにまとめた仮想アクセスパスであって、前記ディスク多重化機構が前記記憶装置を認識するための前記仮想アクセスパスを受け取る第1のアクセス手段と、前記第1のアクセス手段によって受け取った前記仮想アクセスパスからなる経路情報と前記操作内容を、前記ディスク多重化機構に送る第2のアクセス手段を備えることを特徴とする。
【0017】
請求項8の本発明のフォールトトレラントコンピュータのディスク管理機構は、前記記憶装置の物理位置情報と当該記憶装置に対する操作内容の入力を受け付けると共に、前記ディスク多重化機構からの前記操作内容に対する操作結果を受け取るインタフェース手段を備えることを特徴とする。
【0018】
請求項9の本発明は、複数の記憶装置を多重化するディスク多重化機構と、前記複数の記憶装置に対して複数のアクセスパスを設定して多重化するアクセスパス多重化機構を備えるフォールトトレラントコンピュータのディスク管理プログラムであって、前記記憶装置の故障などの障害が発生した場合、前記記憶装置の物理位置情報と当該記憶装置に対する操作内容を入力することにより、前記記憶装置の切り離しや組み込み操作を含む復旧操作を前記ディスク多重化機構に対して指示する機能を実行することを特徴とする。
【0019】
請求項10の本発明のフォールトトレラントコンピュータのディスク管理プログラムは、前記記憶装置の前記物理位置情報と前記記憶装置へのアクセス経路情報を、前記記憶装置毎に対応付けて格納するデータベースから取得した前記物理位置情報に対応する前記アクセス経路情報を前記アクセスパス多重化機構に送り、前記アクセス経路情報を管理する前記アクセスパス多重化機構から前記複数のアクセスパスを1つにまとめた仮想アクセスパスであって、前記ディスク多重化機構が前記記憶装置を認識するための前記仮想アクセスパスを受け取る機能と、受け取った前記仮想アクセスパスからなる経路情報と前記操作内容を、前記ディスク多重化機構に送る機能とを実行することを特徴とする。
【0020】
請求項11の本発明のフォールトトレラントコンピュータのディスク管理プログラムは、前記記憶装置の物理位置情報と当該記憶装置に対する操作内容の入力を受け付けると共に、前記ディスク多重化機構からの前記操作内容に対する操作結果を受け取るインタフェース機能を実行することを特徴とする。
【0021】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して詳細に説明する。
【0022】
図1は、本発明を適用した実施の形態によるフォールトトレラントコンピュータの全体構成を示している。
【0023】
図1を参照すると、本実施の形態によるフォルトトレラントコンピュータ10は、複数のコンピューティングモジュール11、12を備えており、各コンピューティングモジュール11、12はそれぞれクロック同期して同じ命令列を処理し、各コンピューティングモジュールの処理結果を比較し、1個のコンピューティングモジュールで故障が発生しても、残りのコンピューティングモジュールにより処理を継続することができるようになっている。
【0024】
このコンピューティングモジュール11、12は、それぞれ複数のプロセッサ101、102、201、202と、プロセッサ外部バス401、402と、メモリ301、302を有している。
【0025】
フォールトトレラントサーバ10には、オペレーティングシステムやユーザプログラムやユーザデータを格納するための2つの記憶装置21、22と、該二つの記憶装置21、22への複数のアクセスパスを一つに束ねるアクセスパス二重化機構31、32と、該アクセスパス二重化機構31、32を介して記憶装置21、22をオペレーティングシステムやユーザプログラムから1つに見せるディスク二重化機構40と、該ディスク二重化機構40にアクセスし、記憶装置の障害、アクセスパスの障害等によりディスクの二重化が損なわれている時の復旧や新たな記憶装置の追加等を行う際のディスク二重化の設定/復旧操作においてエンドユーザに対して簡易なインタフェースを提供するディスク管理機構50が備えられている。なお、図1には、本実施の形態の特徴的な構成のみを記載し、他の一般的な構成については記載を省略してある。
【0026】
記憶装置21、22は、オペレーティングシステムやユーザプログラム、ユーザデータを格納している。フォールトトレラントコンピュータ10の特徴として、記憶装置21、22へのアクセスパスは2経路以上設けられ、これらのアクセスパスをオペレーティングシステムに一つのアクセスパスと見せるためのアクセスパス二重化機構31、32が設けられている。
【0027】
更に、このアクセスパス二重化機構31、32を介して記憶装置21、22は合計2つの記憶装置として見えることになるが、この2つの記憶装置21、22を二重化するディスク二重化機構40により、オペレーティングシステムから記憶装置21、22は一つの仮想記憶装置として認識することができる。
【0028】
ところで、記憶装置21、22の故障などの障害により、仮想記憶装置は障害に対してシングルポイントと化してしまうため、フォールトトレラントコンピュータの特性から、速やかに故障した記憶装置を正常な記憶装置と入れ替え、再度ディスクの二重化を行う必要がある。
【0029】
ここで、低価格なフォールトトレラントコンピュータの多くは、ディスク二重化機構40をソフトウェアによって実現している場合が多く、ソフトウェアで実現したディスク二重化機構40には、故障した記憶装置の切り離しや組み込みに広範囲の技術的知識を要する煩雑な処理を行う必要があるものが多く、エンドユーザが独自に該処理を行うことは、非常に困難が伴うものとなっている。
【0030】
そこで、本実施の形態においては、ディスク管理機構50が、ディスク二重化機構40とインタフェースを持ち、アクセスパス二重化機構31、32から実際のアクセス経路情報を取り出すことにより、障害が発生した記憶装置へのアクセス経路情報とアクセスパス二重化機構から取得するアクセス経路情報とのマッピングを行い、ディスク二重化機構40が管理する記憶装置を特定し、ディスク二重化機構40に対し、該当記憶装置の切り離しや組み込みの指示を行えるようにする。
【0031】
これにより、エンドユーザは記憶装置21、22の物理位置を把握しさえすれば、容易に記憶装置21、22の換装を実施することを可能とする。
【0032】
図2を参照すると、ディスク管理機構50は、アクセスパス二重化機構アクセス手段51と、ディスク二重化機構アクセス手段52と、インタフェース提供手段53と、物理位置アクセス経路変換DB(データベース)54を含む。
【0033】
アクセスパス二重化機構アクセス手段51は、アクセスパス二重化機構31、32にアクセスし、記憶装置21、22へのアクセス経路情報と、アクセスパス二重化機構31、32が二重化したディスク二重化機構40が操作するアクセス経路情報とのマッピング情報を取得する。
【0034】
ディスク二重化機構アクセス手段52は、ディスク二重化機構40にアクセスし、アクセス経路情報と操作種別(切り離しや組み込み)を指示することで、特定の記憶装置に関して、仮想記憶装置からの切り離し又は組み込みを実現する。
【0035】
インタフェース提供手段53は、エンドユーザから入力される記憶装置の物理位置情報に基づいて物理位置アクセス経路変換DB54により記憶装置のアクセス経路情報を取得し、該アクセス経路情報とエンドユーザから入力されるディスク二重化機構40に対する操作種別を取得し、アクセスパス二重化機構アクセス手段51及びディスク二重化機構アクセス手段52を使用することで、エンドユーザに対して簡易なインタフェースを提供する。
【0036】
物理位置アクセス経路変換DB54は、図3に示すように、記憶装置21、22を示す物理位置情報と、記憶装置21、22に対するアクセス経路情報とを対応つけて格納している。
【0037】
次に、図2及び図4のシーケンス図を参照して本実施の形態の動作について詳細に説明する。ここでは、図2に示すように、ディスク二重化機構40が記憶装置21、22を識別して制御するアクセスパスをそれぞれアクセスパスA、アクセスパスBとし、アクセスパス二重化機構31、32が記憶装置21、22に対して設けたアクセスパスをアクセスパスA1、A2及びアクセスパスB1、B2とする。
【0038】
まず、エンドユーザがインタフェース提供手段53に対し、操作したい記憶装置の物理位置情報(記憶装置21又は記憶装置22を指定)と操作内容(切り離し又は組み込みの指定)を入力する。
【0039】
次に、上記情報を受け取ったインタフェース提供手段53は、物理位置アクセス経路変換DB54にアクセスすることにより、物理位置情報から該当記憶装置のアクセス経路情報を取得する(図4のシーケンスA)。例えば、記憶装置21に故障が発生してその切り離し又は組み込みを行うために、物理位置情報として記憶装置21を指定した場合、図3に示す物理位置アクセス経路変換DB54から、記憶装置21に対応するアクセス経路情報として、(アクセスパスA―アクセスパスA1)と(アクセスパスA−アクセスパスA2)の情報が取得される。
【0040】
上記アクセス経路情報を取得したインタフェース提供手段53は、アクセスパス二重化機構アクセス手段51を介してアクセスパス二重化機構31、32に対して、上記アクセス経路情報を送信する。
【0041】
アクセス経路情報を取得したアクセスパス二重化機構31、32は、自らが管理するアクセス経路情報を照会し、送信されたアクセス経路情報が存在する場合には、アクセスパス二重化機構31或いは32が二重化した2つのアクセスパスを1つのアクセスパスとみなす仮想アクセスパスからなるアクセス経路情報をアクセスパス二重化機構アクセス手段51を介してインタフェース提供手段53に応答する(図4のシーケンスB)。
【0042】
ここで、仮想アクセスパスとは、ディスク二重化機構40がアクセスパスA1、A2、B1、B2によらず記憶装置21、22を識別できるようにするためのパスであり、アクセスパス二重化機構31の場合であれば、アクセスパスA1とA2をアクセスパスAと同じひとつの仮想アクセスパスAとして返答する。
【0043】
ディスク二重化機構40は、記憶装置21、22に対してアクセスパスA、Bを介して二重化の制御を行うだけであり、アクセスパス二重化機構31、32が設けたアクセスパスA1、A2、B1、B2については何ら把握しない。よって、ディスク二重化機構40が、アクセスパスA1、A2、B1、B2によらず記憶装置21、22を制御するために、上記のような仮想アクセスパスを用いる。
【0044】
さらに、インタフェース提供手段53は、取得した仮想アクセスパスに対するアクセス経路情報(記憶装置21であればアクセスパスA)と、エンドユーザから入力された操作内容を、ディスク二重化機構アクセス手段52を介してディスク二重化機構40に送信する。ディスク二重化機構40は、指定されたアクセス経路情報に対して、操作内容で指定された操作を実施し、その結果をディスク二重化機構アクセス手段53を介してインタフェース提供手段53に応答する(図4のシーケンスC)。これにより、インタフェース提供手段53によって、操作結果がエンドユーザに通知される。
【0045】
以上の動作により、エンドユーザは、記憶装置21、22の故障などの障害が発生した場合、記憶装置を指定する物理位置情報とその記憶装置に対する操作内容を入力するだけの簡単な操作で、記憶装置の切り離しや組み込みをディスク二重化機構40に対して指示することができるようになり、特別な技術的知識を有しなくとも二重化の設定/復旧に要する操作を行うことができる。
【0046】
本発明のフォルトトレラントコンピュータでは、ディスク管理機能を実行する各手段の機能をハードウェア的に実現することは勿論として、上記した各手段の機能を実行するディスク管理プログラム100をCPUで実行することにより、ソフトウェア的に実現することができる。このディスク管理プログラム100は、磁気ディスク、半導体メモリその他の記録媒体に格納され、その記録媒体からCPUのメモリにロードされ、CPUで実行されることにより、上述した各機能を実現する。
【0047】
以上好ましい実施の形態をあげて本発明を説明したが、本発明は必ずしも上記実施の形態に限定されるものではなく、その技術的思想の範囲内において様々に変形して実施することができる。
【0048】
上述した各実施の形態では、各ディスク二重化機構40によって2つの記憶装置を二重化する構成について説明したが、ディスク多重化機構によって3つ以上の記憶装置を多重化する構成においても本発明を同様に適用することができるのは言うまでもない。また、アクセスパス二重化機構についても、二重化に限らずアクセスパス多重化機構によって3つ以上のアクセスパスを設けた構成においても本発明を同様に適用することができる。
【0049】
【発明の効果】
以上説明したように本発明によれば、記憶装置の故障などの障害が発生した場合、記憶装置を指定する物理位置情報とその記憶装置に対する操作内容を入力するだけの簡単な操作で、記憶装置の切り離しや組み込みをディスク多重化機構に対して指示することができるようになり、エンドユーザは、内部のアクセス経路情報を把握することなく、かつ特別な技術的知識を有しなくとも極めて簡単な操作で多重化の設定/復旧に要する操作を行うことができるようになる。
【図面の簡単な説明】
【図1】本発明の実施の形態によるフォルトトレラントコンピュータの全体の構成を示すブロック図である。
【図2】本発明の実施の形態によるフォルトトレラントコンピュータのディスク管理機構の構成を示すブロック図である。
【図3】図2に示すディスク管理機構の物理位置アクセス経路変換DBの内容を説明する図である。
【図4】本発明の実施の形態によるフォルトトレラントコンピュータにおけるディスク管理機構の動作を説明するシーケンス図である。
【符号の説明】
10 フォルトトレラントコンピュータ
11、12 コンピューティングモジュール
21、22 記憶装置
31、32 アクセスパス二重化機構
40 ディスク二重化機構
50 ディスク管理機構
51 アクセスパス二重化機構アクセス手段
52 ディスク二重化機構アクセス手段
53 インタフェース提供手段
54 物理位置アクセス経路変換DB
A、A1、A2、B、B1、B2 アクセスパス
100 ディスク管理プログラム

Claims (11)

  1. 複数の記憶装置を多重化するディスク多重化機構と、前記複数の記憶装置に対して複数のアクセスパスを設定して多重化するアクセスパス多重化機構を備えるフォールトトレラントコンピュータであって、
    前記記憶装置の故障などの障害が発生した場合、前記記憶装置の物理位置情報と当該記憶装置に対する操作内容を入力することにより、前記記憶装置の切り離しや組み込み操作を含む復旧操作を前記ディスク多重化機構に対して指示するディスク管理機構を備えることを特徴とするフォールトトレラントコンピュータ。
  2. 前記ディスク管理機構は、
    前記記憶装置の前記物理位置情報と前記記憶装置へのアクセス経路情報を、前記記憶装置毎に対応付けて格納するデータベースを備え、
    前記データベースから取得した前記物理位置情報に対応する前記アクセス経路情報を前記操作内容と共に、前記ディスク多重化機構に送ることで前記記憶装置の切り離しや組み込み操作を含む復旧操作を指示することを特徴とする請求項1に記載のフォールトトレラントコンピュータ。
  3. 前記データベースから取得した前記物理位置情報に対応する前記アクセス経路情報を前記アクセスパス多重化機構に送り、前記アクセス経路情報を管理する前記アクセスパス多重化機構から前記複数のアクセスパスを1つにまとめた仮想アクセスパスであって、前記ディスク多重化機構が前記記憶装置を認識するための前記仮想アクセスパスを受け取る第1のアクセス手段と、
    前記第1のアクセス手段によって受け取った前記仮想アクセスパスからなる経路情報と前記操作内容を、前記ディスク多重化機構に送る第2のアクセス手段を備えることを特徴とする請求項2に記載のフォールトトレラントコンピュータ。
  4. 前記ディスク管理機構は、
    前記記憶装置の物理位置情報と当該記憶装置に対する操作内容の入力を受け付けると共に、前記ディスク多重化機構からの前記操作内容に対する操作結果を受け取るインタフェース手段を備えることを特徴とする請求項2又は請求項3に記載のフォールトトレラントコンピュータ。
  5. 複数の記憶装置を多重化するディスク多重化機構と、前記複数の記憶装置に対して複数のアクセスパスを設定して多重化するアクセスパス多重化機構を備えるフォールトトレラントコンピュータのディスク管理機構であって、
    前記記憶装置の故障などの障害が発生した場合、前記記憶装置の物理位置情報と当該記憶装置に対する操作内容を入力することにより、前記記憶装置の切り離しや組み込み操作を含む復旧操作を前記ディスク多重化機構に対して指示することを特徴とするフォールトトレラントコンピュータのディスク管理機構。
  6. 前記記憶装置の前記物理位置情報と前記記憶装置へのアクセス経路情報を、前記記憶装置毎に対応付けて格納するデータベースを備え、
    前記データベースから取得した前記物理位置情報に対応する前記アクセス経路情報を前記操作内容と共に、前記ディスク多重化機構に送ることで前記記憶装置の切り離しや組み込み操作を含む復旧操作を指示することを特徴とする請求項5に記載のフォールトトレラントコンピュータのディスク管理機構。
  7. 前記データベースから取得した前記物理位置情報に対応する前記アクセス経路情報を前記アクセスパス多重化機構に送り、前記アクセス経路情報を管理する前記アクセスパス多重化機構から前記複数のアクセスパスを1つにまとめた仮想アクセスパスであって、前記ディスク多重化機構が前記記憶装置を認識するための前記仮想アクセスパスを受け取る第1のアクセス手段と、
    前記第1のアクセス手段によって受け取った前記仮想アクセスパスからなる経路情報と前記操作内容を、前記ディスク多重化機構に送る第2のアクセス手段を備えることを特徴とする請求項6に記載のフォールトトレラントコンピュータのディスク管理機構。
  8. 前記記憶装置の物理位置情報と当該記憶装置に対する操作内容の入力を受け付けると共に、前記ディスク多重化機構からの前記操作内容に対する操作結果を受け取るインタフェース手段を備えることを特徴とする請求項6又は請求項7に記載のフォールトトレラントコンピュータのディスク管理機構。
  9. 複数の記憶装置を多重化するディスク多重化機構と、前記複数の記憶装置に対して複数のアクセスパスを設定して多重化するアクセスパス多重化機構を備えるフォールトトレラントコンピュータのディスク管理プログラムであって、
    前記記憶装置の故障などの障害が発生した場合、前記記憶装置の物理位置情報と当該記憶装置に対する操作内容を入力することにより、前記記憶装置の切り離しや組み込み操作を含む復旧操作を前記ディスク多重化機構に対して指示する機能を実行することを特徴とするフォールトトレラントコンピュータのディスク管理プログラム。
  10. 前記記憶装置の前記物理位置情報と前記記憶装置へのアクセス経路情報を、前記記憶装置毎に対応付けて格納するデータベースから取得した前記物理位置情報に対応する前記アクセス経路情報を前記アクセスパス多重化機構に送り、前記アクセス経路情報を管理する前記アクセスパス多重化機構から前記複数のアクセスパスを1つにまとめた仮想アクセスパスであって、前記ディスク多重化機構が前記記憶装置を認識するための前記仮想アクセスパスを受け取る機能と、
    受け取った前記仮想アクセスパスからなる経路情報と前記操作内容を、前記ディスク多重化機構に送る機能とを実行することを特徴とする請求項9に記載のフォールトトレラントコンピュータのディスク管理プログラム。
  11. 前記記憶装置の物理位置情報と当該記憶装置に対する操作内容の入力を受け付けると共に、前記ディスク多重化機構からの前記操作内容に対する操作結果を受け取るインタフェース機能を実行することを特徴とする請求項10に記載のフォールトトレラントコンピュータのディスク管理プログラム。
JP2002252461A 2002-08-30 2002-08-30 フォールトトレラントコンピュータ及びそのディスク管理機構及びディスク管理プログラム Expired - Fee Related JP3862011B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002252461A JP3862011B2 (ja) 2002-08-30 2002-08-30 フォールトトレラントコンピュータ及びそのディスク管理機構及びディスク管理プログラム
US10/652,030 US20040153741A1 (en) 2002-08-30 2003-09-02 Fault tolerant computer, and disk management mechanism and disk management program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002252461A JP3862011B2 (ja) 2002-08-30 2002-08-30 フォールトトレラントコンピュータ及びそのディスク管理機構及びディスク管理プログラム

Publications (2)

Publication Number Publication Date
JP2004094433A true JP2004094433A (ja) 2004-03-25
JP3862011B2 JP3862011B2 (ja) 2006-12-27

Family

ID=32058716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002252461A Expired - Fee Related JP3862011B2 (ja) 2002-08-30 2002-08-30 フォールトトレラントコンピュータ及びそのディスク管理機構及びディスク管理プログラム

Country Status (2)

Country Link
US (1) US20040153741A1 (ja)
JP (1) JP3862011B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006154880A (ja) * 2004-11-04 2006-06-15 Hitachi Ltd 情報処理システム及びアクセス方法
JP2008225534A (ja) * 2007-03-08 2008-09-25 Nec Corp 動的縮退装置、方法
JP2009193469A (ja) * 2008-02-15 2009-08-27 Nec Corp 動的切り替え装置、動的切り替え方法、及び動的切り替えプログラム
JP2009205630A (ja) * 2008-02-29 2009-09-10 Nec Corp フォールトトレラントサーバ、フルバックアップ方法、およびフルバックアッププログラム
JP2012063942A (ja) * 2010-09-15 2012-03-29 Nec System Technologies Ltd 情報処理装置及びその制御方法
JP2013206209A (ja) * 2012-03-29 2013-10-07 Fujitsu Ltd 制御プログラム、制御方法、記憶制御装置および情報処理システム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461302B2 (en) * 2004-08-13 2008-12-02 Panasas, Inc. System and method for I/O error recovery
US7757015B2 (en) * 2005-09-13 2010-07-13 International Business Machines Corporation Device, method and computer program product readable medium for determining the identity of a component
JP2007094578A (ja) * 2005-09-27 2007-04-12 Fujitsu Ltd ストレージシステム及びその構成部品交換処理方法
JP2007193887A (ja) * 2006-01-18 2007-08-02 Fujitsu Ltd ディスク装置およびディスク制御方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5708668A (en) * 1992-05-06 1998-01-13 International Business Machines Corporation Method and apparatus for operating an array of storage devices
US6073209A (en) * 1997-03-31 2000-06-06 Ark Research Corporation Data storage controller providing multiple hosts with access to multiple storage subsystems
US6341356B1 (en) * 1999-03-25 2002-01-22 International Business Machines Corporation System for I/O path load balancing and failure which can be ported to a plurality of operating environments

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006154880A (ja) * 2004-11-04 2006-06-15 Hitachi Ltd 情報処理システム及びアクセス方法
JP4617847B2 (ja) * 2004-11-04 2011-01-26 株式会社日立製作所 情報処理システム及びアクセス方法
US8036238B2 (en) 2004-11-04 2011-10-11 Hitachi, Ltd. Information processing system and access method
JP2008225534A (ja) * 2007-03-08 2008-09-25 Nec Corp 動的縮退装置、方法
JP2009193469A (ja) * 2008-02-15 2009-08-27 Nec Corp 動的切り替え装置、動的切り替え方法、及び動的切り替えプログラム
JP2009205630A (ja) * 2008-02-29 2009-09-10 Nec Corp フォールトトレラントサーバ、フルバックアップ方法、およびフルバックアッププログラム
JP2012063942A (ja) * 2010-09-15 2012-03-29 Nec System Technologies Ltd 情報処理装置及びその制御方法
JP2013206209A (ja) * 2012-03-29 2013-10-07 Fujitsu Ltd 制御プログラム、制御方法、記憶制御装置および情報処理システム

Also Published As

Publication number Publication date
JP3862011B2 (ja) 2006-12-27
US20040153741A1 (en) 2004-08-05

Similar Documents

Publication Publication Date Title
US8856589B1 (en) Failure protection in an environment including virtualization of networked storage resources
US7984253B1 (en) Architecture for virtualization of networked storage resources
US7827442B2 (en) Shelf management controller with hardware/software implemented dual redundant configuration
US7849262B1 (en) System and method for virtualization of networked storage resources
US7206863B1 (en) System and method for managing storage networks and providing virtualization of resources in such a network
US8086895B2 (en) Management method and system for managing replication by taking into account cluster storage accessibility a host computer
EP1402420B1 (en) Mirroring network data to establish virtual storage area network
US7430616B2 (en) System and method for reducing user-application interactions to archivable form
US6763436B2 (en) Redundant data storage and data recovery system
US7627779B2 (en) Multiple hierarichal/peer domain file server with domain based, cross domain cooperative fault handling mechanisms
US6594775B1 (en) Fault handling monitor transparently using multiple technologies for fault handling in a multiple hierarchal/peer domain file server with domain centered, cross domain cooperative fault handling mechanisms
US6839740B1 (en) System and method for performing virtual device I/O operations
US7620775B1 (en) System and method for managing storage networks and providing virtualization of resources in such a network using one or more ASICs
US8782245B1 (en) System and method for managing provisioning of storage resources in a network with virtualization of resources in such a network
US7315914B1 (en) Systems and methods for managing virtualized logical units using vendor specific storage array commands
US7620774B1 (en) System and method for managing storage networks and providing virtualization of resources in such a network using one or more control path controllers with an embedded ASIC on each controller
US20040139365A1 (en) High-availability disk control device and failure processing method thereof and high-availability disk subsystem
US8627005B1 (en) System and method for virtualization of networked storage resources
JP2007094611A (ja) 計算機システムとそのブート制御方法
JP2004021556A (ja) 記憶制御装置およびその制御方法
US8127307B1 (en) Methods and apparatus for storage virtualization system having switch level event processing
JP2004094433A (ja) フォールトトレラントコンピュータ及びそのディスク管理機構及びディスク管理プログラム
US20130086413A1 (en) Fast i/o failure detection and cluster wide failover
JP2006039897A (ja) マルチノードシステム、ノード間クロスバスイッチ、ノード、スイッチプログラム及びノードプログラム
JP2005293430A (ja) ブレード型ネットワーク中継装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060206

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060428

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060706

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060919

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091006

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101006

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111006

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121006

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131006

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees