JP2004102852A - ホットスタンバイ計算機システム - Google Patents

ホットスタンバイ計算機システム Download PDF

Info

Publication number
JP2004102852A
JP2004102852A JP2002266206A JP2002266206A JP2004102852A JP 2004102852 A JP2004102852 A JP 2004102852A JP 2002266206 A JP2002266206 A JP 2002266206A JP 2002266206 A JP2002266206 A JP 2002266206A JP 2004102852 A JP2004102852 A JP 2004102852A
Authority
JP
Japan
Prior art keywords
access
access request
computer
disk device
prohibited
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002266206A
Other languages
English (en)
Inventor
Masaya Ichikawa
市川 正也
Hidetomo Sanpei
三瓶 英智
Toshiyuki Ukai
鵜飼 敏之
Takaaki Haruna
春名 高明
Kenta Futase
二瀬 健太
Yuzuru Maya
真矢 讓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2002266206A priority Critical patent/JP2004102852A/ja
Priority to US10/608,010 priority patent/US20040139205A1/en
Publication of JP2004102852A publication Critical patent/JP2004102852A/ja
Priority to US12/219,957 priority patent/US20080301777A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component

Abstract

【課題】従来は、高速にホットスタンバイ切替処理を実行する技術を提供することができなかった。
【解決手段】本発明の一実施形態の計算機では、記憶部と、ドライバ手段とアクセス制御手段とを実行する制御部とを有する。ドライバ手段は、システムを起動したときに、共有ディスク装置内の構成情報を取得し、構成情報に基づいて、共有ディスク装置に対するアクセス要求を送信することができる活動状態に設定しておく。また、共有ディスク装置に対するアクセス要求を受信したときに、共有ディスク装置にアクセス要求を送信する。アクセス制御手段は、アクセス先ごとに禁止するアクセス要求を示した管理テーブルに基づいて、アプリケーションプログラムを実行することにより発行されたアクセス要求を送信するかどうかを判定し、禁止されていないアクセス先へのアクセス要求をドライバ手段に送信する。
【選択図】 図5

Description

【0001】
【発明の属する技術分野】
本発明は、現用系と待機系およびその共有ディスクから構成されるホットスタンバイシステムに係わり、共有ディスクの高速切替え方式に関する。
【0002】
【従来の技術】
オンライントランザクションの分野では、可用性向上のため、現用系計算機と、待機系計算機と、共有ディスク装置とから構成されるホットスタンバイのシステム構成が適用されている。
【0003】
従来のシステム構成のホットスタンバイ切替手順を以下に説明する。
【0004】
まず、現用系計算機の障害を検出すると、待機系計算機は、共有ディスク装置へのアクセス要求の発行が可能となるように活動化コマンドをデバイスドライバ手段に発行する。次に、デバイスドライバ手段は、ディスク装置にディスク内の構成情報と性能情報とを要求し、受付けたディスク内の構成情報等に基づいて、論理ボリュームごとに物理ディスク内の領域を特定するマップを作成することで、共有ディスクを確保する。
【0005】
尚、従来のシステム構成のホットスタンバイ切替技術としては、例えば、特許文献1がある。
【0006】
【特許文献1】
特開平10−289122号公報、要約
【0007】
【発明が解決しようとする課題】
従来のホットスタンバイ技術では、計算機は、障害を検出した後に、共有ディスク装置からディスク内の構成情報等を受付けて、その情報に基づいて、ディスクの確保を実施していた。
【0008】
従って、ホットスタンバイ切替処理に長時間かかっていたため、アプリケーションプログラムの実行待機状態・処理遅延状態が生じ、さらに、障害計算機によるアクセスが生じることによりデータ破壊等が生じる可能性があった。
【0009】
本発明の目的は、高速にホットスタンバイ切替処理を実行する技術を提供することにある。
【0010】
【課題を解決するための手段】
本発明の一実施形態の計算機システムでは、運用系切替により、運用系と待機系との運用が可能な複数の計算機と、計算機によりアクセスされるデータを格納する共有ディスク装置とを有する。この計算機は、記憶部と、ドライバ手段とアクセス制御手段とを実行する制御部とを有する。このドライバ手段は、システムを起動したときに、共有ディスク装置内の構成情報を取得し、構成情報に基づいて、共有ディスク装置に対するアクセス要求を送信することができる活動状態に設定しておく。また、共有ディスク装置に対するアクセス要求を受信したときに、共有ディスク装置にアクセス要求を送信する。また、アクセス制御手段は、アクセス先ごとに禁止するアクセス要求を示した管理テーブルに基づいて、アプリケーションプログラムを実行することにより発行されたアクセス要求を送信するかどうかを判定し、禁止されていないアクセス先へのアクセス要求をドライバ手段に送信する。
【0011】
また、上述した実施形態では、アクセス制御手段は、計算機が待機系で運用している場合であって運用系計算機に障害が発生したときは、実行するアプリケーションプログラムによるアクセス先に対するアクセス要求を禁止するように管理テーブルに登録するようにすることが好ましい。
【0012】
また、上述した実施形態では、さらに、オペレータにより入力された運用系切替コマンドを計算機に対して送信するコンソールとをすることが好ましい。また、アクセス制御手段は、計算機が待機系で運用している場合であって系切替コマンドを受信したときは、実行するアプリケーションプログラムによるアクセス先に対するアクセス要求を禁止するように管理テーブルに登録することが好ましい。
【0013】
さらに、アクセス制御手段は、前記アクセス要求として、少なくともライトを禁止するように前記管理テーブルに登録することが好ましい。
【0014】
また、上述した実施形態では、管理テーブルには、アクセス先ごとの禁止するリード又はライトのアクセス要求を示していることが好ましい。また、アクセス制御手段は、管理テーブルに基づいて、アプリケーションプログラムを実行することにより発行されたリード又はライトのアクセス要求を送信するかどうかを判定し、リード又はライトが禁止されていないアクセス先へのアクセス要求であるときはリード又はライトのアクセス要求をドライバ手段に送信することが好ましい。
【0015】
また、上述した実施形態では、管理テーブルには、アクセス先ごとの禁止するファイルオープン又はファイルクローズのアクセス要求を示していることが好ましい。さらに、アクセス制御手段は、管理テーブルに基づいて、アプリケーションプログラムを実行することにより発行されたファイルオープン又はファイルクローズのアクセス要求を送信するかどうかを判定し、ファイルオープン又はファイルクローズが禁止されていないアクセス先へのアクセス要求であるときはファイルオープン又はファイルクローズのアクセス要求を前記ドライバ手段に送信することが好ましい。
【0016】
また、上述した実施形態では、さらに、オペレータにより入力された、アクセス先ごとに禁止するアクセス要求を登録、削除又は変更するためのコマンドを前記計算機に対して送信するコンソールとを有することが好ましい。さらに、アクセス制御手段は、コマンドを受信したときに、アクセス先IDと、そのアクセス先に対して禁止するアクセス要求の種類とを、管理テーブルに登録、削除又は変更することが好ましい。
【0017】
また、上述した実施形態では、さらに、オペレータにより入力された管理テーブルの内容を要求するコマンドを前記計算機に対して送信し、計算機から受信した管理テーブルの内容を出力するコンソールとを有することが好ましい。
【0018】
【発明の実施の形態】
図1は、本発明の一実施形態である計算機システムの構成図である。
【0019】
この計算機システムは、現用系計算機(1000)と、待機系計算機(2000)と、共有ディスク装置(3000)と、コンソール(4000)とを有する。
【0020】
現用系計算機(1000)と待機系計算機(2000)は、それぞれ、プロセッサ(1500、2500)と、メモリ(1600、2600)と、SVP(Service Processor)(1700、2700)と、入出力インタフェース(以下、I/F)(1800、2800)と、主記憶装置(1650、2650)と、系切替制御手段(1100、2100)と、アクセス制御手段(1200、2200)と、OS(オペレーティングシステム)(1300、2300)と、デバイスドライバ手段(1400、2400)とを有する。
【0021】
共有ディスク装置(3000)は、現用系計算機(1000)及び待機系計算機(2000)のアプリケーションプログラム(1410、2410)を実行することによりアクセスされるデータを、一又は複数のボリューム単位で格納している。尚、ここで、ボリューム単位とは、物理ディスク等の物理的な単位であっても、ファイル等の論理的な単位であってもよい。
【0022】
コンソール(4000)は、SVP(1700、2700)に接続されており、オペレータにより入力されたコマンドを受付け、受付けたコマンドに応じて、計算機(1000、2000)内のいずれかの手段に対して、コマンドを発行する。
【0023】
ここで、系切替制御手段(1100、2100)と、アクセス制御手段(1200、2200)と、OS(1300、2300)と、デバイスドライバ手段(1400、2400)として機能させる為のプログラムは、ROM等の記録媒体に記録され、主記憶装置(1650)に格納された後、メモリ(1600、2600)にロードされてプロセッサ(1500、2500)により実行されるものとする。プログラムを記録する媒体は、CD−ROM以外の他の記憶媒体でも良い。また、プログラムは、当該記憶媒体からメモリ(1600、2600)にインストールしても良いし、ネットワークを通じて当該記憶媒体にアクセスしてプログラムを使用するものとしても良い。尚、系切替制御手段(1100、2100)と、アクセス制御手段(1200、2200)と、OS(1300、2300)と、デバイスドライバ手段(1400、2400)として機能させる為のハードウエア構成を現用系計算機(1000)又は待機系計算機(2000)のプロセッサ(1500、2500)とは独立して備えるようにしてもよい。
【0024】
系切替制御手段(1100、2100)は、現用系計算機(1000)あるいは待機系計算機(2000)の障害を検出し、後述するホットスタンバイ切替処理をするように指示する。尚、系状態としては、ホットスタンバイシステムでは、以下の大きくは以下の3状態に分類される。実際にサービスを提供している現用系状態と、サービスは提供していないが、現用系で障害が発生すると、直ちに処理を引き継げる状態待機状態と、障害状態であるオフライン状態とである。
【0025】
系切替制御手段(1100、2100)は、各々一定間隔でaliveメッセージを送信し、もう片方の系がそれを受信する。現用系計算機(1000)で障害が発生するとaliveメッセージが送信されなくなる。このとき、待機系の系切替制御手段(1100、2100)は、現用系計算機(1000)で障害が発生したことを検出し、後述するホットスタンバイ切替制御を実行する。
【0026】
アクセス制御手段(1200、2200)は、アプリケーションプログラム(1410、2410)を実行することによりアクセスされる特定のボリュームに対するアクセス要求の態様を、管理テーブル(1295、2295)に従って制御する。ここで、アクセス要求とは、例えば、リード要求、ライト要求、ファイルオープン要求やファイルクローズ要求がある。また、アクセス要求の態様とは、アクセス要求をデバイスドライバ手段(1400、2400)に発行することを許可するか禁止するかの態様をいい、例えば、リードとライトともに許可又は(以下、/と示す。)禁止、リードは許可/禁止であるがライトは禁止/許可するような態様が考えられる。尚、共有ディスク装置(3000)を構成するボリュームをグループ化し、各グループに固有のグループIDを割当てて、クループ単位でアクセス要求を制限してもよい。
【0027】
OS(1300、2300)は、アプリケーションプログラム(1410、2410)から発行されるアクセス要求と図8に示すデバイススイッチテーブルとに基づいて、アクセス要求の発行先を特定する。デバイススイッチテーブルとは、アクセス要求先のボリュームIDと、アクセス要求の態様との組合せごとに、アクセス要求の発行先を示すテーブルである。アクセス要求の発行先には、もともとデバイスドライバ手段(1400、2400)のアドレス(図8中ドライバID)が示されているが、後述するように、アクセス態様登録手段(1210、2210)により登録されたボリュームIDとアクセス要求の態様との組合せには、アクセス制御手段(1200、2200)のアドレス(図8中アクセスID)が示されている。
【0028】
また、OS(1300、2300)は、活動状態/非活動状態となるように活動化コマンド/非活動化コマンドをデバイスドライバ手段(1400、2400)に発行する。尚、コンソールは、オペレータにより入力された活動化コマンド/非活動化コマンドを受付けることができる。また、活動状態/非活動状態についての詳細は、図4を用いて説明する。
【0029】
デバイスドライバ手段(1400、2400)は、ディスク内の構成情報と、ディスク内の構成要素ごとの性能情報を取得し、アクセス要求をディスク内のどの物理領域に割当てるかを示す変換マップを作成し、保持する。
【0030】
デバイスドライバ手段(1400、2400)は、アクセス要求をOS(1300、2300)又はアクセス制御手段(1200、2200)から受信すると、アクセス要求と、ディスク内の構成情報と、ディスク内の構成要素ごとの性能情報とに基づいて、アクセス要求をディスク内の物理領域を割当て、共有ディスク装置(3000)に発行する。
【0031】
図2は、アクセス制御手段(1200、2200)の構成を示す図である。
【0032】
アクセス制御手段(1200、2200)は、アクセス態様登録手段(1210、2210)と、アクセス態様取得手段(1270、2270)、アクセス態様判定手段(1290、2290)と、管理テーブル(1295、2295)とからなる。
【0033】
アクセス態様登録手段(1210、2210)は、管理テーブル(1295、2295)に、ボリュームのIDを登録・削除し、登録したボリュームIDごとのアクセス要求の態様を登録・変更する。尚、アクセス態様登録手段(1210、2210)は、共有ディスク装置(3000)にボリュームが新たに定義された場合や物理ディスクが追加された場合等は、ボリュームIDとそのアクセス要求の態様を、コンソールを介して受付けることができる。また、複数のボリュームにグループIDを指定することにより、グループ単位でボリュームを登録・削除し、グループ単位でアクセス要求の態様の登録・変更をすることもできる。
【0034】
アクセス態様取得手段(1270、2270)は、コンソール(4000)又はプロセッサ(1500、2500)からの問合せに応じ、指定されたボリューム又はグループのアクセス要求の態様をコンソール(4000)に返す。コンソール(4000)は、受信したボリューム又はグループのアクセス要求の態様を出力する。
【0035】
アクセス態様判定手段(1290、2290)は、OS(1300、2300)からのアクセス要求と管理テーブル(1295、2295)とに基づいて、デバイスドライバ手段(1400、2400)にアクセス要求を発行するかどうかを判定する。例えば、アクセス要求がリードを許可/禁止しているボリュームに対してである場合、デバイスドライバ手段(1400、2400)からのアクセスを許可/禁止する。また、アクセス要求がライトを許可/禁止しているボリュームに対してである場合、デバイスドライバ手段(1400、2400)へのアクセスを許可/禁止する。アクセス要求がいずれのアクセス態様も許可していないボリュームに対してである場合、デバイスドライバ手段(1400、2400)との間のアクセスを禁止する。
【0036】
管理テーブル(1295、2295)は、図9に示すように、ボリュームIDとアクセス要求との組合せごとのアクセス要求の態様を示すテーブルである。尚、複数のボリュームにグループIDを指定することにより、グループ単位でアクセス要求の態様を記録することもできる。管理テーブルへは、ボリュームIDとそのアクセス要求との組合せごとに登録することができる。例えば、図9では、Vol3のボリュームIDにおいては、ファイルオープンのアクセス要求は登録されているが、リード及びライト要求は登録されていない(図9中「−」で示してある。)。また、図8に示すデバイススイッチテーブルにはVol4のボリュームIDがあるが、図9の管理テーブルには登録されていない。尚、図9では、アクセス要求の態様として、許可する場合と禁止する場合の双方を登録してあるが、禁止する場合のみ登録するようにしてもよい。
【0037】
図3は、共有ディスク装置(3000)の構成図である。
【0038】
VG00(3101)、VG01(3102)、VG02(3103)、VG03(3201)、VG04(3202)、VG05(3301)、VG06(3302)の7つのボリュームを3つのグループに分類し、各グループに0〜2のIDを割り当て、それぞれアクセス要求の態様を設定した例を示している。尚、ボリューム単位でIDを割当ててもよい。
【0039】
グループID=0のグループ(3100)はリードおよびライトを許可しており、リード、ライト共に通常通りに行われる。
【0040】
また、グループID=1のグループ(3200)は、ライトのみ禁止しており、リード処理は通常通り行われ、ライトは失敗する。
【0041】
グループID=2のグループ(3300)はリードとライト共に禁止されており、リード/ライト処理は失敗する。
【0042】
図4は、ボリュームの状態遷移を示す図である。
【0043】
ボリュームの状態は、管理対象外状態(5100)と管理対象内状態(5200)に分けられる。
【0044】
管理対象外状態(5100)は、さらに、活性状態と非活性状態とに分類される。
【0045】
ここで、活性状態と非活性状態との遷移手順を示す。
【0046】
まず、非活性状態から活性状態への遷移手順を示す。
【0047】
非活動状態で、デバイスドライバ手段(1400、2400)は、OS(1300、2300)から活動化コマンドを受信すると、共有ディスク装置(3000)からディスク内の構成情報と性能情報とを要求する。受信したデバイスドライバ手段(1400、2400)は、ディスク内の構成情報と性能情報とに基づいて、ボリュームごとに割当てる物理的領域を示す変換マップを作成し、メモリ(1600、2600)に記憶する。これにより、デバイスドライバ手段(1400、2400)は、アクセス要求を受けた場合に、作成した変換マップに基づいて、共有ディスク装置(3000)にアクセス要求を発行することができる。この状態を活性状態という。
【0048】
次に、活性状態から非活性状態への遷移手順を示す。
【0049】
活動状態で、デバイスドライバ手段(1400、2400)は、OS(1300、2300)から非活動化コマンドを受信すると、メモリ(1600、2600)に記憶された変換マップを破棄する。これにより、デバイスドライバ手段(1400、2400)は、アクセス要求を受けた場合であっても、共有ディスク装置(3000)にアクセス要求を発行することができない。この状態を非活性状態という。
【0050】
ここで、管理対象外状態(5100)と管理対象内状態(5200)との間の遷移手順を示す。
【0051】
まず、管理対象外状態(5100)から管理対象内状態(5200)に遷移させる手順を示す。アクセス態様登録手段(1210、2210)は、コンソールから指定されたボリュームIDとそのアクセス要求の態様を、管理テーブル(1295、2295)に登録する。また、アクセス態様登録手段(1210、2210)は、管理テーブル(1295、2295)に登録したボリュームIDとそのアクセス要求の態様に該当するアクセス要求先アドレスにアクセス態様登録手段(1210、2210)のアドレスを書込む。これにより、OS(1300、2300)は、受信したアクセス要求が、管理テーブル(1295、2295)に登録したボリュームでかつ登録したアクセス要求の態様である場合には、受信したアクセス要求をアクセス態様登録手段(1210、2210)に発行する。また、アクセス態様登録手段(1210、2210)は、管理テーブル(1295、2295)に従って、受信したアクセス要求をデバイスドライバ手段に発行するかどうかを制御することができる。
【0052】
このように、アクセス態様登録手段(1210、2210)は、管理テーブル(1295、2295)に従って、受信したアクセス要求をデバイスドライバ手段(1400、2400)に発行するかどうかを制御することができる状態を管理対象内状態(5200)という。逆に、管理テーブル(1295、2295)から登録されたボリュームを除外することにより、管理対象内状態(5200)から管理対象外状態(5100)へ遷移させることができる。
【0053】
管理対象内状態(5200)は、本実施例では、リードとライトともに許可の態様(5210)、リードは許可/禁止でライトは禁止/許可の態様(5220)、リードとライトともに禁止の態様(5230)に分類される。
【0054】
図5は、アプリケーションプログラムを実行することにより生じるアクセス処理を模式的に説明する為の図である。
【0055】
アプリケーションプログラム(1410)は、実行中にOS(1300)に対してリード、ライト等のアクセス要求を発行する(処理5610)。このとき、アクセス要求には、少なくともボリュームIDと、リード/ライト等のアクセス要求の種類とを示す情報が含まれている。
【0056】
OS(1300)は、アプリケーションプログラム(1410)からの要求に応じ、デバイススイッチテーブル(1350)に基づいて、アクセス先を決定し、アクセス要求を発行する。
ここで、管理テーブル(1295、2295)に登録されたボリュームに対するアクセス要求である場合は、デバイススイッチテーブル(1350)にアクセス制御手段(1200、2200)のアドレスが登録されているので、OS(1300)は、受信したアクセス要求をアクセス態様登録手段(1210)に発行する(処理5620)。
【0057】
アクセス態様判定手段(1290)は、管理テーブル(1295、2295)に基づいて、デバイスドライバ手段(1400、2400)にアクセス要求を発行するどうかを判定する。管理テーブル(1295、2295)にアクセス許可として登録されているボリュームに対するアクセス要求であれば、許可されたアクセス要求の態様で、デバイスドライバ手段(1400)にアクセス要求を発行する(処理5630)。ここで、「許可されたアクセス要求の態様で、」とは、例えば、アクセス要求態様がリードの許可/禁止である場合は、デバイスドライバ手段(1400)へのリードを許可/禁止し、アクセス要求態様がライトの許可/禁止である場合は、デバイスドライバ手段(1400)へのライトを許可/禁止すること意味する。
【0058】
デバイスドライバ手段(1400)は、変換マップに基づいて、アクセス態様判定手段(1290)から要求されたボリュームへのアクセス要求を発行する。
【0059】
アクセス態様判定手段(1290)は、管理テーブル(1295)にアクセス禁止として登録されているボリュームに対するアクセス要求を受信した場合は、エラーで終了する(処理5640)。尚、アクセス態様判定手段(1290)は、このエラーの通知をコンソールに対して出力するように指示し、コンソールは、エラーを出力するようにしてもよい。
【0060】
図6は、ホットスタンバイ処理の処理内容を示す図である。
【0061】
現用系計算機(1000)のアクセス制御手段(1200)は、システム立ち上げ後に、OS(1300)に活動化コマンドを発行するように指示する。現用系計算機(1000)のOS(1300)は、活動コマンド(5101)をデバイスドライバ手段(1400)に発行する。デバイスドライバ手段(1400)は、共有ディスク装置(3000)を構成するボリュームを活動状態(5120)に設定する(ステップ7000)。
【0062】
次に、アクセス態様登録手段(1210)は、初期値に基づいて、ボリュームIDを管理テーブル(1295)に登録する(ステップ7050)。ここで、初期値とは、予めオペレータにより設定された管理テーブル(1295、2295)の内容を示す値である。
【0063】
更に、アクセス態様登録手段(1210)は、初期値に基づいて、登録したボリュームIDごとのアクセス要求の態様を管理テーブル(1295)に登録する(ステップ7100)。
【0064】
一方、待機系計算機(2000)のアクセス制御手段(2200)は、システム立ち上げ後に、OS(2300)に活動化コマンドを発行するように指示する。待機系計算機(2000)のOS(2300)は、活動コマンド(5101)をデバイスドライバ手段(2400)に発行する。デバイスドライバ手段(2400)は、共有ディスク装置(3000)を構成するボリュームを活動状態(5120)に設定する(ステップ7500)。
【0065】
次に、アクセス態様登録手段(2210)は、初期値に基づいて、特定のボリュームIDを管理テーブル(2295)に登録する。(ステップ7550)
更に、アクセス態様登録手段(2210)は、登録されたボリュームIDのアクセス態様をリード及びライトを禁止として、管理テーブル(2295)に登録する(ステップ7600)。尚、アクセス態様として、リードを許可し、ライトを禁止するように登録してもよい。これにより、待機系計算機(2000)において、アプリケーションプログラムによるリード要求を許可することができる。
【0066】
ステップ7000、7050、7100により、運用系計算機(1000)のアクセス制御判定手段(1290)は、運用系計算機(1000)のアプリケーションプログラム(1410)を実行することにより発行されるリード/ライトのアクセス要求を、管理テーブル(1295)に基づいて、デバイスドライバ手段(1400)に発行することができる運用系状態となる。
一方、ステップ7500、7550、7600により、待機系計算機(2000)のアクセス制御判定手段(2290)は、待機系計算機(2000)のアプリケーションプログラム(2410)を実行することにより発行されるリード及びライトのアクセス要求を、デバイスドライバ手段(2400)に発行しない待機系状態となる。
【0067】
ここまでが、システム立ち上げ後に実行される初期動作である。
【0068】
次に、現用系計算機(1000)で障害が発生した場合の動作を説明する。
【0069】
この場合、待機系計算機(2000)の系切替制御手段(2100)は、aliveメッセージの途絶により現用系計算機(1000)の障害を検出する(ステップ7650)。
【0070】
障害検出後、待機系計算機(2000)の系切替制御手段(2100)は、現用系計算機(1000)へリセット要求を発行する(ステップ7700)。
【0071】
現用系計算機の系切替制御手段(1100)は、待機系計算機(2000)の系切替制御手段(2100)が発行したリセット要求を受信する(ステップ7150)。
【0072】
リセット要求を受信した現用系計算機の系切替制御手段(1100)は、オフライン状態となるようにシステムコール(5202)を、アクセス制御登録手段(1210)に発行する。アクセス制御登録手段(1210)は、このシステムコール(5202)を受けて、管理テーブル(1295)に登録されたボリュームIDのアクセス要求の態様をリード及びライトを禁止となるように変更する。これにより、運用系計算機のアクセス制御判定手段(1290)は、運用系計算機(1000)のアプリケーションプログラム(1410)を実行することにより発行されるリード及びライトのアクセス要求を、デバイスドライバ手段(1400)に発行しないオフライン状態に切替る(ステップ7200)。
【0073】
尚、現用系計算機の系切替制御手段(1100)は、リセット要求を受信したときに、現用系計算機のOS(1300)に非活性化コマンドをデバイスドライブ手段(1400)に発行するようように指示してもよい。この場合、デバイスドライバ手段(1400)は、OS(1300)から非活動化コマンドを受信すると、メモリ(1600)に記憶された変換マップを破棄する。これにより、デバイスドライバ手段(1400)は、アクセス要求を受けた場合であっても、共有ディスク装置(3000)にアクセス要求を発行することができなくなり、オフライン状態となる。さらに、現用系計算機(1000)は、障害から修復すると、システム立ち上げ時と同様にボリュームの活動化コマンド(5101)を発行し、非活動化状態(5110)から活動化状態(5120)に遷移させることにより、オフライン状態となるようにしてもよい。
【0074】
次に、系切替制御手段(1100)は、運用系計算機(1000)がオフライン状態に切替ったことのリセット完了通知を待機系計算機(2000)に対して送信する(ステップ7300)。
【0075】
障害の発生した現用系は、障害から修復すると、アクセス態様登録手段(1210)は、初期値に基づいて、登録したボリュームIDごとのアクセス要求の態様を管理テーブル(1295)に登録し、オフライン状態から待機系状態に遷移する(ステップ7400)。
【0076】
待機系計算機(2000)の系切替制御手段(2100)は、現用系計算機(1000)からのリセットを受信すると(ステップ7750)、運用系状態に切替るようにシステムコール(5240)を、アクセス制御登録手段(2210)に発行する。アクセス制御登録手段(2210)は、このシステムコール(5240)を受けて、初期値に基づいて、管理テーブル(2295)を変更する。これにより、待機系計算機(2000)のアクセス状態判定手段(2290)は、管理テーブル(2295)に基づいて、デバイスドライバ手段(2400)に、アクセス要求を発行する運用系状態となる(ステップ7800)。尚、アクセス制御登録手段(2210)は、システムコール(5240)とともに、現用系計算機(1000)から管理テーブル(1295)の内容を受信し、現用系計算機(1000)の管理テーブル(1295)の内容を引継ぐように、管理テーブル(2295)の内容を変更するようにしてもよい。
【0077】
このようにして、現用系計算機(1000)で障害が発生すると、アクセス態様登録手段(1210、2210)により、管理テーブル(1295、2295)の内容を変更することにより、現用系計算機(1000)はオフライン状態に、待機系計算機(2000)運用系状態になり、共有ディスクの高速切替えを実現する。
【0078】
図7は、コンソール(4000)から指示によるホットスタンバイ切替えを示す図である。
【0079】
ここでは、運用系計算機(1000)は、ステップ7000、7050、7100により、既に、初期値に基づいて、アクセス態様登録手段(1210)により、ボリュームのIDと、ボリュームIDごとのアクセス要求の態様が登録されているとする。また、待機系計算機(2000)は、ステップ7500、7550、7600により、システム立ち上げ後の初期動作を実行済みである。
【0080】
コンソールは、オペレータより、ホットスタンバイ切替えコマンドを受付けると、切替えコマンドを現用系計算機(1000)に発行する(ステップ8000)。
【0081】
現用系計算機(1000)は、切替えコマンドを受信すると、アクセス態様登録手段(1200)により、管理テーブル(1295)に登録されたボリュームIDのアクセス要求の態様をリード及びライトを禁止となるように変更する。これにより、運用系計算機のアクセス制御判定手段(1290)は、運用系計算機(1000)のアプリケーションプログラム(1410)を実行することにより発行されるリード及びライトのアクセス要求を、デバイスドライバ手段(1400)に発行しなくなり、運用系計算機(1000)はオフライン状態に切替る(ステップ8100)。尚、現用系計算機(1000)は、切替えコマンドを受信すると、アクセス態様登録手段(1200)により、管理テーブル(1295)に登録されたボリュームID削除するようにしてもよい。これにより、ボリュームを管理対象外状態に遷移させることにより、オフライン状態に切替ることができる。また、現用系計算機(1000)は、切替えコマンドを受信すると、非活動状態に遷移させることにより、オフライン状態に切替るようにしてもよい。
【0082】
現用系計算機(1000)は、オフライン状態に切替ると、リセット完了通知を、コンソールに送信する(ステップ8200)。
【0083】
コンソールは、リセット完了通知を受信すると、待機系計算機(2000)に系切替コマンドを発行する(ステップ8300)。
【0084】
待機系計算機のアクセス状態登録手段(2210)は、系切替コマンドを受信すると、初期値に基づいて、管理テーブル(2295)の内容を書換える(ステップ8400)。尚、系切替コマンドとともに、運用系計算機(1000)で保持していた管理テーブル(1295)の内容を待機系計算機(2000)に送信し、待機系計算機(2000)は、運用系計算機(1000)で保持していた管理テーブル(1295)の内容に基づいて、管理テーブル(2295)の変更を実行するようにしてもよい。
【0085】
これにより、共有ディスク装置(3000)の系を切替えることができ、待機系計算機(2000)は運用系計算機(1000)の処理を引継ぐことができる。
【0086】
上述した実施形態では、アクセス制御手段(1200、2200)をデバイスドライバ手段(1400、2400)及びOS(1300、2300)とは独立した構成を採用した場合の実施例について説明した。
【0087】
上記の場合以外にも、アクセス制御手段(1200、2200)をOS(1300、2300)内に配置することも可能である。この場合に、アクセス態様登録手段は、管理テーブルではなく、デバイススイッチテーブルに登録・削除することにより、管理テーブルとデバイススイッチテーブルを統一化してもよい。
【0088】
また、アクセス制御手段(1200、2200)をデバイスドライバ手段(1400、2400)内に配置することも可能である。この場合に、管理テーブルと上述した変換マップとを統一化してもよい。
【0089】
尚、上述した実施形態では、アクセス要求の態様として、リード/ライトの許可/禁止について説明したが、アクセス要求の態様として、ファイルのオープン/クローズの許可/禁止についても、同様に制御できる。
【0090】
【発明の効果】
本発明では、高速にホットスタンバイ切替処理を実行する技術を提供することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態である計算機システムの構成図。
【図2】アクセス制御手段の構成図。
【図3】共有ディスクの構成図。
【図4】ボリュームの状態遷移図。
【図5】本発明の一実施形態のアクセス要求入出力処理を示す模式図。
【図6】本発明の一実施形態の障害時のホットスタンバイ処理の流れ図。
【図7】本発明の一実施形態のコンソール入力によるホットスタンバイ処理の流れ図。
【図8】デバイススイッチテーブルの内容を示す図。
【図9】管理テーブルの内容を示す図。
【符号の説明】
1000:現用系、2000:待機系、1100、2100:系切替制御手段、1200、2200:アクセス制御手段、1300、2300:OS、1400、2400:デバイスドライバ手段、1500、2500:プロセッサ、1600、2600:メモリ、1700、2700:SVP(Service Processor)、3000:共有ディスク、4000:コンソール

Claims (13)

  1. 運用系切替により、運用系と待機系との運用が可能な複数の計算機と、該計算機によりアクセスされるデータを格納する共有ディスク装置とを有する計算機システムであって、
    前記計算機は、
    記憶部と、制御部とを有し、
    前記制御部は、
    システムを起動したときに、前記共有ディスク装置内の構成情報を取得し、該構成情報に基づいて、該共有ディスク装置に対するアクセス要求を送信することができる活動状態に設定しておき、該共有ディスク装置に対するアクセス要求を受信したときに、該共有ディスク装置にアクセス要求を送信するドライバ手段と、
    アクセス先ごとに禁止するアクセス要求を示した管理テーブルに基づいて、アプリケーションプログラムを実行することにより発行されたアクセス要求を送信するかどうかを判定し、禁止されていないアクセス先へのアクセス要求を前記ドライバ手段に送信するアクセス制御手段とを実行する計算機システム。
  2. 請求項1に記載の計算機システムであって、
    前記アクセス制御手段は、
    該計算機が待機系で運用している場合であって運用系計算機に障害が発生したときは、実行するアプリケーションプログラムによるアクセス先に対するアクセス要求を禁止するように前記管理テーブルに登録することを特徴とする計算機システム。
  3. 請求項1に記載の計算機システムであって、
    さらに、オペレータにより入力された運用系切替コマンドを前記計算機に対して送信するコンソールとを有し、
    前記アクセス制御手段は、
    該計算機が待機系で運用している場合であって前記系切替コマンドを受信したときは、実行するアプリケーションプログラムによるアクセス先に対するアクセス要求を禁止するように前記管理テーブルに登録することを特徴とする計算機システム。
  4. 請求項2又は3に記載の計算機システムであって、
    前記アクセス要求として、少なくともライトを禁止するように前記管理テーブルに登録することを特徴とする計算機システム。
  5. 請求項1の計算機システムであって、
    前記管理テーブルには、アクセス先ごとの禁止するリード又はライトのアクセス要求を示しており、
    前記アクセス制御手段は、前記管理テーブルに基づいて、アプリケーションプログラムを実行することにより発行されたリード又はライトのアクセス要求を送信するかどうかを判定し、リード又はライトが禁止されていないアクセス先へのアクセス要求であるときはリード又はライトのアクセス要求を前記ドライバ手段に送信することを特徴とする計算機システム。
  6. 請求項1の計算機システムであって、
    前記管理テーブルには、アクセス先ごとの禁止するファイルオープン又はファイルクローズのアクセス要求を示しており、
    前記アクセス制御手段は、前記管理テーブルに基づいて、アプリケーションプログラムを実行することにより発行されたファイルオープン又はファイルクローズのアクセス要求を送信するかどうかを判定し、ファイルオープン又はファイルクローズが禁止されていないアクセス先へのアクセス要求であるときはファイルオープン又はファイルクローズのアクセス要求を前記ドライバ手段に送信することを特徴とする計算機システム。
  7. 請求項1に記載の計算機システムであって、
    さらに、オペレータにより入力された、アクセス先ごとに禁止するアクセス要求を登録、削除又は変更するためのコマンドを前記計算機に対して送信するコンソールとを有し、
    前記アクセス制御手段は、
    前記コマンドを受信したときに、アクセス先IDと、そのアクセス先に対して禁止するアクセス要求の種類とを、前記管理テーブルに登録、削除又は変更することを特徴とする計算機システム。
  8. 請求項1に記載の計算機システムであって、
    さらに、オペレータにより入力された管理テーブルの内容を要求するコマンドを前記計算機に対して送信し、該計算機から受信した管理テーブルの内容を出力するコンソールとを有することを特徴とする計算機システム。
  9. 運用系切替により、運用系と待機系との運用が可能な計算機であって、
    記憶部と、制御部とを有し、
    前記制御部は、
    システムを起動したときに、複数の計算機によりデータを共有される共有ディスク装置内の構成情報を取得し、該構成情報に基づいて、該共有ディスク装置に対するアクセス要求を送信することができる活動状態に設定しておき、該共有ディスク装置に対するアクセス要求を受信したときに、該共有ディスク装置にアクセス要求を送信するドライバ手段と、
    アクセス先ごとに禁止するアクセス要求を示した管理テーブルに基づいて、アプリケーションプログラムを実行することにより発行されたアクセス要求を送信するかどうかを判定し、禁止されていないアクセス先へのアクセス要求を前記ドライバ手段に送信するアクセス制御手段とを実行する計算機。
  10. 計算機を、運用系切替により運用系と待機系との運用ができるように機能させるためのプログラムであって、
    システムを起動したときに、複数の計算機によりデータを共有される共有ディスク装置内の構成情報を取得し、該構成情報に基づいて、該共有ディスク装置に対するアクセス要求を送信することができる活動状態に設定するようにドライバ手段に指示する指示手段と、
    アクセス先ごとに禁止するアクセス要求を示した管理テーブルに基づいて、アプリケーションプログラムを実行することにより発行されたアクセス要求を送信するかどうかを判定し、禁止されていないアクセス先へのアクセス要求を前記ドライバ手段に送信する判定手段として前記計算機を機能させるためのプログラム。
  11. 計算機を、運用系切替により運用系と待機系との運用ができるように機能させるためのプログラムであって、
    システムを起動したときに、複数の計算機によりデータを共有される共有ディスク装置内の構成情報を取得し、該構成情報に基づいて、該共有ディスク装置に対するアクセス要求を送信することができる活動状態に設定するようにしておき、該共有ディスク装置に対するアクセス要求を受信したときに、該共有ディスク装置にアクセス要求を送信する送信手段と、
    アクセス先ごとに禁止するアクセス要求を示した管理テーブルに基づいて、アプリケーションプログラムを実行することにより発行されたアクセス要求を送信するかどうかを判定し、禁止されていないアクセス先へのアクセス要求を前記送信手段に送信する判定手段として前記計算機を機能させるためのプログラム。
  12. 請求項11のプログラムであって、
    さらに、OSとして機能することを特徴とするプログラム。
  13. 運用系切替により運用系と待機系との運用可能な計算機によるアクセス制御方法であって、
    システムを起動したときに、複数の計算機によりデータを共有される共有ディスク装置内の構成情報を取得し、該構成情報に基づいて、該共有ディスク装置に対するアクセス要求を送信することができる活動状態に設定しておき、該共有ディスク装置に対するアクセス要求を受信したときに、該共有ディスク装置にアクセス要求をドライバ手段により送信し、
    アクセス先ごとに禁止するアクセス要求を示した管理テーブルに基づいて、アプリケーションプログラムを実行することにより発行されたアクセス要求を送信するかどうかを判定し、禁止されていないアクセス先へのアクセス要求を前記ドライバ手段に送信するアクセス制御方法。
JP2002266206A 2002-09-12 2002-09-12 ホットスタンバイ計算機システム Pending JP2004102852A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2002266206A JP2004102852A (ja) 2002-09-12 2002-09-12 ホットスタンバイ計算機システム
US10/608,010 US20040139205A1 (en) 2002-09-12 2003-06-30 Hot standby server system
US12/219,957 US20080301777A1 (en) 2002-09-12 2008-07-31 Hot standby server system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002266206A JP2004102852A (ja) 2002-09-12 2002-09-12 ホットスタンバイ計算機システム

Publications (1)

Publication Number Publication Date
JP2004102852A true JP2004102852A (ja) 2004-04-02

Family

ID=32265080

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002266206A Pending JP2004102852A (ja) 2002-09-12 2002-09-12 ホットスタンバイ計算機システム

Country Status (2)

Country Link
US (2) US20040139205A1 (ja)
JP (1) JP2004102852A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006319825A (ja) * 2005-05-16 2006-11-24 Hitachi Kokusai Electric Inc 無線基地局装置のトラヒック測定方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4305007B2 (ja) * 2003-03-05 2009-07-29 株式会社日立製作所 系切り替えシステムおよびその処理方法並びにその処理プログラム
US20070011136A1 (en) * 2005-07-05 2007-01-11 International Business Machines Corporation Employing an identifier for an account of one domain in another domain to facilitate access of data on shared storage media
JP5011073B2 (ja) * 2007-11-22 2012-08-29 株式会社日立製作所 サーバ切り替え方法、およびサーバシステム
US8903960B2 (en) 2010-12-21 2014-12-02 Cisco Technology, Inc. Activate attribute for service profiles in unified computing system
JP2013156963A (ja) * 2012-01-31 2013-08-15 Fujitsu Ltd 制御プログラム、制御方法、情報処理装置、制御システム
US9361082B2 (en) 2012-09-06 2016-06-07 Welch Allyn, Inc. Central monitoring station warm spare

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5845061A (en) * 1994-10-31 1998-12-01 Hitachi, Ltd. Redundant client server system
US5913227A (en) * 1997-03-24 1999-06-15 Emc Corporation Agent-implemented locking mechanism
US6292905B1 (en) * 1997-05-13 2001-09-18 Micron Technology, Inc. Method for providing a fault tolerant network using distributed server processes to remap clustered network resources to other servers during server failure
US6275953B1 (en) * 1997-09-26 2001-08-14 Emc Corporation Recovery from failure of a data processor in a network server
US6330689B1 (en) * 1998-04-23 2001-12-11 Microsoft Corporation Server architecture with detection and recovery of failed out-of-process application
US7165152B2 (en) * 1998-06-30 2007-01-16 Emc Corporation Method and apparatus for managing access to storage devices in a storage system with access control
US7035880B1 (en) * 1999-07-14 2006-04-25 Commvault Systems, Inc. Modular backup and retrieval system used in conjunction with a storage area network
US7035850B2 (en) * 2000-03-22 2006-04-25 Hitachi, Ltd. Access control system
US6904477B2 (en) * 2001-04-13 2005-06-07 Sun Microsystems, Inc. Virtual host controller interface with multipath input/output
JP4188602B2 (ja) * 2002-01-10 2008-11-26 株式会社日立製作所 クラスタ型ディスク制御装置及びその制御方法
JP2003208347A (ja) * 2002-01-16 2003-07-25 Fujitsu Ltd アクセス制御装置、アクセス制御プログラム、ホスト装置およびホスト制御プログラム
GB0206604D0 (en) * 2002-03-20 2002-05-01 Global Continuity Plc Improvements relating to overcoming data processing failures
US7496668B2 (en) * 2002-06-28 2009-02-24 Honeywell International Inc. OPC server redirection manager
JP2004087866A (ja) * 2002-08-28 2004-03-18 Hitachi Ltd 半導体光素子、その実装体および光モジュール
US7028218B2 (en) * 2002-12-02 2006-04-11 Emc Corporation Redundant multi-processor and logical processor configuration for a file server
JP2005018510A (ja) * 2003-06-27 2005-01-20 Hitachi Ltd データセンタシステム及びその制御方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006319825A (ja) * 2005-05-16 2006-11-24 Hitachi Kokusai Electric Inc 無線基地局装置のトラヒック測定方法

Also Published As

Publication number Publication date
US20040139205A1 (en) 2004-07-15
US20080301777A1 (en) 2008-12-04

Similar Documents

Publication Publication Date Title
US7650446B2 (en) Storage system for back-end communications with other storage system
US8412892B2 (en) Storage system and ownership control method for storage system
JP2006331158A (ja) ストレージシステム
US20100131728A1 (en) Computer-readable recording medium storing data migration program, data migration method, and data migration apparatus
JP2002229837A (ja) 共有ディスク・パラレル・データ・ファイル内のデータに対するアクセスを制御する方法
JP4155399B2 (ja) コンピュータ処理方法及びその実施システム並びにその処理プログラム
JP2007265403A (ja) 階層型ストレージシステム間でのリモートミラー方式
EP3311272B1 (en) A method of live migration
US20080209136A1 (en) System and method of storage system assisted i/o fencing for shared storage configuration
JP2009205614A (ja) ストレージシステムの制御方法、スイッチ装置およびストレージシステム
JP4175083B2 (ja) 記憶装置の管理用計算機、およびプログラム
US20080301777A1 (en) Hot standby server system
JP2009026091A (ja) 接続管理プログラム、接続管理方法および情報処理装置
JP4977532B2 (ja) ストレージシステムの電力消費を制御するデータベース管理システム
JP2710195B2 (ja) 記憶装置コントローラ
JP4322240B2 (ja) 再起動方法、システム及びプログラム
JP2010211318A (ja) デバイス管理装置、デバイス初期化方法、デバイス初期化プログラムおよびデバイスシステム
US20230229330A1 (en) Storage system and cooperation method
JP2008009622A (ja) 管理サーバ、およびサーバシステム
JP2006260141A (ja) 記憶システムの制御方法、記憶システム、記憶制御装置、記憶システムの制御プログラム、情報処理システム
US7913028B2 (en) Data processing system having multiplexed data relaying devices, data processing aparatus having multiplexed data relaying devices, and a method of incorporating data relaying devices in data processing system having multiplexed data relaying devices
JP2001154896A (ja) 計算機およびそのファイル更新方法
JP5478372B2 (ja) ゲストos制御システム
WO2016046951A1 (ja) 計算機システム及びそのファイル管理方法
JP4708669B2 (ja) パス冗長化装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040825

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060721

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070129

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070202

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070316