JP2006189963A - ストレージアクセス制御方法、クラスタシステム、パス接続スイッチおよびストレージアクセス制御プログラム - Google Patents

ストレージアクセス制御方法、クラスタシステム、パス接続スイッチおよびストレージアクセス制御プログラム Download PDF

Info

Publication number
JP2006189963A
JP2006189963A JP2004381999A JP2004381999A JP2006189963A JP 2006189963 A JP2006189963 A JP 2006189963A JP 2004381999 A JP2004381999 A JP 2004381999A JP 2004381999 A JP2004381999 A JP 2004381999A JP 2006189963 A JP2006189963 A JP 2006189963A
Authority
JP
Japan
Prior art keywords
computer
standby
path
access
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004381999A
Other languages
English (en)
Inventor
Ryosuke Tsurumi
玲典 鶴身
Tsunehiko Baba
恒彦 馬場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004381999A priority Critical patent/JP2006189963A/ja
Priority to US11/317,001 priority patent/US20060146809A1/en
Publication of JP2006189963A publication Critical patent/JP2006189963A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Abstract

【課題】 系切り替えを行うクラスタシステムにおいて、ストレージ装置に対するアクセスの排他制御を行う。
【解決手段】 実行系で系障害が起こった場合、待機系との間のHeart Beatメッセージが途絶えるため、待機系のクラスタプログラム204は、実行系の障害を検知する。その際、クラスタプログラム204は、FC−SW内のパス設定プログラム602に対して実行系からのディスクアクセスのパスの切り換え要求を送信する。その要求を受け取ったパス設定プログラム602は、パス管理テーブル603を書き換えて、実行系からのディスクアクセスのパスを遮断する。そして、処理の結果をクラスタプログラム204に送信する。その結果を受け取ったクラスタプログラム204は、サーバプログラム206の起動などを行う。サーバプログラム206は、実行系101に障害が発生し、業務処理が停止した時点のチェックポイントから業務処理を開始する。
【選択図】 図2

Description

本発明は、実行系および待機系を備えることで、障害許容性を有するコンピュータシステム技術に関する。また、計算機における通信のアクセス制御技術に関する。
複数の系と共有ディスク装置からなるクラスタシステムでは、ある系が障害となった場合、待機していた別の系に切り替え(ホットスワップ)を行うことで、処理を続行することができる。このような系切り替えシステムでは、共有ディスク装置に対する書き込みが複数の系から同時に行われた場合にデータが破壊される恐れがあるため、共有ディスク装置へのアクセス(以下、ディスクアクセスという)には排他制御が必要となる。
従来、複数台の計算機からの共有ディスク装置へのアクセスについて排他制御を行う場合には、SCSI(Small Computer System Interface)のRESERVEコマンド、RELEASEコマンドを用いる方法やLVM(Logical Volume Manager)で論理ボリュームのアクティブ、非アクティブの制御を行う方法が用いられてきた。
SCSIのRESERVEコマンドは、論理ユニットの予約を行い、RELEASEコマンドでその予約を解放するまでは他のイニシエータからのRESERVE要求を受け付けないようにすることができる(非特許文献1参照)。
また、LVMでは、VG(Volume Group)に対するアクティブ状態、非アクティブ状態を実行系、待機系のクラスタソフトウェアで制御することにより、アクティブ状態でない系からのディスクアクセスを防ぐことができる(非特許文献2参照)。
一方、特定の計算機からの不正なディスクアクセスを防止する手段として、上位装置の識別情報とディスク装置のポートを対応付けたテーブルをディスク装置に保持しておき、あらかじめ定義された上位装置からのアクセスを拒否するという方法がある(特許文献1参照)。
共有ディスク装置を持つクラスタシステムにおいて、系障害が発生することにより系切り替えを行う際には、ディスク装置への不正な二重書き込みを防止するために、障害となった系から共有ディスク装置への書き込みを防止する必要がある。その方法としては、系切り替えのタイミングで待機系から障害系(系障害が発生した実行系)をリセットし、OS(Operating System)自体を停止させることによりディスクアクセスを停止させるという手段が用いられている(特許文献2参照)。
特開平10−333839号公報(段落0061〜0072、図1、図6、図7) 特開平10−207855号公報(段落0030〜0055、図1) "T10 Working Drafts"、[online]、T10 (Technical Committee of the International Committee on Information Technology Standards)、[2004年12月27日検索]、インターネット<URL:http://www.t10.org> "Service Guardの管理"、[online]、第9版、2004年6月、Hewlett-Packard Development Company、[2004年12月27日検索]、インターネット<URL:http://docs.hp.com/ja/B3936-90080/B3936-90080.pdf>
ところで、ディスク装置への二重書き込みによるデータ破壊を防止するためには、ディスクアクセスの排他制御が必要であるが、系自体に障害が発生した場合には、クラスタソフトウェアだけではディスクアクセスを制御できないので、系そのものをリセットしなければならなかった。しかし、リセットを行うシステムでは、リセット機構をもつ専用のハードウェアが必須であり、汎用性に欠けるという問題がある。また、リセット機構を要するため、クラスタ構成のシステムに対して新たな計算機を追加する場合にもコストがかかる。また、障害となった系の障害原因を調査するためには、リセットを行う前にメモリのダンプをディスク装置に保存するといった処理が必要となる。
そこで、前記問題に鑑みて、本発明の目的は、系切り替えを行うクラスタシステムにおいて、ストレージ装置に対するアクセスの排他制御を行う手段を提供することにある。
前記課題を解決する本発明は、所定の処理を行う実行系計算機と、実行系計算機に障害が発生した場合に、実行系計算機の処理を引き継ぐ待機系計算機と、処理に伴って、実行系計算機および待機系計算機からアクセスを受け、所定のデータを入出力するストレージ装置と、実行系計算機、待機系計算機およびストレージ装置とがそれぞれ通信するための複数のポートを備え、それらのポート間を接続するパスを制御するパス接続スイッチとを備えるクラスタシステムにおけるストレージアクセス制御方法であって、待機系計算機が、実行系計算機に障害が発生したことを検出した場合に、パス接続スイッチに各計算機とストレージ装置との間のパスの切り換え要求を送信し、パス接続スイッチが、パスの切り換え要求を受信した場合に、実行系計算機とストレージ装置との間のアクセスを禁止するとともに、待機系計算機とストレージ装置との間のアクセスを許可するようにパスを設定し、そのパスの設定結果を待機系計算機に送信し、待機系計算機が、パスの設定結果を受信した場合に、実行系計算機が行っていた処理を引き継ぐことを主な特徴とする。なお、本発明は、クラスタシステム、パス接続スイッチおよびストレージアクセス制御プログラムを含むものとする。
本発明によれば、系切り替えを行うクラスタシステムにおいて、ストレージ装置に対するアクセスの排他制御を行うことができる。
以下、本発明を実施するための最良の形態について図面を参照して詳細に説明する。
≪第1の実施の形態≫
最初に、本発明の第1の実施の形態を説明する。
<システムの構成と概要>
図1は、本発明の第1の実施の形態に係るクラスタシステムの機能構成を示す図である。クラスタシステム1は、ブレードサーバ103、FC−SW(Fibre Channel-SWitch)104および共有ディスク装置105を含んで構成される。
ブレードサーバ103は、実行系101および待機系102から構成される。ここで、系とは、例えば、ブレードサーバ103に組み込まれるブレード(サーバ基板)に対応するものであり、所定の業務処理を行うことができる1個の計算機に相当する。以下、系を計算機ともいう。実行系101は、現在業務処理(処理)を実行している計算機である。待機系102は、現在は業務処理をせず、実行系101に障害が発生した場合にその業務処理を引き継ぐ計算機であり、換言すれば、系の切り替えを待っている計算機である。実行系101、待機系102の各計算機では、OS201、202、クラスタプログラム203、204およびサーバプログラム205、206がそれぞれ動作する。OS201、202は、各計算機において動作するプログラムを含む計算機のシステム全体を管理する。クラスタプログラム203、204は、系の監視および切り替えを行う。サーバプログラム205、206は、業務処理を行うアプリケーションプログラム(業務プログラムやプログラムともいう)である。
クラスタプログラム203、204は、自系および他系の状態を保持しておくための系情報テーブル207、208をそれぞれ持つ。系情報テーブル207、208には、例えば、各計算機のIP(Internet Protocol)アドレスや、各計算機上で動作しているサーバプログラム名、共有リソースの種類や名前などが保持される。クラスタプログラム203は、自系のサーバプログラム205と通信を行い、サーバプログラム205の状態を監視する。
各計算機上で動作するクラスタプログラム203および204は、その間で一定時間ごとにHeart Beatと呼ばれるメッセージをやり取りすることにより、互いに相手の系が正常に動作しているかどうかをチェックしている。このHeart Beatメッセージの送受信は、各クラスタプログラム203、204によって監視パス301を介して行われる。待機系102のクラスタプログラム204は、実行系101のクラスタプログラム203からのHeart Beatメッセージを検知できなかった場合、実行系101または監視パス301に何らかの障害が発生したとみなし、系の切り替えを行う契機とする。なお、監視パス301は、専用のLAN(Local Area Network)などによって実現される。クラスタプログラム204により系の切り替えを行うことで業務処理を続行することができる。
各計算機は、FCアダプタ401、402をそれぞれ有し、各パス403、404およびFC−SW104を通して共有ディスク装置105にアクセスすることができる。
FC−SW104は、ブレードサーバ103の実行系101、待機系102および共有ディスク装置105に接続され、各系と共有ディスク装置105との間のデータ転送パスの接続を管理、制御する。FC−SW104は、ポート501(P1)、502(P2)、503(P3)の間を接続するデータ転送のパス504、505、506を管理するパス管理部601と、パス制御を行うパス設定プログラム602と、パスのアクセス可否を保持するパス管理テーブル603とを備える。実行系101からのディスクアクセス要求は、ポート501を通じてパス管理部601に受信される。パス管理部601では、パス設定プログラム602の実行により、パス管理テーブル603を参照し、そのアクセスが許可されているかどうかを判断する。許可されている場合はアクセスが行われるが、許可されていない場合はその要求が拒否される。また、各計算機のLANアダプタ701、702は、FC−SW104のLANアダプタ703にパス704、705でそれぞれ接続されており、FC−SW104のパス管理部601と通信を行うことができる。なお、パス704、705は、専用のLANなどによって実現される。
共有ディスク装置105は、実行系101や待機系102による業務処理などに伴って各計算機からアクセスを受け、所定のデータを入出力する。所定のデータとは、例えば、データベースに格納される、業務処理に関するデータやログ情報などである。
ここではFCアダプタ401、402およびFC−SW104を用いてストレージ装置(共有ディスク装置105)にアクセスする例を示したが、FCアダプタ401、402およびFC−SW104をLANアダプタおよびLANスイッチに置き換えて、ストレージ装置としてIPストレージを用いるようにしてもよい。また、図1ではFC−SW104の制御を701ないし705で構成されるLANで行っているが、FCを用いたネットワークに置き換えてもよい。
以下、処理の概要を説明する。まず、実行系101で系障害が起こった場合、待機系102との間のHeart Beatメッセージが途絶えるため、待機系102のクラスタプログラム204は、実行系101に障害が発生したことを検知する。その際に、系情報テーブル208内の実行系101の状態を稼動状態(実行系として業務処理を行っている状態)から障害状態に書き換える。
実行系101からは共有ディスク装置105へのアクセスが継続して行われている可能性があるため、クラスタプログラム204は、FC−SW104内のパス設定プログラム602に対して実行系101からのディスクアクセスのパス504を切断するための要求(パスの切り換え要求)をLANアダプタ702から送信する。このようにすることにより、実行系101は、共有ディスク装置105にアクセスすることができなくなる。
その要求を受け取ったパス設定プログラム602は、パス管理テーブル603の中から、実行系101が使用しているパスを検索し、強制的にパス504をアクセス不可に設定する。これにより、実行系101からのディスクアクセスは遮断(禁止)される。その後、パス設定プログラム602は処理の結果(パスの切り換え結果)をクラスタプログラム204に送信する。
その結果を受け取ったクラスタプログラム204は、外部ネットワークに接続されているLANアダプタのIPアドレスの引継ぎ、サーバプログラム206の起動、系が3つ以上存在する場合には、全他系への切り替え完了通知を行う。サーバプログラム206は、クラスタプログラム204から起動された後、共有ディスク装置105内のデータを参照して、実行系101に障害が発生し、業務処理が停止した時点のチェックポイントから業務処理を開始する。
<システムの処理>
図2は、系の切り替えの処理を示すフローチャートである。この一連の処理は、実行系101のクラスタプログラム203、待機系102のクラスタプログラム204、FC−SW104のパス設定プログラム602および待機系102のサーバプログラム206の各処理から構成される。この例では、実行系101で障害が発生し、待機系102のクラスタプログラム204が障害を検知することにより、待機系102に切り替わるまでの処理の流れを示している。なお、ここでいう障害とは、各系の間で送受信されるHeart Beatメッセージに対する応答がないことによって検出されるものであり、そのとき業務処理を行っている実行系101のクラスタプログラム203のハングアップやスローダウン、監視パス301の通信障害などを含む。
まず、実行系101で障害が発生すると(S101)、実行系101のクラスタプログラム203は、S201で待機系102のクラスタプログラム204から送信されたHeart Beatメッセージに対する応答を返すことができない。そこで、クラスタプログラム204は、クラスタプログラム203からの応答が返って来ない時間が所定の閾値を超えたときに障害を検知する(S202)。実行系101の障害を検知したクラスタプログラム204は、保持している系情報テーブル208を変更して(S203)、実行系101の状態を稼動状態から障害状態に設定する。その後、FC−SW104のパス設定プログラム602に対して、ディスクアクセスに使用されているパス504の遮断、および待機系102からのパス接続を含む、ディスクアクセスのパスの切り換え要求を発行する(S204)。パス設定プログラム602は、次に待機系102が使用する切り換え先のパス505が利用可能であるかどうかを調査する(S301)。パス505が利用可能であれば(S302のYES)、実行系101からのディスクアクセスを遮断(禁止)し、待機系102からのディスクアクセスを許可するようにパス管理テーブル603(詳細は後記)を書き換える(S303)。その後、クラスタプログラム204に結果を送信する(S304)。
クラスタプログラム204は、パス切り換えが正常終了したかどうかの判定を行う(S401)。パス切り換えが正常終了しなかった場合には(S401のNO)、系の切り替えに失敗した(S402)ことになり、それ以降の系の切り替え処理を行わないため、待機系102では、サーバプログラム206を起動しない。パス切り換えが正常終了した場合には(S401のYES)、待機系102のクラスタプログラム204は、基幹LANアダプタのエイリアス(別名)IPアドレスの付け替え(LAN切り替え)を行い(S403)、系情報テーブル208の状態変更を行う(S404)。具体的には、実行系101の状態を削除し、待機系102の状態を待機状態から稼動状態に設定する。これは、待機系102が実行系の計算機となったことを示す。そして、サーバプログラム206を起動する(S405)。待機系102のサーバプログラム206は、共有ディスク装置105を参照して、実行系101に障害が発生し、業務処理が停止した時点のチェックポイントから業務処理を開始する(S501)。さらに、クラスタプログラム204は、系が3つ以上ある場合に、全系に対して系切り替え完了通知を行う(S601)。なお、実行系101のクラスタプログラム203では、ディスクアクセスのパス504が切断された後、障害情報を収集することができる(S701)。
以上の一連の処理により、実行系101の障害検出時に、ディスクアクセスのパスを切り換えることによって、リセットを行うことなく系切り替えを行うことが可能となる。また、パスの切り換え処理が完了した後から、実行系101の障害調査を行うことができる。
<テーブルの構成>
図3は、パス管理テーブルの構成を示す図であり、障害発生前後の状態を含めて示している。この図3は、FC−SW104の内部において、どのポート間のパスがアクセス可能であるかという情報をまとめたパス管理テーブル603を示したものである。
障害発生前のパス管理テーブル6031は、ディスク(共有ディスク装置105)側ポートIDP3に対して、計算機側ポートIDP1からはアクセスできるが、計算機側ポートIDP2からはアクセスできないことを示している。実行系101で系障害が発生し、待機系102がポートIDP1からポートIDP3へのアクセスを切断する要求を出した場合、障害後のパス管理テーブル6032に示すように、ポートIDP3に対して、ポートIDP1からはアクセスできなくなるが、系の切り替えによってポートIDP2からはアクセスできるようになる。
このパス管理テーブル603をFC−SW104内のパス管理部601に持ち、パス設定プログラム602が共有ディスク装置105の排他制御を行うことによって、障害が発生した系(以下、障害系という)からの共有ディスク装置への書き込みを確実に防止することができる。また、ポート間のアクセスパスを容易に操作できることから、FCアダプタを多重化した場合においても、柔軟なアクセス制御が可能となる。
<ハードウェアの構成>
図4は、クラスタシステムのハードウェア構成を示す図である。クラスタシステム1は、実行系101、待機系102、FC−SW104、共有ディスク装置105を含んで構成される。実行系101の計算機内では、CPU(Central Processing Unit)106、メモリ112、監視パス用のLANアダプタ302、FC−SW制御用のLANアダプタ701、FCアダプタ401および入出力装置110がバス108を介して接続されている。待機系102の計算機の構成も同様である。メモリ112、113上には、OS201、202、クラスタプログラム203、204およびサーバプログラム205、206がそれぞれロードされている。各クラスタプログラム203、204は、系の情報を管理する系情報テーブル207、208をそれぞれ持つ。FCアダプタ401、402、LANアダプタ701、702および共有ディスク装置105は、FC−SW104に接続する。監視パス用のLANアダプタ302、303は、系の監視を行うためのHeart Beatメッセージのやりとりに使用される。
≪第2の実施の形態≫
次に、本発明の第2の実施の形態を説明する。なお、前記した実施の形態と重複する説明は省略する。
図5は、クラスタシステムの機能構成を示す図であり、特に、FC−SWの制御を管理プロセッサで行う場合の図である。図1では、FC−SW104の制御をクラスタプログラム204が行っているが、図5に示すように、ブレードサーバ103内に管理プロセッサ710が内蔵されているクラスタシステム1では、管理プロセッサ710がFC−SW104の制御を行う。図5では、LANアダプタ701、702を管理プロセッサ710に接続している。クラスタプログラム204が管理プロセッサ710に対して障害系101のディスクアクセスのパス切断要求を発行することにより、管理プロセッサ710で動作しているFC−SW制御プログラム711がFC−SW104に対してパス切断要求を発行し、FC−SW104内のパス設定プログラム602はパス504を切断する。
管理プロセッサ710を介することによって、管理プロセッサ710がFC−SW104との間のプロトコル処理を行うことになるので、各系のCPUに負荷をかけることなくFC−SW104の制御を行うことができるという効果がある。
図6は、クラスタシステムのハードウェア構成を示す図であり、特に、FC−SWの制御を管理プロセッサが行う場合の図である。実行系101のLANアダプタ701および待機系102のLANアダプタ702が管理プロセッサ710に接続されている。管理プロセッサ710では、FC−SW制御プログラム711が動作しており、FC−SW104の制御を行うことができる。
図7は、系の切り替えの処理を示すフローチャートであり、特に、FC−SWの制御を管理プロセッサで行う場合のフローチャートである。
実行系101の障害が発生してから待機系102のクラスタプログラム204がパス切り換え要求を発行するまで(S101ないしS204)の流れは、図2と同様である。クラスタプログラム204からのパス切り換え要求を管理プロセッサ710が受け取ると、FC−SW制御プログラム711はFC−SW104に対してパス切り換え要求を発行する(S205)。FC−SW104内のパス設定プログラム602は、切り換え先パスの状態調査を行う(S301)。このとき、切り換え先パスが利用可能であれば(S302のYES)、実行系101からのディスクアクセスを遮断(禁止)し、待機系102からのディスクアクセスを許可するようにパス管理テーブル603を書き換える(S303)。そして、その結果をFC−SW制御プログラム711に対して送信する(S304)。FC−SW制御プログラム711は、その結果を判定する(S401)。正常終了しなかった場合には(S401のNO)、系切り替え失敗通知であるエラーメッセージを待機系102のクラスタプログラム204に送信し、クラスタプログラム204は、サーバプログラム206の起動を中止する。パスの切り換えが正常終了した場合には(S401のYES)、クラスタプログラム204に対してその結果を正常終了メッセージとして送信する(S406)。その後の処理は、図2と同様である。
≪第3の実施の形態≫
次に、本発明の第3の実施の形態を説明する。なお、前記した実施の形態と重複する説明は省略する。
FC−SWでは、複数の計算機でディスク装置を共有している場合、他の計算機が使用しているディスク装置に不正な書き込みを行わないように、ポートのグループを定義することができる。異なるグループに属するポートに接続された計算機は、互いに認識できない。この技術はゾーニングと呼ばれる。これを用いて、系障害が発生したことを契機に、障害系のポートを別のゾーンに分離することで不正なディスクアクセスを防ぐことができる。
図8は、ゾーン管理テーブルの構成を示す図である。ゾーン管理テーブルは、ゾーンに属するポートを変更することによって、各ポートに接続される計算機(実行系(障害系)101、待機系102)と共有ディスク装置105との間におけるアクセスの排他制御を行うテーブルである。障害が発生する前のゾーン管理テーブル6033では、FC−SW104に付属するポート1、ポート3およびポート4がゾーン1に割り当てられ、ポート2がゾーン2に割り当てられている。これによって、ポート2に接続されている待機系102が、ポート3に接続されている共有ディスク装置105にアクセスできないように制御される。そして、実行系101に障害が発生し、系の切り替えが行われる際には、障害が発生した後のゾーン管理テーブル6034に示すように、ポート1をゾーン2に変更し、ポート2をゾーン1に変更することによって、障害系101からのゾーン1のリソース(特に、共有ディスク装置105)へのアクセスを禁止し、待機系102からのゾーン1のリソース(特に、共有ディスク装置105)へのアクセスを許可することができる。
≪第4の実施の形態≫
次に、本発明の第4の実施の形態を説明する。なお、前記した実施の形態と重複する説明は省略する。
図9は、クラスタシステムおよびFC−SWのハードウェア構成を示す図であり、特に、ブレードサーバがローカルディスク装置を持たず、メモリダンプ取得用の領域が共有ディスク装置内に存在する場合の図である。
この構成は、ローカルディスク装置を持たないブレードサーバのあるクラスタシステムにおいて、共有ディスク装置にメモリダンプを取る場合、系の切り替えにより障害系のデータ転送用パスが切断されると、共有ディスク装置へのアクセスができなくなるため、障害系のメモリダンプが取られないという問題を解決するものである。
実行系101および待機系102の構成については、FCアダプタを2個使用している以外は図1と同様であるため、FC−SW104、共有ディスク装置106およびそれらに接続されている部分を示す。
この構成では、業務用およびダンプ用にそれぞれ1本ずつFCを使用している。すなわち、図9に示すように、業務用FCアダプタ4011、4021およびダンプ用FCアダプタ4012、4022は、それぞれ個別のFCケーブルを介してFC−SW104に接続されている。共有ディスク装置106内には、業務用領域1061およびダンプ用領域1062が存在し、それらが接続されるFCアダプタ(図示せず)があるものとする。なお、ダンプ用領域1062は、メモリダンプを取得する場合に使用される。図9に示すように、これらのアダプタは、FC−SW104内のポートP11(5011)、P12(5012)、P21(5021)、P22(5022)およびP31(5031)に接続されており、ポート間のパスはパス管理部601によって管理される。パス管理部601は、各ポートに対して当該ポート以外のすべてのポートとの間のパスを管理しており、その接続(通信許可とする)および切断(通信不可とする)を行うことができる。
なお、図9では、共有ディスク装置106において、業務用領域106およびダンプ用領域1062が別のディスク装置にそれぞれ設定されているように示されているが、業務用領域106およびダンプ用領域1062が1つのディスク装置に論理ユニットを分けて設定されるようにしてもよい。
実行系101に障害が発生した場合には、待機系102のクラスタプログラム204(図1参照)が障害系101の業務用のパス5041を切断する要求をFC−SW104に対して発行する。FC−SW104が、その要求を受けると、障害系101の業務用のパス5041は切断するが、ダンプ用のパス5042は接続する。これは、障害系101の業務用FC(データ転送用パス)と共有ディスク装置106との間のアクセスを禁止し、ダンプ用FC(ダンプ出力用パス)と共有ディスク装置106との間のアクセスを許可することを意味する。これによって、障害系101は、系の切り替え後もメモリダンプ用領域1062に対してはアクセスできるため、障害系101のメモリダンプを取得することが可能である。
これによれば、ローカルディスク装置を持たないブレードサーバのあるクラスタシステムにおいても、リセット操作が不要であり、メモリダンプを取りつつ、系の切り替えを安全に行うことが可能となる。
≪第5の実施の形態≫
次に、本発明の第5の実施の形態を説明する。なお、前記した実施の形態と重複する説明は省略する。
図10は、クラスタシステムの機能構成を示す図であり、特に、系の切り替え時にファイバチャネル接続記憶制御装置(以下、記憶制御装置)を用いてディスクアクセスの排他制御を行う場合の図である。
実行系および待機系の構成については、図1と同様であるため、FC−SW104およびストレージシステム801を示す。FC−SW104は、ストレージシステム801に接続されており、ストレージシステム801は、記憶制御装置802および共有ディスク装置105を含んで構成される。記憶制御装置802は、ファイバチャネル制御部803、デバイスインタフェース制御部804、マイクロプロセッサ805、制御メモリ806から構成される。制御メモリ806内には、制御テーブル807が格納されており、マイクロプロセッサ805から読み書きすることができる。ファイバチャネル制御部803は、実行系101および待機系102からのアクセスに対してマイクロプロセッサ805への割り込みや、ディスクアクセス要求元への応答を行う。デバイスインタフェース制御部804では、共有ディスク装置105のアクセス制御を行う。
記憶制御装置802を用いた場合、実行系101の障害を検知すると、待機系102のクラスタプログラム204は、FC−SW104を通して記憶制御装置802に対して、障害系101からのディスクアクセスを拒否する要求を発行する。ファイバチャネル制御部803は、マイクロプロセッサ805に割り込みをかけ、マイクロプロセッサ805は、障害系101からの要求を拒否するように制御テーブル807を書き換える。次に、障害系101からのアクセス要求があった場合には、マイクロプロセッサ805が制御テーブル807を参照したときにアクセスを拒否する設定になっているため、ディスク装置の排他処理が実現でき、安全に系の切り替えを行うことが可能となる。
この方法においても、障害系101のリセットが必要ないため、メモリダンプを取る必要はない。
図11は、記憶制御装置で使用される制御テーブルの構成を示す図である。記憶制御装置802で使用する識別名としては、実行系101をHOSTA、待機系102をHOSTBとする。また、ファイバチャネル制御部803のポート名をCTL0P0とする。障害が発生する前は、制御メモリ806内に制御テーブル8071が記憶されており、共有ディスク装置105に対して、実行系101からはアクセス可能であり、待機系102からはアクセス不可の状態となっている。実行系101に障害が発生した場合には、制御テーブル8072に示すように状態を変更して、実行系101からはアクセスを不可とし、待機系102からはアクセスを可能とする。
以上の説明によれば、待機系102のクラスタプログラム204が実行系101の障害を検知した場合、FC−SW104内のデータ転送のパス504を切断することにより、障害系101から共有ディスク装置105への不正なアクセスを抑止しつつ、系切り替えを行うことができる。その際、待機系102のクラスタプログラム204は実行系101に対してCPUのリセット処理を行う必要がないため、リセット処理に必要な専用のハードウェアが不要になる。このため、汎用性が高く、コストの削減にも繋がるため,計算機の拡張も容易になる。
次に、障害系101のメモリ内容は系切り替え後も保持されているため、メモリダンプを取らずに障害原因の調査を行うことが可能となる。また、LVMのようなOS依存のソフトウェアも不要となる。さらに、共有ディスク装置105との間のデータ転送に多重化したファイバケーブルを用いることにより、スループットの向上も期待できる。これによれば、各系の計算機からの共有ディスク装置105へのアクセスの排他制御を確実に行うことができる。
以上本発明の実施の形態について説明したが、図1に示すクラスタシステム1のそれぞれで実行されるプログラム(ストレージアクセス制御プログラムを含む)をコンピュータによる読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、本発明の実施の形態に係るクラスタシステム1が実現されるものとする。
≪その他の実施の形態≫
以上本発明について好適な実施の形態について一例を示したが、本発明は前記実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。例えば、以下のような実施の形態が考えられる。
(1)前記実施の形態では、ブレードサーバ103に実行系101および待機系102の2個の計算機があるように記載したが、ブレードサーバ103が3個以上の計算機から構成されていてもよい。また、前記実施の形態では、共有ディスク装置105が1台であるように示したが、2台以上の構成であってもよい。
(2)前記実施の形態では、系の切り替えおよびディスクアクセスの制御を、各計算機およびFC−SWのプログラムが行うように記載したが、それらの制御をハードウェアまたはオブジェクトが行うようにしてもよい。
本発明の第1の実施の形態に係るクラスタシステムの機能構成を示す図である。 本発明の第1の実施の形態に係る系の切り替えの処理を示すフローチャートである。 本発明の第1の実施の形態に係るパス管理テーブルの構成を示す図である。 本発明の第1の実施の形態に係るクラスタシステムのハードウェア構成を示す図である。 本発明の第2の実施の形態に係るクラスタシステムの機能構成を示す図である。 本発明の第2の実施の形態に係るクラスタシステムのハードウェア構成を示す図である。 本発明の第2の実施の形態に係る系の切り替えの処理を示すフローチャートである。 本発明の第3の実施の形態に係るゾーン管理テーブルの構成を示す図である。 本発明の第4の実施の形態に係るクラスタシステムおよびFC−SWのハードウェア構成を示す図である。 本発明の第5の実施の形態に係るクラスタシステムの機能構成を示す図である。 本発明の第5の実施の形態に係る制御テーブルの構成を示す図である。
符号の説明
1 クラスタシステム
101 実行系(実行系計算機)
102 待機系(待機系計算機)
104 FC−SW(パス接続スイッチ、ファイバチャネルスイッチ、LANスイッチ)
105、106 共有ディスク装置(ストレージ装置)
501、502、503 ポート
504、505、506 パス
603、6031、6032 パス管理テーブル
6033、6034 ゾーン管理テーブル
802 記憶制御装置(ストレージ制御装置)

Claims (8)

  1. 所定の処理を行う実行系計算機と、
    前記実行系計算機に障害が発生した場合に、前記実行系計算機の処理を引き継ぐ待機系計算機と、
    前記処理に伴って、前記実行系計算機および前記待機系計算機からアクセスを受け、所定のデータを入出力するストレージ装置と、
    前記実行系計算機、前記待機系計算機および前記ストレージ装置とがそれぞれ通信するための複数のポートを備え、それらのポート間を接続するパスを制御するパス接続スイッチと、
    を備えるクラスタシステムにおけるストレージアクセス制御方法であって、
    前記待機系計算機が、前記実行系計算機に障害が発生したことを検出した場合に、前記パス接続スイッチに前記各計算機と前記ストレージ装置との間のパスの切り換え要求を送信し、
    前記パス接続スイッチは、前記パスの切り換え要求を受信した場合に、前記実行系計算機と前記ストレージ装置との間のアクセスを禁止するとともに、前記待機系計算機と前記ストレージ装置との間のアクセスを許可するように前記パスを設定し、そのパスの設定結果を前記待機系計算機に送信し、
    前記待機系計算機は、前記パスの設定結果を受信した場合に、前記実行系計算機が行っていた処理を引き継ぐ
    ことを特徴とするストレージアクセス制御方法。
  2. 前記パス接続スイッチは、
    ファイバチャネルスイッチであり、
    所定のゾーンとそのゾーンに属するポートとの関係を管理するゾーン管理テーブルを備え、
    前記実行系計算機と前記ストレージ装置との間のアクセスを禁止するときに、前記実行系計算機のポートと前記ストレージ装置のポートとを異なるゾーンに割り当てるように前記ゾーン管理テーブルを設定し、
    前記待機系計算機と前記ストレージ装置との間のアクセスを許可するときに、前記待機系計算機のポートと前記ストレージ装置のポートとを同じゾーンに割り当てるように前記ゾーン管理テーブルを設定する
    ことを特徴とする請求項1に記載のストレージアクセス制御方法。
  3. 前記パス接続スイッチは、LANスイッチであること
    を特徴とする請求項1に記載のストレージアクセス制御方法。
  4. 前記実行系計算機および前記待機系計算機のメモリダンプ用領域が前記ストレージ装置内に存在する場合、
    前記クラスタシステムは、
    前記実行系計算機と前記パス接続スイッチ、および、前記待機系計算機と前記パス接続スイッチの間に、それぞれの間のアクセスパスとしてデータ転送用パスおよびダンプ出力用パスを備え、
    前記パス接続スイッチは、
    前記実行系計算機と前記ストレージ装置との間のアクセスを禁止するときに、前記実行系計算機のデータ転送用パスと前記ストレージ装置との間のアクセスを禁止し、前記実行系計算機のダンプ出力用パスと前記ストレージ装置との間のアクセスを許可する
    ことを特徴とする請求項1ないし請求項3のいずれか一項に記載のストレージアクセス制御方法。
  5. 所定の処理を行う実行系計算機と、
    前記実行系計算機に障害が発生した場合に、前記実行系計算機の処理を引き継ぐ待機系計算機と、
    前記処理に伴って、前記実行系計算機および前記待機系計算機からアクセスを受け、所定のデータの入出力を制御するストレージ制御装置と、
    前記ストレージ制御装置に接続され、前記データを入出力するストレージ装置と、
    前記実行系計算機、前記待機系計算機および前記ストレージ制御装置とがそれぞれ通信するための複数のポートを備え、前記実行系計算機と前記ストレージ制御装置との間、および、前記待機系計算機と前記ストレージ制御装置との間をそれぞれ接続するパス接続スイッチと、
    を備えるクラスタシステムにおけるストレージアクセス制御方法であって、
    前記待機系計算機は、前記実行系計算機に障害が発生したことを検出した場合に、前記パス接続スイッチを介して前記ストレージ制御装置に前記実行系計算機からのアクセスを拒否する要求を送信し、
    前記ストレージ制御装置が、前記要求を受信した場合に、前記実行系計算機からのアクセスを拒否するように内部テーブルを設定し、
    前記待機系計算機が、前記実行系計算機が行っていた処理を引き継ぐ
    ことを特徴とするストレージアクセス制御方法。
  6. 所定の処理を行う実行系計算機と、
    前記実行系計算機に障害が発生した場合に、前記実行系計算機の処理を引き継ぐ待機系計算機と、
    前記処理に伴って、前記実行系計算機および前記待機系計算機からアクセスを受け、所定のデータを入出力するストレージ装置と、
    前記実行系計算機、前記待機系計算機および前記ストレージ装置とがそれぞれ通信するための複数のポートを備え、それらのポート間を接続するパスを制御するパス接続スイッチと、
    を備えるクラスタシステムであって、
    前記待機系計算機は、前記実行系計算機に障害が発生したことを検出した場合に、前記パス接続スイッチに前記各計算機と前記ストレージ装置との間のパスの切り換え要求を送信し、
    前記パス接続スイッチは、前記パスの切り換え要求を受信した場合に、前記実行系計算機と前記ストレージ装置との間のアクセスを禁止するとともに、前記待機系計算機と前記ストレージ装置との間のアクセスを許可するように前記パスを設定し、そのパスの設定結果を前記待機系計算機に送信し、
    前記待機系計算機は、前記パスの設定結果を受信した場合に、前記実行系計算機が行っていた処理を引き継ぐ
    ことを特徴とするクラスタシステム。
  7. 所定の処理を行う実行系計算機と、
    前記実行系計算機に障害が発生した場合に、前記実行系計算機の処理を引き継ぐ待機系計算機と、
    前記処理に伴って、前記実行系計算機および前記待機系計算機からアクセスを受け、所定のデータを入出力するストレージ装置と、
    がそれぞれ通信するための複数のポートを備え、それらのポート間を接続するパスを制御するパス接続スイッチであって、
    前記待機系計算機からの要求によって、障害が発生した前記実行系計算機と前記ストレージ装置との間のアクセスを禁止し、前記待機系計算機と前記ストレージ装置との間のアクセスを許可すること
    を特徴とするパス接続スイッチ。
  8. 所定の計算機およびパス接続スイッチに請求項1ないし請求項5のいずれか一項に記載のストレージアクセス制御方法を実行させることを特徴とするストレージアクセス制御プログラム。
JP2004381999A 2004-12-28 2004-12-28 ストレージアクセス制御方法、クラスタシステム、パス接続スイッチおよびストレージアクセス制御プログラム Pending JP2006189963A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004381999A JP2006189963A (ja) 2004-12-28 2004-12-28 ストレージアクセス制御方法、クラスタシステム、パス接続スイッチおよびストレージアクセス制御プログラム
US11/317,001 US20060146809A1 (en) 2004-12-28 2005-12-27 Method and apparatus for accessing for storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004381999A JP2006189963A (ja) 2004-12-28 2004-12-28 ストレージアクセス制御方法、クラスタシステム、パス接続スイッチおよびストレージアクセス制御プログラム

Publications (1)

Publication Number Publication Date
JP2006189963A true JP2006189963A (ja) 2006-07-20

Family

ID=36640323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004381999A Pending JP2006189963A (ja) 2004-12-28 2004-12-28 ストレージアクセス制御方法、クラスタシステム、パス接続スイッチおよびストレージアクセス制御プログラム

Country Status (2)

Country Link
US (1) US20060146809A1 (ja)
JP (1) JP2006189963A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146627A (ja) * 2006-12-12 2008-06-26 Hitachi Ltd 複数のデータセンタにおけるストレージリソース管理のための方法および装置
JP2008234604A (ja) * 2007-03-23 2008-10-02 Toshiba Corp クラスタシステム及びプログラム
JP2009075710A (ja) * 2007-09-19 2009-04-09 Fujitsu Ltd 冗長化システム
JP2009187090A (ja) * 2008-02-04 2009-08-20 Nec Corp クラスタシステムおよび情報処理方法
JP2014026529A (ja) * 2012-07-27 2014-02-06 Fujitsu Ltd ストレージシステムおよびその制御方法
WO2014084198A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 ストレージエリアネットワークシステム、制御装置、アクセス制御方法及びプログラム
JP2015056042A (ja) * 2013-09-12 2015-03-23 日本電気株式会社 クラスタシステム、情報処理装置、クラスタシステムの制御方法及びプログラム
JP2017072989A (ja) * 2015-10-07 2017-04-13 株式会社東芝 ロジック実行装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006253900A (ja) * 2005-03-09 2006-09-21 Hitachi Ltd Ipアドレス引き継ぎ方法、ipアドレスアドレス引き継ぎプログラム、サーバおよびネットワークシステム
JP2010086364A (ja) * 2008-10-01 2010-04-15 Fujitsu Ltd 情報処理装置、動作状態監視装置および方法
US10999187B2 (en) * 2019-06-13 2021-05-04 Juniper Networks, Inc. Wireless control and fabric links for high-availability cluster nodes

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5363502A (en) * 1990-06-08 1994-11-08 Hitachi, Ltd. Hot stand-by method and computer system for implementing hot stand-by method
US6237108B1 (en) * 1992-10-09 2001-05-22 Fujitsu Limited Multiprocessor system having redundant shared memory configuration
US6317844B1 (en) * 1998-03-10 2001-11-13 Network Appliance, Inc. File server storage arrangement
US6725394B1 (en) * 2000-10-02 2004-04-20 Quantum Corporation Media library with failover capability
JP4155399B2 (ja) * 2003-03-28 2008-09-24 株式会社日立製作所 コンピュータ処理方法及びその実施システム並びにその処理プログラム
FI20031628A0 (fi) * 2003-11-10 2003-11-10 Nokia Corp Tietokoneryväs, tietokoneyksikkö ja menetelmä muistisaannin ohjaukseen tietokoneyksiköiden välillä
JP4490745B2 (ja) * 2004-06-29 2010-06-30 株式会社日立製作所 ホットスタンバイシステム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146627A (ja) * 2006-12-12 2008-06-26 Hitachi Ltd 複数のデータセンタにおけるストレージリソース管理のための方法および装置
JP2008234604A (ja) * 2007-03-23 2008-10-02 Toshiba Corp クラスタシステム及びプログラム
JP2009075710A (ja) * 2007-09-19 2009-04-09 Fujitsu Ltd 冗長化システム
JP2009187090A (ja) * 2008-02-04 2009-08-20 Nec Corp クラスタシステムおよび情報処理方法
JP2014026529A (ja) * 2012-07-27 2014-02-06 Fujitsu Ltd ストレージシステムおよびその制御方法
WO2014084198A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 ストレージエリアネットワークシステム、制御装置、アクセス制御方法及びプログラム
JP2015056042A (ja) * 2013-09-12 2015-03-23 日本電気株式会社 クラスタシステム、情報処理装置、クラスタシステムの制御方法及びプログラム
JP2017072989A (ja) * 2015-10-07 2017-04-13 株式会社東芝 ロジック実行装置

Also Published As

Publication number Publication date
US20060146809A1 (en) 2006-07-06

Similar Documents

Publication Publication Date Title
US7802127B2 (en) Method and computer system for failover
EP1760591B1 (en) System and method of managing access path
KR100557399B1 (ko) 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법
JP5332000B2 (ja) 複合型計算機装置、複合型計算機の管理方法及び管理サーバ
US20060146809A1 (en) Method and apparatus for accessing for storage system
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
JP6056554B2 (ja) クラスタシステム
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
JP5561622B2 (ja) 多重化システム、データ通信カード、状態異常検出方法、及びプログラム
JP4529767B2 (ja) クラスタ構成コンピュータシステム及びその系リセット方法
JP2006293863A (ja) ディスクアレイ装置及びその制御方法
WO2014174594A1 (ja) ストレージシステムおよびストレージシステムの障害管理方法
JP2008112399A (ja) ストレージ仮想化スイッチおよびコンピュータシステム
US20120144006A1 (en) Computer system, control method of computer system, and storage medium on which program is stored
JP4818843B2 (ja) リモートコピーを行うストレージシステム
US20010016919A1 (en) Storage system
JP2005196490A (ja) データ多重化のためのシステム及び方法
JP3957065B2 (ja) ネットワーク計算機システムおよび管理装置
US8918670B2 (en) Active link verification for failover operations in a storage network
JP3555047B2 (ja) 複合コンピュータシステム
JP4511455B2 (ja) ファイバーチャネルスイッチおよびそれを用いたコンピュータシステム
JP2007334668A (ja) メモリダンプ方法、クラスタシステム、それを構成するノードおよびプログラム
JP2007334764A (ja) Nasシステムおよびnasシステムの情報処理方法
CN113535471A (zh) 集群服务器
JP6822706B1 (ja) クラスタシステム、サーバ装置、引継ぎ方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060808

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090203

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090403

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091201