JP2001005691A - クラスタリングシステムおよび記録媒体 - Google Patents

クラスタリングシステムおよび記録媒体

Info

Publication number
JP2001005691A
JP2001005691A JP11174710A JP17471099A JP2001005691A JP 2001005691 A JP2001005691 A JP 2001005691A JP 11174710 A JP11174710 A JP 11174710A JP 17471099 A JP17471099 A JP 17471099A JP 2001005691 A JP2001005691 A JP 2001005691A
Authority
JP
Japan
Prior art keywords
communication
state
disk array
inquiry
program unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11174710A
Other languages
English (en)
Inventor
Kenichi Abe
健一 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP11174710A priority Critical patent/JP2001005691A/ja
Publication of JP2001005691A publication Critical patent/JP2001005691A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】 特定のクラスタリングの環境に依存せずクラ
スタの状態を把握する。 【解決手段】 能動的通知手段(8,10)は、プライ
ベートLAN(18)を介して、エージェントプログラ
ム部(6,5)へヘルスチェックのための問い合わせを
行い、その結果により、ディスクアレイ装置(22)の
状態、または“相手通信不能”をマネージャプログラム
部(7)へ通信する。非同期返答手段(9,11)は、
自己が正常なら“正常”状態を、また、マネージャプロ
グラム部から問い合わせを受けると、ディスクアレイ装
置の状態を取得して送信する。受動的状態取得手段(1
2)は、能動的通知手段からSCSI通信があると、デ
ィスクアレイ装置の状態を出力装置に表示する。状態遷
移判定手段(13)は、相手エージェントプログラム部
の非同期返答手段に問い合わせ、返答があればプライベ
ートLANの障害、返答がなければフェールオーバを出
力装置に表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はクラスタリングシス
テム、特に、各ノードの状態遷移の認識およびこれを適
用した周辺記憶管理用プログラムに関する。
【0002】
【従来の技術】従来のクラスタリング通報技術を説明す
る前に、まず、クラスタリング技術が注目されるように
なった背景について説明する。
【0003】周辺記憶装置の一種のディスクアレイ装置
は、一般に、パーソナルコンピュータなどの外部記憶装
置に使われるHDD(ハードディスクドライブ)に比べ
て大容量であり、かつ、運用中にディスクアレイ装置内
に構成されている複数のHDDのうちの冗長なデータを
記録しておくことにより、ディスクアレイ装置内のHD
Dが数台故障しても記憶されたデータが保証できる。さ
らに、装置を動作させるための電源や、空冷用のファン
などにも冗長性を持たせることにより、1台の電源やフ
ァンが壊れても、ホストコンピュータを止めずに、運用
中に故障した部品を交換できる機能を持った高信頼性記
憶装置とすることができる。
【0004】ディスクアレイ装置は、アメリカのANS
Iにより規格化されたSCSIインターフェイスによ
り、その規格化されたケーブルを介してホストコンピュ
ータと接続されるのが一般的である。そして、ホストコ
ンピュータより、SCSIコマンドをディスクアレイ装
置に送信して、その内容によってホストコンピュータの
データをディスクアレイ装置に書き込んだり、ディスク
アレイ装置に記憶されたデータをホストコンピュータに
読み出したり、現在のHDDやファンの状態を読み出し
たりすることができるようになっている。
【0005】このようなディスクアレイ装置を管理する
ディスクアレイ管理ソフトウエアは、ディスクアレイ装
置の部品が正常に動作しているのか、故障していて交換
が必要なのか、といった部品の良否判定情報をコンピュ
ータのディスプレイに表示したり、また、RAID(Re
dundant Array of Disks)と呼ばれるディスクアレイ装
置で実現される、いくつかのデータ記録方式の選択指示
や、突然の部品故障をホストコンピュータのディスプレ
イや、登録してある電子メールのアドレス先に通報する
などの機能をユーザに提供するものである。
【0006】また、最近では、GUI(Graphical User
Interface)を搭載して、ディスクアレイ装置の状態
を、カラフルに視覚的にユーザに見せて操作性を向上さ
せた製品が、市場に流通してきている。ディスクアレイ
管理ソフトウェアを動作させるためのOSもWindows3.X
95, NT(Microsoft社)や、Netware(ノベル社),HP-
UX(ヒューレットパッカード社)、Solaris(サンマイ
クロシステム社)など種々のものがある。
【0007】従来、このディスクアレイ管理ソフトウエ
アは、ディスクアレイ装置が繋がっているサーバマシン
上で動作して、ユーザはそのサーバマシンでディスクア
レイ管理サービスを受けていたが、ディスクアレイ装置
を接続したサーバを複数台使って稼働させる企業ユーザ
などが増えてきたり、サーバマシン上のディスプレイを
外して運用するユーザが出てきたこともあって、ディス
クアレイ装置の管理を一元化して、その現場まで行って
ユーザがそれぞれのディスクアレイを管理するよりも、
職場にある一台のクライアントマシンから、全てのディ
スクアレイのサービスを行えるような方式が主流になっ
てきた。
【0008】そのために、近年は、ディスクアレイ管理
ソフトウエアの構造は、各サーバマシンにすべての機能
を備えたプログラムを実装する方式から、クライアント
マシンにマネージャプログラム部、各サーバマシン上に
はエージェントプログラム部を配置して、LANを経由
して相互に通信し合い、各サーバマシンのエージェント
プログラム部は、クライアントマシンのマネージャプロ
グラム部から受け取った指示内容から自己のサーバマシ
ンに接続されているディスクアレイ装置に指示を出した
り、ディスクアレイ装置から受け取った値をマネージャ
プログラム部へ送ることにより、マネージャプログラム
部がディスクアレイ装置の一元管理を行うサービスを提
供する方式が採用されるようになっている。
【0009】このような状況の中、サーバ自体の信頼性
を向上させるために、クラスタリング技術が脚光を浴び
始めたのである。
【0010】さて、従来のクラスタリング通報技術につ
いて説明する。図8は、従来のクラスタシステム全体の
構成を示すブロック図である。
【0011】図8において、マネージャプログラム部
(7)は、ディスクアレイ装置(22)の運用状況や設
定を支援するアプリケーションソフトウエアの下、クラ
イアントマシン(16)上で動作して、ユーザにディス
クアレイ装置(22)の情報をGUIで表示したり、ユ
ーザからキーボードやマウスの指示を受けてディスクア
レイ装置(22)に指示を与える起点となる。なお、上
記アプリケーションソフトウエアは、2台のサーバマシ
ン(14)および(15)を用いてクラスタリング管理
を行うOS(21)の下で動作する。
【0012】また、エージェントプログラム部(5,
6)は、クラスタリングされているサーバマシン(1
4,15)上で動作して、マネージャプログラム部
(7)からの指示を受け、そのサーバマシン(14,1
5)に接続されているディスクアレイ装置(22)にS
CSIコマンドを出し、ディスクアレイ装置(22)か
ら返ってきたデータを基に指示の返答をマネージャプロ
グラム部(7)に返信する。
【0013】このクラスタシステムでは、通常、サーバ
マシン(14)が動作しており、サーバマシン(15)
は待機状態になっている。そして、サーバマシン(1
4)が何らかの原因で故障した場合は、サーバマシン
(15)が代わりに運用を開始する仕組みになってい
る。しかし、それぞれのエージェントプログラム部
(5,6)は、各OS(19,20)の特別なクラスタ
API(Application Programming Interface)を用い
ないと、どちらが起動しているのか自分自身で認識がで
きなく、さらに、マネージャプログラム部(7)から
は、クラスタリング機能により、2台のサーバマシン
(14,15)は高信頼性の1台のサーバマシンのよう
に見えるために、何時サーバマシン(14)からサーバ
マシン(15)に制御が切り替わったのか(フェールオ
ーバ:FailOver)、また、何時サーバマシン(14)に
制御が戻ったのか(フェールバック:FailBack)を認識
することができない。
【0014】そこで、この方式を採用しているクラスタ
リングのミドルウエアとして、Microsoft 社からは、Wi
ndows NT Server Enterprize Edition に搭載されてい
る Microsoft Cluster Server、NECからはCLUSTERPRO/A
ctive Recovery Managerプログラム部 が提供されてお
り、ネットワークで繋がれているクライアントマシンか
ら、FailOver や FailBack といった各ノードの状態を
認識できる専用のクラスタAPIが用意されている。
【0015】
【発明が解決しようとする課題】しかしながら、上述し
た従来のクラスタシステムでは、クライアントマシンの
アプリケーションは、このような専用のAPIを組み入
れて設計をすることでしか上記各ノードの状態を把握す
ることができないため、各社のミドルウエア専用にディ
スクアレイ装置ソフトウエアを設計しなくてはならない
という問題点がある。
【0016】本発明の目的は、特定のクラスタリングの
環境に依存せずに、クラスタの状態を把握できるクラス
タシステムおよびノード状態遷移認識方法を提供するこ
とにある。
【0017】本発明の他の目的は、上記目的を達成する
為に、周辺記憶装置に特別な機能を設けなくてもよいク
ラスタシステムおよびノード状態遷移認識方法を提供す
ることにある。
【0018】
【課題を解決するための手段】第1の本発明のクラスタ
リングシステムは、サーバマシンそれぞれに実装される
エージェントプログラム部がプライベートLANを介し
て定期的に相互に状態の問い合わせを行い、該問い合わ
せに対して、相手からの返答があればクライアントマシ
ンのマネージャプログラム部へ状態遷移の通知を行い、
該マネージャプログラム部は、状態遷移通知を受け取る
と、クラスタの状態を判別して、その結果を出力装置へ
出力することを特徴とする。
【0019】第2の本発明のクラスタリングシステム
は、マネージャプログラム部を有するクライアントマシ
ンが、それぞれエージェントプログラム部を有する複数
のサーバマシンに接続される周辺記憶装置のクラスタリ
ングシステムにおいて、前記エージェントプログラム部
は、前記マネージャプログラム部から問い合わせがある
と、コマンドにより前記周辺記憶装置の状態を取得した
結果を前記マネージャプログラム部へ通知し、また、定
期的に他のサーバマシンのエージェントプログラム部に
問い合わせをして、返答があれば前記コマンドで前記周
辺記憶装置の状態を取得した結果を、返答が無ければ通
信不能をそれぞれ前記マネージャプログラム部へ通知
し、前記マネージャプログラム部は、前記エージェント
プログラム部から前記周辺記憶装置の状態の通知をった
場合は、その結果を出力装置へ反映して、また、通信不
能を受け取った場合は、通信不能対象のエージェントプ
ログラム部へ問い合わせを行い、返答があれば前記各サ
ーバマシン間のプライベートLAN障害と判断して、一
方、返答がなければ該クラスタリングシステムがフェー
ルオーバ状態になったと判断して、前記出力装置に結果
を反映させることを特徴とする。
【0020】第3の本発明のクラスタリングシステム
は、マネージャプログラム部を有するクライアントマシ
ンが、それぞれエージェントプログラム部を有する複数
のサーバマシンに接続されるディスクアレイ装置のクラ
スタリングシステムにおいて、前記エージェントプログ
ラム部それぞれは、プライベートLANを介して、所定
の監視間隔時間でエージェントプログラム部へヘルスチ
ェックのための問い合わせを行い、その結果、返答があ
ればSCSI通信により取得したディスクアレイ装置の
状態を、一方、返答がなければ“相手通信不能”をそれ
ぞれマネージャプログラム部へパケットにより通信する
能動的通知手段と、該能動的通知手段から前記ヘルスチ
ェックのための問い合わせを受けると、自己が正常なら
“正常”状態を前記能動的通知手段に返答し、また、前
記マネージャプログラム部から問い合わせを受けると、
SCSI通信によりディスクアレイ装置の状態を取得し
て、マネージャプログラム部へ送信する非同期返答手段
とを有し、前記マネージャプログラム部は、前記能動的
通知手段からSCSI通信があると、この通信で伝えら
れる前記ディスクアレイ装置の状態を出力装置に表示す
る受動的状態取得手段と、前記能動的通知手段からの通
信がSCSI通信でないとき起動され、通信があった相
手エージェントプログラム部の前記非同期返答手段に問
い合わせを行い、その結果、その非同期返答手段から返
答があったときは前記出力装置に前記プライベートLA
Nの障害を表示し、また、返答がないときは前記出力装
置にフェールオーバを表示する状態遷移判定手段とを有
することを特徴とする。
【0021】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。
【0022】図2は、本発明の一実施形態のクラスタシ
ステム全体の構成図であり、2つのサーバマシン(1
4,15)をクラスタシステムのノードとして作用させ
る。クラスタの動作は、サーバマシン(14,15)の
OS(19,20)によって管理されており、クライア
ントマシン(16)からは、2台のサーバマシン(1
4,15)が1台の高信頼性サーバマシンとして動作す
るようにみえる。本クラスタシステムは、図8に示した
従来のクラスタシステムと類似するがサーバマシン(1
4)とサーバマシン(15)の間にはプライベートLA
N(18)が張られている。しかし、プライベートLA
N(18)を設けず、LAN(17)で代用してもよ
い。
【0023】クライアントマシン(16)のマネージャ
プログラム部(7)は、クラスタがFailOver になった
り FailBack になっても、動作中のエージェントプログ
ラム部から、ディスクアレイ装置(22)の状態と、ク
ラスタの状態を適切に把握して、出力装置(4)に結果
を表示することができる。
【0024】図1は、エージェントプログラム部(5,
6)とマネージャプログラム部(7)の詳細図であり、
エージェントプログラム部(5)は能動的通知手段
(8)および非同期返答手段(9)を備え、エージェン
トプログラム部(6)は能動的通知手段(10)および
非同期返答手段(11)を備え、マネージャプログラム
部(7)は受動的状態取得手段(12)および状態遷移
判定手段(13)を備える。
【0025】エージェントプログラム部(5)の能動的
通知手段(8)は、図2のプライベートLAN(18)
を介して、所定の監視間隔時間でエージェントプログラ
ム部(6)へヘルスチェックのための問い合わせを行
う。その結果、返答が有ればSCSI通信により取得し
たディスクアレイ装置(22)の状態を、一方、返答が
無ければ“相手通信不能”をそれぞれマネージャプログ
ラム部(7)へパケットにより通信する。
【0026】同様に、エージェントプログラム部(6)
の能動的通知手段(10)は、図2のプライベートLA
N(18)を介して、所定の監視間隔時間でエージェン
トプログラム部(5)へヘルスチェックのための問い合
わせを行う。その結果、返答が有ればSCSI通信によ
り取得したディスクアレイ装置(22)の状態を、一
方、返答が無ければ“相手通信不能”をそれぞれマネー
ジャプログラム部(7)へパケットにより通信する。
【0027】エージェントプログラム部(5)の非同期
返答手段(9)は、能動的通知手段(10)からプライ
ベートLAN(18)を介して、ヘルスチェックのため
の問い合わせを受けると、自己が正常なら“正常”状態
を能動的通知手段(10)に返答する。このとき、自己
が正常でないなら、当然通知はできない。また、マネー
ジャプログラム部(7)から問い合わせを受けると、S
CSI通信によりディスクアレイ装置(22)の状態を
取得して、マネージャプログラム部(7)へ送信する。
【0028】同様に、エージェントプログラム部(6)
の非同期返答手段(11)は、能動的通知手段(8)か
らプライベートLAN(18)を介して、ヘルスチェッ
クのための問い合わせを受けると、自己が正常なら“正
常”状態を能動的通知手段(8)に返答する。このと
き、自己が正常でないなら、当然通知はできない。ま
た、マネージャプログラム部(7)から問い合わせを受
けると、SCSI通信によりディスクアレイ装置(2
2)の状態を取得して、マネージャプログラム部(7)
へ送信する。
【0029】一方、マネージャプログラム部(7)の受
動的状態取得手段12は、エージェントプログラム部
(5,6)の能動的通知手段(8,10)からSCSI
通信があると、この通信で伝えられるディスクアレイ装
置(22)の状態を出力装置(4)に表示する。また、
エージェントプログラム部(5,6)の能動的通知手段
(8,10)からの通信がSCSI通信でないときは状
態遷移判定手段(13)を起動する。
【0030】状態遷移判定手段(13)は、通信があっ
た相手エージェントプログラム部の非同期返答手段に問
い合わせを行う。その結果、その非同期返答手段から返
答があったときは出力装置(4)にプライベートLAN
(18)の障害を表示し、また、返答がないときは出力
装置(4)にフェールオーバを表示する。
【0031】次に、図3および図4を用いて、本実施の
形態の全体の動作について説明する。
【0032】図3はエージェントプログラム部(5,
6)の相互通信と、その結果により、マネージャプログ
ラム部(7)へ相互通信の結果を通知する流れを示して
いる。図中のシーケンス1からシーケンス4へ時間が流
れるものとする。
【0033】シーケンス1では、クラスタとしては両ノ
ード(サーバマシン14,15)とも動作している正常
な状態であり、このときはエージェントプログラム部
(6)が、プライベートLAN18を介してエージェン
トプログラム部(5)へ問い合わせを行った結果、エー
ジェントプログラム部(5)が非同期返答手段(9)で
正常ステータスを返してきた。この場合は、エージェン
トプログラム部(6)の能動的通知手段(10)は、SC
SI I/Fを介して取得したディスクアレイ装置(22)の
状態情報をマネージャプロラム部(7)へ送る。
【0034】シーケンス2では、エージェントプログラ
ム部(6)がシーケンス1と同様にエージェントプログ
ラム部(5)へ問い合わせを行ったが、応答が無かっ
た。この場合、エージェントプログラム部(6)の能動
的通知手段(11)は、マネージャプログラム部(7)
へ今度は相手通信不能情報を送る。図3では、このフェ
ーズを右ノードへフェールオーバと示しているが、これ
だけの情報だけでは、プライベートLAN(18)障害
による通信不能の可能性もあるので、ここでは、フェー
ルオーバによる動作と、仮定しておく。
【0035】シーケンス3は、シーケンス2と同じ状態
が続いた時の例である。
【0036】シーケンス4では、今までエージェントプ
ログラム部(5)から応答が無かったのが、シーケンス
1と同様に応答がくるようになった場合である。エージ
ェントプログラム部(6)は正常ステータスが返ってく
ると、能動的通知手段(10)によってSCSI I/Fを介し
て取得したディスクアレイ装置(22)の状態情報をマ
ネージャプログラム部(7)へ送る。これだけの情報だ
けでは、プライベートLAN障害からの通信回復の可能
性もあるので、ここでは、左ノードへフェールバックし
た場合と仮定しておく。
【0037】図4は、マネージャプログラム部(7)の
動作概要を説明している。通常時(a)では、エージェ
ントプログラム部(5,6)から、図3により説明した
ように、ディスクアレイ装置(22)の状態情報が送ら
れてくると、受動的状態取得手段(12)により、現在
のディスクアレイ装置(22)の状態を出力装置(4)
出力する。
【0038】図3のシーケンス2が起こった場合、
(b)で示すように、エージェントプログラム部(6)
から通知がくるが、エージェントプログラム部(5)か
らはこない(図4のフロー1)。その場合は、状態遷移
判定手段(13)によって、マネージャプログラム部
(7)は、プライベートLAN(18)障害かフェール
オーバしたのかを判別する為に、通信不能対象のエージ
ェントプログラム部(5)へ状態の問い合わせをする
(c)。
【0039】その結果、エージェントプログラム部
(5)から応答が有ればプライベートLAN(18)障
害と判定し(c2)、また、応答が無ければフェールオー
バと判定して(c1)、それぞれの結果を出力装置(4)
に出力する。
【0040】図5は、図3に示した動作のうちの能動的
通知手段(8,10)に係る部分をフローにしたもので
ある。始めに、初期設定で通信先のエージェントプログ
ラム部やマネージャプログラム部(7)のIPアドレス
を入力装置(1,2)から指示してもらい(図5のステ
ップS1)、送信する内容はパケットに入れて送る方式
を採っているので、先ず、パケットをクリアする(ステ
ップS2)。
【0041】エージェントプログラム部(5,6)は、
OS(19,20)に対してSCSI通信をできる機能
を有しており、これによりディスクアレイ装置(22)
に対して SCSI Mode Sense コマンド等により現在のデ
ィスクアレイ装置(22)の状態を取得し(ステップS
3)、この情報をマネージャプログラム部(7)へ送る
(ステップS4)。そして、プロセッサの負荷に配慮す
るため、監視間隔時間スリープ(ステップS5)を経
て、相手エージェントへの問い合わせを行う(ステップ
S6)。この結果、返答が有ればステップS2へ移って
(ステップS7)パケットをクリアし、返答が無ければ
ステップS8へ移って(ステップS7)、”相手通信不
能”をパケットに入れる。ステップS8はステップS4
につながる。
【0042】図6は、図1で示した非同期返答手段
(9,11)の動作をフローにしたものである。これは
マネージャプログラム部(7)からの問い合わせに対す
るフロー(a)と、相手エージェントプログラム部から
の問い合わせに答えるフロー(b)の2つからなる。
【0043】図7は、マネージャプログラム部(7)の
動作をフローにしたものであり、図の左側が図1の受動
的状態取得手段(12)、右側が状態遷移判定手段(1
3)の動作を示す。
【0044】受動的状態取得手段(12)は、先ず、初
期設定で入力装置3からエージェントのIPアドレスを
得る(ステップS11)。そして、エージェントからの
通信を待ち合わせ(ステップS12)、通信があればS
CSI通信パケットか否かをチェックする(ステップS
13)。その結果、SCSI通信パケットであれば、出
力装置4にSCSIから取得したディスクアレイ装置2
2の状態を表示し(ステップS14)、SCSI通信パ
ケットでなければ、状態遷移判定手段(13)を起動す
る。
【0045】状態遷移判定手段(13)は、相手通信不
能先へ問い合わせ(S15)、その結果、通信が有れば
(ステップS16)出力装置4にプライベートLAN(1
8)の障害を表示し(ステップS17)、通信が無ければ
(ステップS16)出力装置4にフェールオーバ遷移を
表示する(ステップS18)。これによって、前述のシ
ーケンス2および3で行った仮定が確定する。
【0046】次に、本発明の第2の実施の形態として、
入力装置(1,2,3)を、特定のOSが認識できるフ
ァイルに置き換える方法が考える。上述した第1の実施
の形態では、初期設定で必ずIPアドレスを入力するよ
うになっているが、このようにファイル化することによ
り、OSがリブート(再起動)した時でも、そのファイ
ルからIPアドレスを読み込み、効率を上げることがで
きるようになる。
【0047】なお、上述したノード状態遷移認識の方法
をコンピュータに実行させるためのプログラムを半導体
メモリ,磁気ディスク等の記録媒体に記録して、コンピ
ュータに読み込ませ、実行させるようにしてもよい。具
体的には、図1におけるエージェントプログラム部
(5,6)を記憶した記録媒体をサーバマシン(14,
15)に接続し、また、マネージャプログラム部(7)
を記憶した記憶媒体をクライアントマシンに接続して、
それぞれのプログラムを読み込ませ、実行させればよ
い。
【0048】
【発明の効果】本発明の第1の効果は、エージェントプ
ログラム部自体が相互通信をして状態をマネージャプロ
グラム部に通知する構成としたため、各種クラスタのミ
ドルウエアが代わっても、クラスタシステムをそのまま
運用できることにある。
【0049】また、本発明の第2の効果は、上記第1の
効果は、周辺記憶装置に特別な機能を設けなくても得る
ことができるということである。
【図面の簡単な説明】
【図1】本発明の一実施の形態の要部を示す示すブロッ
ク図
【図2】本発明の一実施の形態の構成図
【図3】本発明におけるエージェントプログラム部の動
作の具体例を示す図
【図4】本発明におけるマネージャプログラム部の動作
の具体例を示す図
【図5】本発明におけるエージェントプログラム部のう
ちの能動的通知手段の動作を示す流れ図
【図6】本発明におけるエージェントプログラム部のう
ちの非同期返答手段の動作を示す流れ図
【図7】本発明におけるマネージャプログラム部の動作
を示す流れ図
【図8】従来のクラスタシステムの一例を示す構成図
【符号の説明】
1,2,3 入力装置 4 出力装置 5,6 エージェントプログラム部 7 マネージャプログラム部 8,10 能動的通知手段 9,11 非同期返答手段 12 受動的状態取得手段 13 状態遷移判定手段 14,15 サーバマシン 16 クライアントマシン 17 LAN 18 プライベートLAN 19,20,21 OS 22 ディスクアレイ装置

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 サーバマシンそれぞれに実装されるエー
    ジェントプログラム部がプライベートLANを介して定
    期的に相互に状態の問い合わせを行い、該問い合わせに
    対して、相手からの返答があればクライアントマシンの
    マネージャプログラム部へ状態遷移の通知を行い、該マ
    ネージャプログラム部は、状態遷移通知を受け取ると、
    クラスタの状態を判別して、その結果を出力装置へ出力
    することを特徴とするクラスタリングシステム。
  2. 【請求項2】 マネージャプログラム部を有するクライ
    アントマシンが、それぞれエージェントプログラム部を
    有する複数のサーバマシンに接続される周辺記憶装置の
    クラスタリングシステムにおいて、 前記エージェントプログラム部は、前記マネージャプロ
    グラム部から問い合わせがあると、コマンドにより前記
    周辺記憶装置の状態を取得した結果を前記マネージャプ
    ログラム部へ通知し、また、定期的に他のサーバマシン
    のエージェントプログラム部に問い合わせをして、返答
    があれば前記コマンドで前記周辺記憶装置の状態を取得
    した結果を、返答が無ければ通信不能をそれぞれ前記マ
    ネージャプログラム部へ通知し、 前記マネージャプログラム部は、前記エージェントプロ
    グラム部から前記周辺記憶装置の状態の通知をった場合
    は、その結果を出力装置へ反映して、また、通信不能を
    受け取った場合は、通信不能対象のエージェントプログ
    ラム部へ問い合わせを行い、返答があれば前記各サーバ
    マシン間のプライベートLAN障害と判断して、一方、
    返答がなければ該クラスタリングシステムがフェールオ
    ーバ状態になったと判断して、前記出力装置に結果を反
    映させることを特徴とするクラスタリングシステム。
  3. 【請求項3】 マネージャプログラム部を有するクライ
    アントマシンが、それぞれエージェントプログラム部を
    有する複数のサーバマシンに接続されるディスクアレイ
    装置のクラスタリングシステムにおいて、 前記エージェントプログラム部それぞれは、 プライベートLANを介して、所定の監視間隔時間でエ
    ージェントプログラム部へヘルスチェックのための問い
    合わせを行い、その結果、返答があればSCSI通信に
    より取得したディスクアレイ装置の状態を、一方、返答
    がなければ“相手通信不能”をそれぞれマネージャプロ
    グラム部へパケットにより通信する能動的通知手段と、 該能動的通知手段から前記ヘルスチェックのための問い
    合わせを受けると、自己が正常なら“正常”状態を前記
    能動的通知手段に返答し、また、前記マネージャプログ
    ラム部から問い合わせを受けると、SCSI通信により
    ディスクアレイ装置の状態を取得して、マネージャプロ
    グラム部へ送信する非同期返答手段とを有し、前記マネ
    ージャプログラム部は、 前記能動的通知手段からSCSI通信があると、この通
    信で伝えられる前記ディスクアレイ装置の状態を出力装
    置に表示する受動的状態取得手段と、 前記能動的通知手段からの通信がSCSI通信でないと
    き起動され、通信があった相手エージェントプログラム
    部の前記非同期返答手段に問い合わせを行い、その結
    果、その非同期返答手段から返答があったときは前記出
    力装置に前記プライベートLANの障害を表示し、ま
    た、返答がないときは前記出力装置にフェールオーバを
    表示する状態遷移判定手段とを有することを特徴とする
    クラスタリングシステム。
  4. 【請求項4】 エージェントプログラム部が、前記プラ
    イベートLANを介してハートビートで相互通信するこ
    とを特徴とする請求項1ないし3のいずれかに記載クラ
    スタリングシステム。
  5. 【請求項5】 前記プライベートLANに、前記各サー
    バマシンと前記クライアントマシンとを接続するLAN
    を利用することを特徴とする請求項1ないし4のいずれ
    かに記載のクラスタリングシステム。
  6. 【請求項6】 前記クライアントマシン,エージェント
    マシン,周辺記憶装置間の通信およびエージェントマシ
    ン相互間の通信をパケット通信で行うことを特徴とする
    請求項1ないし5のいずれかに記載のクラスタリングシ
    ステム。
  7. 【請求項7】 前記クライアントマシンおよびエージェ
    ントマシンに対するIPアドレスの初期設定時を、特定
    のOSが認識できるファイルから行うことを特徴とする
    請求項6記載のクラスタリングシステム。
  8. 【請求項8】 クライアントマシンが、それぞれ複数
    のサーバマシンに接続されるディスクアレイ装置のクラ
    スタリングシステムにおける各ノードの状態遷移の認識
    方法であって、 前記サーバマシンのそれぞれが、 プライベートLANを介して、所定の監視間隔時間で他
    のサーバマシンへヘルスチェックのための問い合わせを
    行い、その結果、返答があればSCSI通信により取得
    したディスクアレイ装置の状態を、一方、返答がなけれ
    ば“相手通信不能”をそれぞれ前記クライアントマシン
    へパケットにより通信する手順と、 前記ヘルスチェックのための問い合わせを受けると、自
    己が正常なら“正常”状態を返答し、また、前記問い合
    わせを受けると、SCSI通信によりディスクアレイ装
    置の状態を取得して、クライアントマシンへ送信する手
    順とを有する方法を実行するプログラムを記憶した記録
    媒体と、 前記クライアントマシンが、 前記SCSI通信があると、この通信で伝えられる前記
    ディスクアレイ装置の状態を出力装置に表示する手順
    と、 前記サーバマシンからの通信がSCSI通信でないとき
    起動され、通信があった相手サーバマシンに問い合わせ
    を行い、その結果、返答があったときは前記出力装置に
    前記プライベートLANの障害を表示し、また、返答が
    ないときは前記出力装置にフェールオーバを表示する手
    順とを有する方法を実行するプログラムを記憶した記録
    媒体とから成ることを特徴とするコンピュータ読み込み
    可能な記録媒体。
JP11174710A 1999-06-21 1999-06-21 クラスタリングシステムおよび記録媒体 Pending JP2001005691A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11174710A JP2001005691A (ja) 1999-06-21 1999-06-21 クラスタリングシステムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11174710A JP2001005691A (ja) 1999-06-21 1999-06-21 クラスタリングシステムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2001005691A true JP2001005691A (ja) 2001-01-12

Family

ID=15983307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11174710A Pending JP2001005691A (ja) 1999-06-21 1999-06-21 クラスタリングシステムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP2001005691A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7436755B2 (en) 2002-11-18 2008-10-14 Sharp Kabushiki Kaisha Optical information recording medium, recording and reproduction methods using the same, optical information recording device, and optical information reproduction device
JP2009276835A (ja) * 2008-05-12 2009-11-26 Fujitsu Ltd サーバ管理装置及びサーバ管理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7436755B2 (en) 2002-11-18 2008-10-14 Sharp Kabushiki Kaisha Optical information recording medium, recording and reproduction methods using the same, optical information recording device, and optical information reproduction device
JP2009276835A (ja) * 2008-05-12 2009-11-26 Fujitsu Ltd サーバ管理装置及びサーバ管理方法
US8516097B2 (en) 2008-05-12 2013-08-20 Fujitsu Limited Server managing apparatus and server managing method

Similar Documents

Publication Publication Date Title
US7340637B2 (en) Server duplexing method and duplexed server system
US7640451B2 (en) Failover processing in a storage system
JP4496093B2 (ja) 高可用性システムの遠隔エンタープライズ管理
JP4462024B2 (ja) ディスク引き継ぎによるフェイルオーバ方法
US8010827B2 (en) Method and computer system for failover
JP4855355B2 (ja) フェールオーバにおける引き継ぎ先を自律的に変更する計算機システム及び方法
US7475127B2 (en) Real composite objects for providing high availability of resources on networked systems
JP3360719B2 (ja) ディスクアレイクラスタリング通報方法およびシステム
JP4787684B2 (ja) セッション管理システム、セッション管理方法、及びプログラム
US20030037133A1 (en) Method and system for implementing redundant servers
JP5523468B2 (ja) 直接接続ストレージ・システムのためのアクティブ−アクティブ・フェイルオーバー
US20030158933A1 (en) Failover clustering based on input/output processors
US20090282283A1 (en) Management server in information processing system and cluster management method
US7890616B2 (en) System and method for validation of middleware failover behavior
JP4653965B2 (ja) 入出力インタフェースモジュールの管理方法
US7937481B1 (en) System and methods for enterprise path management
US7836351B2 (en) System for providing an alternative communication path in a SAS cluster
JP2005327271A (ja) ストレージシステムでの論理設定の再構成
JP4662117B2 (ja) ストレージシステム
US20060235937A1 (en) System and method for processing commands in a storage enclosure
JP4592242B2 (ja) サーバ/クライアントシステム
JP2001005691A (ja) クラスタリングシステムおよび記録媒体
US20060085540A1 (en) System and method for the use of redundant network interface cards
JP2011035753A (ja) ネットワーク管理システム
JP2012090180A (ja) ノード、クラスタリングシステム、クラスタリングシステムの制御方法、およびプログラム