JPH10105423A - ネットワークサーバの障害監視方式 - Google Patents

ネットワークサーバの障害監視方式

Info

Publication number
JPH10105423A
JPH10105423A JP8277319A JP27731996A JPH10105423A JP H10105423 A JPH10105423 A JP H10105423A JP 8277319 A JP8277319 A JP 8277319A JP 27731996 A JP27731996 A JP 27731996A JP H10105423 A JPH10105423 A JP H10105423A
Authority
JP
Japan
Prior art keywords
server
failure
server device
fault
active
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8277319A
Other languages
English (en)
Inventor
Masahiko Honda
雅彦 本多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP8277319A priority Critical patent/JPH10105423A/ja
Publication of JPH10105423A publication Critical patent/JPH10105423A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】現用系の複数サーバ装置と予備系の予備サーバ
装置からなるクライアントサーバシステムにおいて、特
別な管理装置を用意することを不要として、サーバ装置
の故障検出、障害復旧を図り高信頼性システムの構築を
可能とするシステムの提供。 【解決手段】サーバ装置が、他のサーバ装置の障害を検
出する手段と、障害を検出した場合、障害となったサー
バ装置を除去し、予備サーバ装置から1つを選択し、そ
の予備サーバ装置を現用装置として開始する手段を備え
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、クライアントサー
バ方式のネットワーク障害監視方式に関し、特に複数の
現用系装置および複数の予備系装置からなるサーバ装置
と複数のクライアント装置がネットワークを経由して情
報の送受信を行うクライアントサーバシステムに関す
る。
【0002】
【従来の技術】サービスを提供するサーバ装置、および
サービスを利用する1又は複数のクライアント装置から
なるクライアント・サーバシステムにおいて、サーバが
1つしか存在しない場合、該サーバが障害状態に陥る
と、クライアントがサービスを利用できなくなってしま
う、という問題点を有している。
【0003】この問題を回避するため、サーバ装置を複
数配置し、現在クライアントに対してサービスを提供し
ている状態にある装置(現用系装置)と、現在のクライ
アントに対してサービスを提供していない装置(予備系
装置)の2つのグループに分け、現用系装置のいずれか
が障害状態となった場合、障害状態となった装置を停止
し、該障害状態となった装置の代用として、予備系装置
の中の1つも装置を動作させるという、方式がとられて
いる。このうち、現用系装置が1つ、予備系装置が1つ
という場合がもっとも単純な構成であり、「二重化構
成」と呼ばれる。
【0004】
【発明が解決しようとする課題】しかしながら、上記の
ように、現用系装置と予備系装置とをそれぞれ複数用意
する構成を取る場合、以下に記載するような問題点があ
る。
【0005】現用系装置の障害状態を検出した際に予備
系装置のいずれかを選択し、予備系装置のいずれかを起
動するためには、これらの装置の他に、専用の管理装置
を配備することが必要とされる。そして、この管理装置
自体が障害となった場合、障害状態の復旧が不可能とな
ってしまう。
【0006】このように、クライアントサーバシステム
の信頼性は、専ら、管理装置の信頼性に依存してしま
い、この管理装置の信頼性を高めないかぎり、システム
の信頼性を高めることができない、ことになる。
【0007】したがって、本発明は、上記事情に鑑みて
なされたものであって、その目的は、専用の管理装置の
配備を不要として、現用系のサーバ装置の障害の検出及
びその除去と予備系装置の現用系への組み込みを可能と
する、信頼性の高いクライアントサーバシステムを提供
することにある。
【0008】
【課題を解決するための手段】前記目的を達成するた
め、本発明のクライアントサーバシステムは、現用系の
複数のサーバ装置が、それぞれ相互に現用系の他のサー
バ装置の障害を監視し、他のサーバ装置の障害を検出し
た際に、予備系のサーバ装置を、前記障害が検出された
サーバ装置の代替サーバ装置として現用系に組み込んで
運用を開始するように制御する、ことを特徴とする。
【0009】
【本発明の実施の形態】本発明の好ましい実施の形態に
ついて以下説明する。本発明は、その好ましい実施の形
態において、現用系のサーバ装置(図1の1−l)が他
のサーバ装置(図1の1−1、…、1−mのうち1−l
以外)の障害を検出する手段と、障害を検出した場合
に、障害となったサーバ装置を除去し、予備サーバ装置
(図1の1−m〜1−(m+n))から1つを選択し、その
予備サーバ装置を現用系装置として運転を開始する手段
と、を有する。
【0010】そして、本発明の実施の形態において、現
用系のサーバ装置の1つに障害が発生した場合、この現
用系のサーバ装置の障害の発生を、別の正常な現用系の
サーバ装置が検出し、障害を検出したサーバが、複数の
予備サーバ装置群の中から1つのサーバ装置を選択し、
これを現用系装置として、運転を開始する。
【0011】本発明の実施の形態においては、このよう
に、現用系のサーバ装置同士が、相互監視を行うように
構成したことにより、従来方式のように特別な専用管理
装置を配備することを不要とし、信頼性の高いクライア
ントサーバシステムを構成することが可能となる。
【0012】
【実施例】上記した本発明の実施の形態について更に詳
細に説明すべく、以下、本発明の実施例について図面を
参照して以下に説明する。
【0013】
【実施例1】図1は、本発明の第1の実施例に係るクラ
イアントサーバシステムの構成を示すブロック図であ
る。
【0014】図1を参照して、本実施例に係るクライア
ントサーバシステムは、m個の現用系サーバ装置1−1
〜1−mと、n個の予備系サーバ装置1−(m+1)〜1−
(m+n)と、k個のクライアント装置2−1〜2−kと、
ネットワーク3と、を備えて構成されている。ここで
m、n、kはそれぞれ1以上の整数である。
【0015】m個の現用サーバ装置1−1〜1−mは、
ネットワーク3を介してk個のクライアント装置2−1
〜2−kに対してサービスを提供している。一方、n個
の予備系サーバ装置はネットワーク3に接続されてお
り、いつでもサービスを提供できる状態にあるが、サー
ビスの提供は行っていない。
【0016】次に、本発明の実施例におけるサーバ装置
の詳細な構成について説明する。図2は、本実施例にお
けるサーバ装置1−lの構成の一例を示すブロック図で
ある。本実施例において、複数のサーバ装置の構成は同
等とされるため一つを説明する。
【0017】図2を参照すると、サーバ装置1−lは、
通信処理部11−lと、障害制検出部12−lと、障害
通知部13−lと、障害処理部14−lと、サービス処
理部15−lと、を備えて構成される。
【0018】通信処理部11−lは、障害通知部13−
l及び障害処理部14−lと、ネットワーク3と、の間
に設けられており、サーバ装置1−lがネットワーク3
を介して行う通信の処理を行う機能手段を有している。
【0019】障害検出部12−lは、自装置の障害状態
を監視し、障害を検出した場合には、障害検出信号によ
り障害通知部13−lに障害が発生したことを通知す
る。
【0020】障害処理部14−lは、通信処理部11−
l経由でネットワーク3を介して他のサーバ装置の障害
状態を監視しており、他のサーバ装置で障害が発生した
場合、その装置を現用系から取り除き、代わりに、別の
予備系サーバ装置を現用系として動作させるための処理
シーケンスを実行するための機能手段を有している。
【0021】サービス処理部15−lは、サーバ装置1
−lがクライアント2−1〜2−kに対して行うサービ
スを実行するために必要な機能手段を有する。
【0022】通信処理部11−lは、障害検出部12−
l、障害通知部13−l、障害処理部14−l、サービ
ス処理部15−lから送信されるメッセージをネットワ
ーク3に対して送信し、またネットワーク3から受信す
るメッセージを障害通知部13−l、障害処理部14−
l、サービス処理部15−lに振り分ける機能を具備す
る。
【0023】次に、本実施例に係るクライアント・サー
バシステムの動作について説明する。以下の説明で、l
は1以上m以下の整数であり、以下で説明する動作は、
lの値を1以上m以下で読み替えた場合、いずれの場合
にでも当てはまる。ただし、1の値がmと等しくなる場
合には、1+lを1と読み替える。
【0024】サーバ装置1−1において、障害処理部1
4−lは「障害状態問い合わせメッセージ」を通信処理
部11−lに送信する。通信処理部11−lは、受信し
た「障害状態問い合わせメッセージ」により、ネットワ
ーク3を介して、サーバ装置1−(l+1)に対して送信す
る。「障害状態問い合わせメッセージ」は、周期的に、
例えば1秒間隔で送信すると、制御が簡単となる。
【0025】サーバ装置1−(l+1)において、通信処理
部11−(l+1)は、障害処理部14−(l+1)から送信され
た「装置状態問い合わせメッセージ」を受信し、障害通
知部13−(l+1)に送信する。障害通知部13−(l+1)
は、障害検出部12−(l+1)から送信される障害検出信
号を常時監視しており、自装置において障害が発生した
場合には、直ちに障害の発生を知ることができる。障害
通知部13−(l+1)は、障害検出状態に応じて、障害が
検出されない場合には「障害未発生ステータス」を、障
害が検出された場合には「障害発生ステータス」を、通
信処理部11−(l+1)によりネットワーク3を介して、
サーバ装置1−lに対して送信する。
【0026】現用系の複数のサーバ装置間における「装
置状態問い合わせメッセージ」と、「障害未発生ステー
タス」、または「障害発生ステータス」の送受関係は、
例えば図4に示すように、循環的なものとなる。
【0027】まず、サーバ装置1−(l+1)において、障
害が発生していない場合の動作について詳細に説明す
る。
【0028】この場合、サーバ装置1−(l+1)におい
て、障害通知部13−(l+1)は障害を検出していないの
で、「障害状態問い合わせメッセージ」を受信した障害
通知部13−(l+1)は、「障害未発生ステータス」を通
信処理部11−(l+1)に送信する。通信処理部11−(l+
1)は、「障害未発生ステータス」を、ネットワーク3を
介して、サーバ装置1−lに送信する(図3の)。
【0029】サーバ装置1−1において、障害処理部1
4−lは、「障害未発生ステータス」を通信処理部11
−lを経由して受信する。障害処理部14−lが「障害
未発生ステータス」を受信した場合は、サーバ装置1−
(l+1)が正常状態であると認識し、特に、処理は行わな
い。
【0030】以上説明した、障害が発生していない場合
のサーバ装置1−l、1−(l+1)の間のメッセージの送
受のシーケンスを図示すると、図3に示すようなものと
なる。
【0031】次に、サーバ装置1−(l+1)において、障
害が発生した場合について、詳細に説明する。
【0032】サーバ装置1−(l+1)に障害が発生した場
合、障害検出部12−(l+1)から障害通知部13−(l+1)
に対して障害の発生が通知されるので、サーバ装置1−
lから、サーバ装置1−(l+1)に対して送信された「障
害状態問い合わせメッセージ」を受信した障害通知部1
3−(l+1)は、障害が発生した旨を通知するために、
「障害発生ステータス」を、通信処理部11−(l+1)に
送信し、ネットワーク3を介してサーバ装置1−1に送
信する(図5の参照)。
【0033】サーバ装置1−lにおいて、障害処理部1
4−lは、「障害発生ステータス」を通信処理部11−
lを経由して受信する。
【0034】障害処理部14−lは、予備系サーバ装置
1−(m+1)〜1−(m+n)の中から1つを選択する。選択し
た予備系サーバ装置をサーバ装置1−i(iはm+1以
上n以下の整数)とする。
【0035】障害処理部14−lは、「起動指示メッセ
ージ」を、サーバ装置1−iに送信する(図5の参
照)。「起動指示メッセージ」を送信する際に、サーバ
装置1−(l+1)に付与されているサーバ装置番号を、サ
ーバ装置1−iに対して送信する。
【0036】このサーバ装置番号の送信方法としては、
「起動指示メッセージ」パラメータとして、サーバ装置
番号を送る方法がある。
【0037】サーバ装置1−iは、「起動指示メッセー
ジ」に呼応し、サービス処理部15−iを起動しサービ
スの提供を開始すると同時に、サーバ装置1−(l+1)が
行っていた動作と同様の動作を開始する。すなわちサー
バ装置1−(l+1)の代用のサーバとして動作する。
【0038】サーバ1−iが起動すると同時に、サーバ
装置1−lの障害処理部14−lは、サーバ装置1−(l
+1)に対して、「停止指示メッセージ」を送信し、装置
全体の動作を停止する(図5の参照)。なお、「起動
指示メッセージ」と「停止指示メッセージ」の順序はど
ちらが先でもかまわない。
【0039】すなわち、障害が発生した場合の、サーバ
装置1−l、1−(l+1)の間のメッセージの送受のシー
ケンスは、例えば図5に示すようなものとなる。
【0040】サーバ装置1−(l+1)において障害が検出
された場合、「障害状態問い合わせメッセージ」の受信
とは無関係にサーバ装置1−lに対して「障害発生ステ
ータス」を送信してもよい。
【0041】サーバ装置1−(l+1)の通信処理部11−
(l+1)、または障害監視部12−(l+1)が、障害状態にな
った場合は、「障害状態問い合わせメッセージ」に対す
る応答がなくなるので、その場合も、サーバ装置1−(l
+1)で障害が発生したものとして扱ってよい。
【0042】以上に説明した動作を実現するために、現
用サーバ装置1−l〜1−mの各々には、それぞれ識別
番号が付与されており、「障害状態問い合わせメッセー
ジ」を送信すべきサーバ装置と、「障害未発生ステータ
ス」を送信すべきサーバ装置の番号を記憶するレジスタ
を装置内に保有している。ただし、m=2の場合は、ど
ちらの番号も同じ番号となる。
【0043】
【実施例2】次に図6及び図7を参照して、本発明の第
2の実施例について説明する。
【0044】図6は、本発明の第2の実施例に係るクラ
イアントサーバシステムの構成を示すブロック図であ
る。
【0045】上記第1の実施例では、サーバ装置1−l
の障害処理部12−lとサービス処理部15−lが、同
じ通信処理部を用い、かつ同じネットワーク3を介して
他のサーバ装置やクライアントと通信を行っていたが、
この実施例では、図7に示すように、障害処理部12−
lとサービス処理部15−lが、それぞれ第1の通信処
理部11−l、第2の通信処理部16−lを経由し、そ
れぞれネットワーク3、ネットワーク6に接続されてい
る。
【0046】すなわち、本実施例においては、サービス
を提供するためのネットワーク3と、障害監視を行うた
めのネットワーク6が互いに別の媒体によって構成され
ている。
【0047】
【発明の効果】以上説明したように、本発明によれば、
現用系のサーバ装置の1つに障害が発生した場合、この
現用系のサーバ装置の障害の発生を、別の正常な現用サ
ーバ装置が検出し、障害を検出したサーバが、予備系の
複数のサーバ装置の中から1つのサーバ装置を選択し、
これを現用系装置として運転を開始するように構成した
ものであり、サーバ装置同士が相互監視を行うので、特
別な専用管理装置を配備する必要がなく、専用管理装置
の信頼性に依存しない信頼性の高いクライアントサーバ
システムを構築可能とする、という効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施例の全体構成を示す図である。
【図2】本発明の一実施例におけるサーバ装置の構成を
示すブロック図である。
【図3】本発明の一実施例の動作を説明するための図で
ある。
【図4】本発明の一実施例の動作を説明するための図で
ある。
【図5】本発明の一実施例の動作を説明するための図で
ある。
【図6】本発明の別の実施例の全体構成を示す図であ
る。
【図7】本発明の別の実施例におけるサーバ装置の構成
を示すブロック図である。
【符号の説明】
1−1〜1−m 現用系サーバ装置 1−(m+1)〜1−(m+n) 予備系サーバ装置 2−1〜2−k クライアント装置 3、4 ネットワーク 11−l 通信処理部 12−l 障害通知部 13−l 障害検出部 14−l 障害処理部 15−l サービス処理部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】現用系の複数のサーバ装置が、それぞれ相
    互に現用系の他のサーバ装置の障害を監視し、他のサー
    バ装置の障害を検出した際に、予備系のサーバ装置を、
    前記障害が検出されたサーバ装置の代替サーバ装置とし
    て現用系に組み込んで運用を開始するように制御する、
    ことを特徴とするクライアントサーバ方式。
  2. 【請求項2】複数の現用系装置と1又は複数の予備系の
    装置からなるサーバ装置と、複数のクライアント装置が
    ネットワークを経由して情報の送受信を行うクライアン
    トサーバシステムにおいて、前記サーバ装置が、現用系
    装置に障害が発生した場合に該障害の発生を検出する手
    段と、障害を検出した場合に該障害が発生した装置を現
    用系から取り除き、予備系装置の中の1つを選択して、
    現用系に組み込む手段と、を備えたことを特徴とするク
    ライアントサーバシステム。
JP8277319A 1996-09-27 1996-09-27 ネットワークサーバの障害監視方式 Pending JPH10105423A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8277319A JPH10105423A (ja) 1996-09-27 1996-09-27 ネットワークサーバの障害監視方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8277319A JPH10105423A (ja) 1996-09-27 1996-09-27 ネットワークサーバの障害監視方式

Publications (1)

Publication Number Publication Date
JPH10105423A true JPH10105423A (ja) 1998-04-24

Family

ID=17581883

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8277319A Pending JPH10105423A (ja) 1996-09-27 1996-09-27 ネットワークサーバの障害監視方式

Country Status (1)

Country Link
JP (1) JPH10105423A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004099990A1 (ja) * 2003-05-09 2004-11-18 Kabushiki Kaisha Toshiba 計算機システム及び同システムに適用される故障計算機代替制御方法
JP2008533573A (ja) * 2005-03-10 2008-08-21 テレコム・イタリア・エッセ・ピー・アー 障害回復アーキテクチャー
JP2012100313A (ja) * 2011-12-22 2012-05-24 Telecom Italia Spa 障害回復アーキテクチャ
US8676958B1 (en) 2006-02-10 2014-03-18 Open Invention Network, Llc System and method for monitoring the status of multiple servers on a network

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62159241A (ja) * 1986-01-07 1987-07-15 Hitachi Ltd デ−タ処理装置バツクアツプ方法
JPH0357344A (ja) * 1989-07-25 1991-03-12 Nec Corp データ伝送装置
JPH04299743A (ja) * 1991-03-28 1992-10-22 Omron Corp コンピュータネットワークシステム
JPH0756838A (ja) * 1993-08-11 1995-03-03 Toshiba Corp 分散サーバ制御装置
JPH08235132A (ja) * 1995-02-22 1996-09-13 Hitachi Ltd マルチサーバシステムのホットスタンバイ制御方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62159241A (ja) * 1986-01-07 1987-07-15 Hitachi Ltd デ−タ処理装置バツクアツプ方法
JPH0357344A (ja) * 1989-07-25 1991-03-12 Nec Corp データ伝送装置
JPH04299743A (ja) * 1991-03-28 1992-10-22 Omron Corp コンピュータネットワークシステム
JPH0756838A (ja) * 1993-08-11 1995-03-03 Toshiba Corp 分散サーバ制御装置
JPH08235132A (ja) * 1995-02-22 1996-09-13 Hitachi Ltd マルチサーバシステムのホットスタンバイ制御方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004099990A1 (ja) * 2003-05-09 2004-11-18 Kabushiki Kaisha Toshiba 計算機システム及び同システムに適用される故障計算機代替制御方法
CN100382041C (zh) * 2003-05-09 2008-04-16 株式会社东芝 计算机系统与应用于该系统的故障计算机替换方法
US7478230B2 (en) 2003-05-09 2009-01-13 Kabushiki Kaisha Toshiba Computer system and failed computer replacing method to the same system
JP2008533573A (ja) * 2005-03-10 2008-08-21 テレコム・イタリア・エッセ・ピー・アー 障害回復アーキテクチャー
US8266473B2 (en) 2005-03-10 2012-09-11 Telecom Italia S.P.A. Disaster recovery architecture
US8676958B1 (en) 2006-02-10 2014-03-18 Open Invention Network, Llc System and method for monitoring the status of multiple servers on a network
US11245571B1 (en) 2006-02-10 2022-02-08 Open Invention Network Llc System and method for monitoring the status of multiple servers on a network
JP2012100313A (ja) * 2011-12-22 2012-05-24 Telecom Italia Spa 障害回復アーキテクチャ

Similar Documents

Publication Publication Date Title
EP1153346B1 (en) Server system and method for operating the same
US6658595B1 (en) Method and system for asymmetrically maintaining system operability
US10911295B2 (en) Server apparatus, cluster system, cluster control method and program
JPH06348528A (ja) バックアップ切り換え制御方法
CA2499343A1 (en) Ip redundancy with improved failover notification
JPH04334231A (ja) Lanからの切離し機能を持つ計算機システム
JPH10105423A (ja) ネットワークサーバの障害監視方式
JP2000324121A (ja) ネットワーク管理システムにおける系切り替え装置および方法
KR100832543B1 (ko) 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법
JP5240825B2 (ja) 警備システム
JP3266904B2 (ja) 静的接続型ネットワークにおける監視システム
JP4064032B2 (ja) 通信システム
JPH06197112A (ja) 管理システム
JP2007041646A (ja) クライアント−サーバ型システム、並びに、その管理方法および管理プログラム
JP4692419B2 (ja) ネットワーク装置及びそれに用いる冗長切替え方法並びにそのプログラム
JPH1168790A (ja) Lanエミュレーションサーバ二重化方式
JPH07141308A (ja) 情報処理システムにおけるバックアップ方法
CN113395188B (zh) 一种服务器工作状态确定方法及系统
JP3638337B2 (ja) フレームリレー網および網における情報伝送方法
JPH05304528A (ja) 多重化通信ノード
JPH07336296A (ja) 光伝送方式
JP3568985B2 (ja) 装置間制御システム
JP2006049953A (ja) ノードおよび通信システム
JPH09162910A (ja) 多重化通信装置およびその制御方法
KR940002271B1 (ko) 전후단 분리 구조 시스템의 장애 자동 감시 방법

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000606