JP2002222176A - サーバ・ベースド・コンピューティングモデルにおけるアプリケーションサーバ計算機障害自動復旧装置及び方法 - Google Patents

サーバ・ベースド・コンピューティングモデルにおけるアプリケーションサーバ計算機障害自動復旧装置及び方法

Info

Publication number
JP2002222176A
JP2002222176A JP2001017206A JP2001017206A JP2002222176A JP 2002222176 A JP2002222176 A JP 2002222176A JP 2001017206 A JP2001017206 A JP 2001017206A JP 2001017206 A JP2001017206 A JP 2001017206A JP 2002222176 A JP2002222176 A JP 2002222176A
Authority
JP
Japan
Prior art keywords
server computer
failure
application
computer
application server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001017206A
Other languages
English (en)
Inventor
Naohisa Tanabe
直久 田辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001017206A priority Critical patent/JP2002222176A/ja
Publication of JP2002222176A publication Critical patent/JP2002222176A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)
  • Hardware Redundancy (AREA)

Abstract

(57)【要約】 【課題】本発明の課題は、利用者に対してAPサーバ計
算機障害を意識させることなく、処理を継続できるサー
バ・ベースド・コンピューティングモデルにおけるアプ
リケーションサーバ計算機障害自動復旧装置を提供する
ことにある。 【解決手段】本発明は、アプリケーション(AP)サー
バ計算機切り替え機能付きアップレット21がダウンロ
ードされたクライアント計算機14が接続され、利用者
のAPプロセスを監視するプロセス監視エージェント2
3を有する第1のAPサーバ計算機121と、利用者の
APプロセスの状態情報が記録されるチェックポイント
ファイル24と、利用者のAPプロセスの障害発生を検
知し、アップレット21に障害発生通知を送信する障害
監視エージェント25と、クライアント計算機14が接
続され、APプロセスを復元するプロセス起動エージェ
ント26を有する第2のAPサーバ計算機122とを具
備することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、サーバ・ベースド
・コンピューティング(Server Based C
omputing:以下SBCと書く)モデルという新
たなサービス形態(主なものにASP(Applica
tion Service Provider)による
サービス提供形態がある)におけるアプリケーション
(Application:以下APと書く)サーバ計
算機障害自動復旧装置及び方法に関する。特に、障害発
生を利用者に隠蔽でき且つソフトウェアで実現できるた
め経済的負担が小さいものである。
【0002】
【従来の技術】近年、ASPサービスが脚光を浴びてき
た。通信事業者やISP(Internet Serv
ice Provider)がネットワークサービスを
提供しているのに対し、ASPはネットワークを通じて
アプリケーション機能を提供する。ASPによるサービ
ス形態のうち中心となっていくであろうサービス形態
が、SBCモデルであり、アプリケーションを遠隔レン
タルする仕組みである。利用者はWebブラウザなどを
用いて、遠隔にあるAPサーバ計算機上で稼動するAP
を使用することが可能となる。クライアント/サーバ方
式でボトルネックとなった通信効率やサーバ管理の負担
を解消するためにサーバでアプリケーションやユーザの
データを集中管理し、クライアント側はできるだけ軽く
しようといった新たなコンピューティングモデルがSB
Cモデルである。
【0003】しかし、SBCモデルのコンピューティン
グモデルでは、常に変化する画像情報(画像圧縮された
ビットマップ情報)が送信されるため、APサーバ計算
機障害(ハードウェア障害もしくはソフトウェア障害)
時には、瞬時に利用者にエラーが見える。また、AP自
体が、APサーバ計算機側で管理しているため、利用者
は通常、APサーバ計算機を再起動したり、メンテナン
スすることができない。
【0004】そこで、SBCモデルに適したAPサーバ
計算機障害における対策技術の出現が要望される。
【0005】
【発明が解決しようとする課題】本発明は上記の事情に
鑑みてなされたもので、瞬時にAPサーバ計算機を切り
替えることにより、低コストで利用者に対してAPサー
バ計算機障害を意識させることなく、処理を継続するこ
とが出来るサーバ・ベースド・コンピューティングモデ
ルにおけるアプリケーションサーバ計算機障害自動復旧
装置及び方法を提供することを目的とする。
【0006】
【課題を解決するための手段】上記目的を達成するため
に本発明は、クライアント計算機から送信された情報を
もとに、アプリケーションサーバ計算機上でアプリケー
ションにより更新された画像情報がネットワークを通し
てクライアント計算機に送信されるサーバ・ベースド・
コンピューティングモデルにおけるアプリケーションサ
ーバ計算機障害自動復旧装置であって、アプリケーショ
ンサーバ計算機切り替え機能付きアップレットがダウン
ロードされたクライアント計算機がネットワークを介し
て接続され、アプリケーションプロセスを監視するプロ
セス監視エージェントを有する第1のアプリケーション
サーバ計算機と、前記プロセス監視エージェントにより
監視されたアプリケーションプロセスのプロセス状態情
報が記録されるチェックポイントファイルと、前記プロ
セス監視エージェントにより監視されたアプリケーショ
ンプロセスの障害発生を検知し、前記アプリケーション
サーバ計算機切り替え機能付きアップレットに障害発生
通知を送信する障害監視エージェントと、前記アプリケ
ーションサーバ計算機切り替え機能付きアップレットに
より前記クライアント計算機がネットワークを介して接
続され、前記チェックポイントファイルの情報をもとに
アプリケーションプロセスを復元するプロセス起動エー
ジェントを有する第2のアプリケーションサーバ計算機
とを具備することを特徴とするものである。
【0007】また本発明は、クライアント計算機から送
信された情報をもとに、アプリケーションサーバ計算機
上でアプリケーションにより更新された画像情報がネッ
トワークを通してクライアント計算機に送信されるサー
バ・ベースド・コンピューティングモデルにおけるアプ
リケーションサーバ計算機障害自動復旧方法であって、
クライアント計算機がネットワークを介して接続された
第1のアプリケーションサーバ計算機上でアプリケーシ
ョンプロセスを監視してプロセス状態情報をチェックポ
イントファイルに記録するステップと、前記第1のアプ
リケーションサーバ計算機上でアプリケーションプロセ
スの障害発生を検知し、前記クライアント計算機を第2
のアプリケーションサーバ計算機に接続するステップ
と、前記第2のアプリケーションサーバ計算機上で前記
チェックポイントファイルの情報をもとにアプリケーシ
ョンプロセスを復元するステップとを有することを特徴
とする。
【0008】
【発明の実施の形態】以下図面を参照して本発明の実施
形態例を詳細に説明する。
【0009】ここでは本発明の実施形態例として、SB
Cモデル、SBCモデルにおけるAPサーバ計算機障害
自動復旧方式の全体構成、APサーバ計算機切り替え機
能付きアップレット(Applet)、プロセス監視方
式、プロセス監視エージェント、プロセス復元方式の詳
細を述べる。
【0010】[SBCモデル]図1は本発明の実施形態
例に係るSBCモデルを示す構成ブロック図である。
【0011】段階1 利用者11は、APサーバ計算機12上のAPプロセス
13を利用するために、クライアント計算機14のWe
bブラウザ15などを利用してAPサーバ計算機12に
ネットワーク16を介してクライアント計算機14を接
続する。
【0012】段階2 クライアント計算機14のジャバ・アップレット(Ja
va Applet)17がAPサーバ計算機12やW
WWサーバなどから自動的にダウンロードされ、APサ
ーバ計算機12上のデスクトップ画面もしくはアプリケ
ーション画面が送信される。この仕組みは、Meta
FrameやVNCなどで実装されている。
【0013】段階3 利用者11は、APサーバ計算機12上のAPプロセス
13を利用する。その際、ジャバ・アップレット(Ja
va Applet)を経由して、Webブラウザ15
とAPサーバ計算機12上のAPプロセス13の間でや
りとりが逐次行われる。クライアント計算機14側で発
生したマウス、イベント情報18がAPサーバ計算機1
2に送信され、そのマウス、イベント情報18をもとに
APサーバ計算機12上のAPプロセス13で更新され
た画像情報(圧縮されたビットマップ情報)19がネッ
トワーク16を通じてクライアント計算機14に送信さ
れる。
【0014】以上の仕組みが、SBCモデルである。
【0015】[SBCモデルにおけるAPサーバ計算機
障害自動復旧方式の全体構成]図2は本発明の実施形態
例に係るSBCモデルにおけるAPサーバ計算機障害自
動復旧方式の全体構成を示す構成ブロック図である。
【0016】段階1 利用者は、APサーバ計算機のAPプロセスを利用する
ために、クライアント計算機14を第1のAPサーバ計
算機121にネットワーク16を介して接続する。
【0017】段階2 クライアント計算機14に、APサーバ計算機切り替え
機能を持つアップレット(Applet)21がWWW
サーバ計算機22からダウンロードされる。
【0018】段階3 第1のAPサーバ計算機121のプロセス監視エージェ
ント23により、利用者のAPプロセス13が監視さ
れ、その時点でのプロセス状態情報がチェックポイント
ファイル24に記録される。
【0019】段階4 第1のAPサーバ計算機121の利用者のAPプロセス
13に障害発生を検知した障害監視エージェント25
は、APサーバ計算機切り替え機能付きアップレット
(Applet)21に障害発生通知を送信する。
【0020】段階5 APサーバ計算機切り替え機能付きアップレット(Ap
plet)21は、第2のAPサーバ計算機122にネ
ットワーク16を介して接続する。それと同時に、第2
のAPサーバ計算機122のプロセス起動エージェント
26は、チェックポイントファイル24の情報をもと
に、APプロセス13を復元する。
【0021】以上の仕組みが、SBCモデルにおけるA
Pサーバ計算機障害自動復旧方式の全体図である。各々
の機能については、以下に詳細に述べる。
【0022】[APサーバ計算機切り替え機能付きAp
plet]図3は本発明の実施形態例に係るAPサーバ
計算機切り替え機能付きAppletを示す構成ブロッ
ク図である。
【0023】このAPサーバ計算機切り替え機能付きA
pplet21の各処理部の機能の概要は以下の通りで
ある。
【0024】段階1 障害発生通知受信部31は、障害監視エージェント25
から送信された障害発生通知36を受信する。
【0025】段階2 APサーバ計算機選択部32は、APサーバ計算機情報
記憶部33に記憶されたAPサーバ計算機情報37から
最適なAPサーバ計算機を選択する。APサーバ計算機
情報37は、定期的に接続可能なAPサーバ計算機から
送信される情報であり、APサーバ計算機情報受信部3
4で受信してAPサーバ計算機情報記憶部33に記憶す
る。
【0026】段階3 APサーバ計算機切り替え部35は、段階2で選択され
たAPサーバ計算機にネットワーク16を介してクライ
アント計算機14を接続し、クライアント計算機14の
Webブラウザ15の画面を更新する。
【0027】[プロセス監視方式]図4は本発明の実施
形態例に係るプロセス監視方式を示すブロック図であ
る。
【0028】プロセス監視方式の各処理部の機能の概要
は以下の通りである。
【0029】段階1 APサーバ計算機上で動作する利用者のAPプロセス1
3は、図4のような仕組みでカーネル41、デバイスド
ライバ42、ハードウェア43にアクセスを行う。
【0030】段階2 独自技術によるシステムコール(open(),wri
te(),read()など様々なシステムコールが存
在する)取得部44により、利用者のAPプロセス13
の動作をフックする。そのフックしたユーザのAPプロ
セス13の動作をシステムコール情報45と呼ぶ。
【0031】段階3 システムコール情報45をプロセス監視エージェント2
3に渡す。このような仕組みにより、APサーバ計算機
障害時に備えてシステムコール情報45を取得してお
く。
【0032】段階4 定期的に、その他のプロセス状態情報を取得するため
に、プロセス監視エージェント23がその他のプロセス
状態情報を取得する。46はユーザ空間であり、47は
カーネル空間である。
【0033】[プロセス監視エージェント]図5は本発
明の実施形態例に係るプロセス監視エージェントを示す
ブロック図である。
【0034】プロセス監視エージェント23の各処理部
の機能の概要は以下の通りである。
【0035】段階1 カーネル41上のシステムコール取得部44から得たシ
ステムコール情報45は、プロセス監視エージェント2
3のシステムコール受信部51に受信される。
【0036】段階2 プロセス監視エージェント23のシステムコール情報解
析部52により、システムコール情報45は解析され
る。
【0037】段階3 以上の過程からチェックポイントファイル24が作成さ
れ、あらかじめ決められた領域に格納される。チェック
ポイントファイル24は、短い時間間隔で常に更新され
る。ここで、チェックポイントファイル24とは、AP
プロセスのその時点でのプロセス状態情報を記述したフ
ァイルのことである。
【0038】[プロセス復元方式]図6は本発明の実施
形態例に係るプロセス復元方式を示すシーケンス図であ
る。
【0039】すなわち、第1のAPサーバ計算機のプロ
セス監視エージェント23により、利用者のAPプロセ
スが監視され、その時点でのプロセス状態情報がチェッ
クポイントファイル24に記録される。チェックポイン
トファイル24は、短い時間間隔で常にチェックポイン
ト更新される。前記プロセス監視エージェント23で障
害が発生し、障害監視エージェントが障害発生を検知
し、クライアント計算機のAPサーバ計算機切り替え機
能付きアップレット(Applet)に障害発生通知が
送信されてクライアント計算機が第2のAPサーバ計算
機に接続され、第2のAPサーバ計算機のプロセス起動
エージェント26が障害発生通知を受信すると、プロセ
ス起動エージェント26はチェックポイントファイル2
4のプロセス状態情報を読み込み利用者のAPプロセス
を復旧する。尚、障害発生通知は、障害の種類により通
知手法が異なる。
【0040】以上のように、本発明では利用者のクライ
アント計算機に自動的にダウンロードされるJava
Appletに、APサーバ計算機障害受信機能および
APサーバ計算機切り替え機能を設け、計算機障害時に
瞬時に別のAPサーバ計算機に切り替える。また、AP
サーバ計算機上の利用者のAPプロセスを監視すること
により、APサーバ計算機障害時にはプロセス状態情報
をもとに、切り替えられたAPサーバ計算機上で、AP
プロセスを再起動する。
【0041】したがって、瞬時にAPサーバ計算機を切
り替えることにより、利用者に対してAPサーバ計算機
障害を意識させることなく、処理を継続することが出来
る。
【0042】また、SBCモデルにおいて、あるAPサ
ーバ計算機が障害に陥ったときに別のAPサーバ計算機
によって処理を代行することにより、システム全体とし
ての信頼性を向上させることができる。
【0043】また、APサーバ計算機障害時に瞬時且つ
利用者に対して透過的にAPサーバ計算機を切り替える
ことができる。
【0044】また、APサーバ計算機障害時にその上で
稼動していたAPプロセスを切り替えられたAPサーバ
計算機上で復元することができる。
【0045】
【発明の効果】以上述べたように本発明は、SBCモデ
ルといった新たなサービス形態におけるAPサーバ計算
機障害自動復旧技術として低コストで信頼性を向上でき
るものである。また、プロセス監視エージェント、プロ
セス起動エージェントなどによるオーバヘッドは小さ
く、サービス運用上ほとんど影響しない。
【図面の簡単な説明】
【図1】本発明の実施形態例に係るSBCモデルを示す
構成ブロック図である。
【図2】本発明の実施形態例に係るSBCモデルにおけ
るAPサーバ計算機障害自動復旧方式の全体構成を示す
構成ブロック図である。
【図3】本発明の実施形態例に係るAPサーバ計算機切
り替え機能付きAppletを示す構成ブロック図であ
る。
【図4】本発明の実施形態例に係るプロセス監視方式を
示すブロック図である。
【図5】本発明の実施形態例に係るプロセス監視エージ
ェントを示すブロック図である。
【図6】本発明の実施形態例に係るプロセス復元方式を
示すシーケンス図である。
【符号の説明】
11 利用者 12 APサーバ計算機 13 APプロセス 14 クライアント計算機 15 Webブラウザ 16 ネットワーク 17 ジャバ・アップレット(Java Apple
t) 21 APサーバ計算機切り替え機能を持つアップレッ
ト(Applet) 22 WWWサーバ計算機 23 プロセス監視エージェント 24 チェックポイントファイル 25 障害監視エージェント 26 プロセス起動エージェント

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 クライアント計算機から送信された情報
    をもとに、アプリケーションサーバ計算機上でアプリケ
    ーションにより更新された画像情報がネットワークを通
    してクライアント計算機に送信されるサーバ・ベースド
    ・コンピューティングモデルにおけるアプリケーション
    サーバ計算機障害自動復旧装置であって、 アプリケーションサーバ計算機切り替え機能付きアップ
    レットがダウンロードされたクライアント計算機がネッ
    トワークを介して接続され、アプリケーションプロセス
    を監視するプロセス監視エージェントを有する第1のア
    プリケーションサーバ計算機と、 前記プロセス監視エージェントにより監視されたアプリ
    ケーションプロセスのプロセス状態情報が記録されるチ
    ェックポイントファイルと、 前記プロセス監視エージェントにより監視されたアプリ
    ケーションプロセスの障害発生を検知し、前記アプリケ
    ーションサーバ計算機切り替え機能付きアップレットに
    障害発生通知を送信する障害監視エージェントと、 前記アプリケーションサーバ計算機切り替え機能付きア
    ップレットにより前記クライアント計算機がネットワー
    クを介して接続され、前記チェックポイントファイルの
    情報をもとにアプリケーションプロセスを復元するプロ
    セス起動エージェントを有する第2のアプリケーション
    サーバ計算機とを具備することを特徴とするサーバ・ベ
    ースド・コンピューティングモデルにおけるアプリケー
    ションサーバ計算機障害自動復旧装置。
  2. 【請求項2】 クライアント計算機から送信された情報
    をもとに、アプリケーションサーバ計算機上でアプリケ
    ーションにより更新された画像情報がネットワークを通
    してクライアント計算機に送信されるサーバ・ベースド
    ・コンピューティングモデルにおけるアプリケーション
    サーバ計算機障害自動復旧方法であって、 クライアント計算機がネットワークを介して接続された
    第1のアプリケーションサーバ計算機上でアプリケーシ
    ョンプロセスを監視してプロセス状態情報をチェックポ
    イントファイルに記録するステップと、 前記第1のアプリケーションサーバ計算機上でアプリケ
    ーションプロセスの障害発生を検知し、前記クライアン
    ト計算機を第2のアプリケーションサーバ計算機に接続
    するステップと、 前記第2のアプリケーションサーバ計算機上で前記チェ
    ックポイントファイルの情報をもとにアプリケーション
    プロセスを復元するステップとを有することを特徴とす
    るサーバ・ベースド・コンピューティングモデルにおけ
    るアプリケーションサーバ計算機障害自動復旧方法。
JP2001017206A 2001-01-25 2001-01-25 サーバ・ベースド・コンピューティングモデルにおけるアプリケーションサーバ計算機障害自動復旧装置及び方法 Pending JP2002222176A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001017206A JP2002222176A (ja) 2001-01-25 2001-01-25 サーバ・ベースド・コンピューティングモデルにおけるアプリケーションサーバ計算機障害自動復旧装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001017206A JP2002222176A (ja) 2001-01-25 2001-01-25 サーバ・ベースド・コンピューティングモデルにおけるアプリケーションサーバ計算機障害自動復旧装置及び方法

Publications (1)

Publication Number Publication Date
JP2002222176A true JP2002222176A (ja) 2002-08-09

Family

ID=18883444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001017206A Pending JP2002222176A (ja) 2001-01-25 2001-01-25 サーバ・ベースド・コンピューティングモデルにおけるアプリケーションサーバ計算機障害自動復旧装置及び方法

Country Status (1)

Country Link
JP (1) JP2002222176A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006228220A (ja) * 2005-02-18 2006-08-31 Internatl Business Mach Corp <Ibm> ブレード・サーバにおけるクライアント再割り当てのためのシステムおよび方法
JP2007529067A (ja) * 2004-03-12 2007-10-18 インターナショナル・ビジネス・マシーンズ・コーポレーション 自己修復複合ウェブ・サービスのための方法及び装置
JP2008217290A (ja) * 2007-03-02 2008-09-18 Casio Comput Co Ltd サーバ装置、情報処理システム、サーバ制御プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007529067A (ja) * 2004-03-12 2007-10-18 インターナショナル・ビジネス・マシーンズ・コーポレーション 自己修復複合ウェブ・サービスのための方法及び装置
JP2006228220A (ja) * 2005-02-18 2006-08-31 Internatl Business Mach Corp <Ibm> ブレード・サーバにおけるクライアント再割り当てのためのシステムおよび方法
JP2008217290A (ja) * 2007-03-02 2008-09-18 Casio Comput Co Ltd サーバ装置、情報処理システム、サーバ制御プログラム

Similar Documents

Publication Publication Date Title
US6477663B1 (en) Method and apparatus for providing process pair protection for complex applications
EP1320217B1 (en) Method of installing monitoring agents, system and computer program for monitoring objects in an IT network
US7526685B2 (en) Application manager for monitoring and recovery of software based application processes
US7100070B2 (en) Computer system capable of fast failover upon failure
US9348706B2 (en) Maintaining a cluster of virtual machines
US8799446B2 (en) Service resiliency within on-premise products
US20020188891A1 (en) Apparatus and method for building metadata using a heartbeat of a clustered system
CN112506702B (zh) 数据中心容灾方法、装置、设备及存储介质
WO2003047063A1 (en) A functional fail-over apparatus and method of operation thereof
CN111464612B (zh) 一种恶劣环境下提供稳定计算服务的方法
JP2001043105A (ja) 高可用性計算機システム及び同システムにおけるデータバックアップ方法
CN112306644A (zh) 一种基于Azure云环境下的CDP方法
JP4515262B2 (ja) フォールトトレランススキームを動的に切換えるための方法
JP2005301436A (ja) クラスタシステムおよびクラスタシステムにおける障害回復方法
JP2002222176A (ja) サーバ・ベースド・コンピューティングモデルにおけるアプリケーションサーバ計算機障害自動復旧装置及び方法
JP2004258936A (ja) モバイル通信端末及びそれに用いるフェイルセーフ方法並びにそのプログラム
JP3447347B2 (ja) 障害検出方法
JP2006285453A (ja) 情報処理装置、情報処理方法、および情報処理プログラム
JP2007041646A (ja) クライアント−サーバ型システム、並びに、その管理方法および管理プログラム
JP2003006018A (ja) 処理要求復旧方式及び処理要求復旧方法及びクライアント装置及びサーバ装置
JP2003114812A (ja) Webページ運用監視方法、Webページ運用監視システム及びWebページ運用監視プログラム
JP2003050753A (ja) 自動復旧Webサーバー運用システム
JPH1125062A (ja) 障害回復システム
CN101924774B (zh) 计算机组合服务快速重建系统及其重建方法
KR100428765B1 (ko) 비동기 전송 모드에서의 관리 정보 전송 시스템 및 방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040907

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050111