JP2007164264A - 負荷分散プログラム、負荷分散装置、サービスシステム - Google Patents

負荷分散プログラム、負荷分散装置、サービスシステム Download PDF

Info

Publication number
JP2007164264A
JP2007164264A JP2005356300A JP2005356300A JP2007164264A JP 2007164264 A JP2007164264 A JP 2007164264A JP 2005356300 A JP2005356300 A JP 2005356300A JP 2005356300 A JP2005356300 A JP 2005356300A JP 2007164264 A JP2007164264 A JP 2007164264A
Authority
JP
Japan
Prior art keywords
service
failure
computer
server
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005356300A
Other languages
English (en)
Inventor
Kenichirou Kiko
健一郎 木子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005356300A priority Critical patent/JP2007164264A/ja
Publication of JP2007164264A publication Critical patent/JP2007164264A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】サービスを提供するサーバへの好適な負荷分散を実現する。
【解決手段】サービス状態管理テーブル15には、本システムが提供するサービス毎に、当該サービスを実行可能なサーバ2に対応させてサーバ2の障害発生状況を示すサーバ状態、障害の程度を示す障害レベル及び負荷分散対象か否かを示す情報を含む障害情報が設定登録されている。サービス状態監視処理部11は、各サーバ2a〜2dの状態(障害発生状況)を定期的に監視し、状態が変化したときには、その内容でサービス状態管理テーブル15を更新する。クライアント発信のサービス要求を受信すると、サーバ決定処理部13は、サービス状態管理テーブル15に設定された障害情報を参照に、サーバ決定ルールに従い、要求されたサービスが提供可能なサーバの中から当該サービスを提供するサーバ2を決定する。サービス処理制御部12は、その決定されたサーバ2へサービス要求を転送する。
【選択図】図2

Description

本発明は、負荷分散しながらサービスを実行する複数のコンピュータのいずれかに、要求されたサービスを提供させる際、そのサービスを提供させるコンピュータの決定方法に関する。
WEBアプリケーションサービスの可用性を高めるための技術としては、フェイルオーバー型のクラスタ構成を構築する方法と、負荷分散装置を用いて複数台のうち稼働可能なWEBサーバに負荷を分散しながらサービスを継続する方法がある。このうち、後者の負荷分散装置を用いる方法の内容について詳述すると、この方法は、WEBアプリケーションサービスを提供する複数台のWEBサーバと、各WEBサーバの負荷分散を担当する負荷分散装置とでシステムを構築しておく。そして、負荷分散装置は、各サーバの負荷の状態や、各サーバがサービスを提供可能な状態であるかといったサーバに関する情報を定期的に取得、保持する。
クライアントからのリクエストを受信すると、負荷分散装置は、保持している各サーバに関する情報に基づき予め設定されたルールに従い当該リクエストを処理するのに最適なサーバを決定する。なお、予め設定しておくルールには、各サーバに関する情報に基づいて、当該リクエストを処理するのに最適なサーバを決定するための決定手順が設定されているが、少なくとも障害が発生しているサーバは選出されないように設定される。そして、負荷分散装置は、受信したリクエストを、ルールに従い決定したサーバへ転送する。リクエストが転送されてきたサーバは、そのリクエストに応じて発信元のクライアントに対してサービスを提供することになる。
このように、複数台のWEBサーバに負荷分散しながらサービスを提供する方法では、設定されたルールに従って障害が発生したサーバを選択候補から除外し、障害が発生しておらず、かつ要求されたサービスを提供可能なサーバの中から当該リクエストに対応するサーバを選出するので、可用性を向上させることができる。なお、負荷分散装置において、負荷を分散するサーバを動的に決定する従来技術としては、例えば特許文献1,2などがある。
特開平11−250020号公報 特開2003−281007号公報
ところで、サーバで発生しうる障害には、例えば、バックアップの失敗や冗長化されたハードウェアの一部の障害などのように、障害ではあるがサービスの提供は継続可能な障害と、サービス提供自体に支障が生ずるような障害とが存在する。従って、このような程度(レベル)によって障害を分類することができる。
障害の程度が相対的に軽度である障害が発生したサーバは、障害が発生したのだから負荷分散対象、すなわちサービス要求に対してサービスを提供するサーバの選択候補から除外されるべきであるとも考えられる。つまり、障害が発生していないサーバのみを負荷分散対象とすべきであると考えられる。しかしながら、その一方で、障害が発生していないサーバの負荷が過大な状態であるのにもかかわらず、軽度な障害であるためにサービスの提供が可能なサーバを常に負荷分散対象から除外し、負荷が過大なサーバに対して更にサービスを実行させることが妥当な負荷分散ではあるとは言い難い。負荷分散の観点からすると、軽度な障害であるためにサービスの提供が可能なサーバにもサービスの提供を行わせた方がよいとも考えられる。
しかしながら、従来の負荷分散方法では、いずれかのサーバで障害が発生したとき、発生した障害の程度によって区別せずに障害発生の有無のみで当該サーバを選択候補から除外するようにしていた。従って、前述したような障害の程度に応じた負荷の分散制御を実現することができない。
本発明は、以上のような課題を解決するためになされたものであり、サービスを提供するコンピュータへの好適な負荷分散を実現することを目的とする。
以上のような目的を達成するために、本発明に係る負荷分散プログラムは、1または複数のサービスを実行する複数のコンピュータと共に、受信したサービス要求に応じてサービスを提供するサービスシステムに含まれ、受信したサービス要求を、各コンピュータにかかる負荷が分散されるようにいずれかのコンピュータに転送する負荷分散用コンピュータを、サービスシステムが提供する各サービスを実行しうるコンピュータと当該各コンピュータにおける現在の障害の程度を示す障害レベル情報とが対応付けされた障害情報をサービス毎に記憶するサービス状態記憶手段、各サービスの提供に関わる障害発生状況を各コンピュータから収集し、その収集した障害発生状況に基づいて、前記サービス状態記憶手段に記憶された障害情報を更新するサービス状態監視手段、サービス要求を受信する要求受信手段、前記要求受信手段が受信したサービス要求により指定されたサービスを実行するコンピュータを、前記サービス状態記憶手段に記憶されている当該サービスを実行しうる各コンピュータの障害情報と予め決められた決定ルールによって決定する決定処理手段、前記決定処理手段が決定したコンピュータへ当該サービス要求を転送する要求転送手段として機能させるものである。
また、前記決定処理手段は、障害レベル情報により特定される障害の程度に応じて決められたサービス要求転送先の順番に従うという決定ルールに従い当該サービスを実行するコンピュータを決定するものである。
更に、前記決定処理手段は、当該サービスを実行しうる各コンピュータへのサービス要求転送数が、障害レベル情報により特定される障害の程度に応じて決められた一定割合となるように当該サービスを実行するコンピュータを決定する。
あるいは、前記サーバ決定処理手段は、障害レベル情報により特定される障害の程度に応じて決められたサービス要求転送数上限値に達するまで障害の程度の低いコンピュータから優先的に当該サービスを実行するコンピュータとして選出するようにしてもよい。
また、前記負荷分散用コンピュータを更に、各コンピュータにおける負荷状況を取得する負荷状況取得手段として機能させ、前記決定処理手段は、前記負荷状況取得手段が取得した当該サービスを実行しうる各コンピュータの負荷状況を参照に当該サービスを実行するコンピュータを決定するものである。
また、前記サービス状態記憶手段には、サービスシステムが提供する各サービスに対応させて、負荷分散するために当該サービスを提供可能なコンピュータとして確保しておきたい下限台数が設定されており、前記サービス状態監視手段は、各コンピュータから収集した障害発生状況からサービスの提供が不能ではない程度の障害が発生していると判定したコンピュータを、前記サービス状態記憶手段に設定されている下限台数とすでに負荷分散対象として選択されているコンピュータの台数との関係に基づき負荷分散対象とするか否かを判断し、その判断結果を障害情報の一部として前記サービス状態記憶手段に設定登録するものである。
本発明に係る負荷分散装置は、1または複数のサービスを実行する複数のコンピュータと共に、サービス要求に応じてサービスを提供するサービスシステムに含まれ、受信したサービス要求を、各コンピュータにかかる負荷が分散されるようにいずれかのコンピュータに転送する負荷分散用装置において、サービスシステムが提供するサービス毎に、当該サービスを実行しうるコンピュータと当該各コンピュータにおける現在の障害の程度を示す障害レベル情報とが対応付けされた障害情報を記憶するサービス状態記憶手段と、各サービスの提供に関わる障害発生状況を各コンピュータから収集し、その収集した障害発生状況に基づいて、前記サービス状態記憶手段に記憶された障害情報を更新するサービス状態監視手段と、サービス要求を受信する要求受信手段と、前記要求受信手段が受信したサービス要求により指定されたサービスを実行するコンピュータを、前記サービス状態記憶手段に記憶されている当該サービスを実行しうる各コンピュータの障害情報と予め決められたサーバ決定ルールによって決定する決定処理手段と、前記決定処理手段が決定したコンピュータへ当該サービス要求を転送する要求転送手段とを有することを特徴とする。
本発明に係るサービスシステムは、1または複数のサービスを実行する複数のコンピュータと、受信したサービス要求に応じてサービスを提供するサービスシステムに含まれ、受信したサービス要求を、各コンピュータにかかる負荷が分散されるようにいずれかのコンピュータに転送する負荷分散装置とを有するサービスシステムにおいて、前記負荷分散装置は、サービスシステムが提供するサービス毎に、当該サービスを実行しうるコンピュータと当該各コンピュータにおける現在の障害の程度を示す障害レベル情報とが対応付けされた障害情報を記憶するサービス状態記憶手段と、各サービスの提供に関わる障害発生状況を各コンピュータから収集し、その収集した障害発生状況に基づいて、前記サービス状態記憶手段に記憶された障害情報を更新するサービス状態監視手段と、サービス要求を受信する要求受信手段と、前記要求受信手段が受信したサービス要求により指定されたサービスを実行するコンピュータを、前記サービス状態記憶手段に記憶されている当該サービスを実行しうる各コンピュータの障害情報と予め決められたサーバ決定ルールによって決定する決定処理手段と、前記決定処理手段が決定したコンピュータへ当該サービス要求を転送する要求転送手段とを有することを特徴とする。
また、前記各コンピュータは、前記サービス状態監視手段からの問合せに応じて自コンピュータに関わる障害発生状況を送信する障害監視手段を有し、前記サービス状態監視手段は、前記各障害監視手段へ障害通知要求を発信することによって、各コンピュータから障害発生状況を収集することを特徴とする。
本発明によれば、障害が発生したからといってそのコンピュータを無条件に負荷分散の候補から除外するのではなく、発生した障害の程度に応じてサービスの提供をさせるか否かを判断するようにした。これにより、正常なコンピュータへの負荷の集中の回避と、障害が発生したとはいえサービスの提供が可能なコンピュータの有効利用とが可能になるので、より効果的な負荷分散を実現することができる。
以下、図面に基づいて、本発明の好適な実施の形態について説明する。
図1は、本発明に係るサービスシステムの一実施の形態を示した全体構成図である。図1には、それぞれが1または複数のサービスを提供する複数台のWEBアプリケーションサーバコンピュータ(以下、単に「サーバ」)2と、サーバ2が提供する各種サービスの提供を受けるユーザが利用するクライアントコンピュータ(以下、単に「クライアント」)4と、サービスの提供を受けるためにクライアント4から発信されたサービス要求を受け付け、サーバ2にかかる負荷が分散されるようにいずれかのサーバ2に転送する負荷分散装置10と、ファイアウォール6を介してクライアント4と負荷分散装置10を接続するインターネット8とが示されている。
本システムは、クライアントユーザに対して複数種類のサービスを提供する。一のサービスが単一のWebアプリケーションの実行により実現されるとすると、本実施の形態では、Webアプリケーションそれぞれを1または複数のサーバ2にインストールしていることになる。換言すると、論理的には同じ場合もあり得るが、基本的にはサーバ2によって搭載されるサービスの種類や数が異なっている。
クライアント4は、本実施の形態ではパーソナルコンピュータ(PC)を想定しているが、これに限らず携帯電話等インターネット8を介して負荷分散装置10と情報交換が可能なコンピュータ若しくはコンピュータ搭載の情報機器であれば特に機器の種類に限定しない。負荷分散装置10は、本実施の形態では通信機能搭載のPCを想定している。なお、クライアント4と負荷分散装置10とは、情報交換可能に接続されていればよいため、ネットワーク手段としては、必ずしもインターネット8を介する必要はなくイントラネット等の通信網でもよい。
以下、図1を用いてクライアント4にサービスを提供する際の基本的な処理の概要について説明する。
本システムが提供するサービスを利用したいユーザは、利用したいサービスの種類や当該サービスの実施に必要な情報を含むサービス要求をクライアント4から発信する。負荷分散装置10は、インターネット8、ファイアウォール6を介してクライアント4から発信されたサービス要求を受信すると、その要求されたサービスを提供可能なサーバ2の中から各サーバ2の障害レベル等を考慮してその要求に対応する一のサーバ2を決定する。そして、クライアント4が発信したサービス要求を当該サーバ2へ転送する。サービス要求を受け取ったサーバ2は、要求に応じて当該サービスを実施し、その処理結果を負荷分散装置10へ返す。負荷分散装置10は、サーバ2から送られてきた処理結果をサービス要求元のクライアント4へ転送する。
本実施の形態では、以上のようにクライアント4から送られてきたサービス要求に応じて当該クライアント4へサービスを提供する。サービスを提供する全体的な処理の流れ自体は、従前と同様であるが、本実施の形態は、負荷分散装置10により実行される処理、具体的には、クライアント4からの要求に応じてサービスを提供するサーバ2の決定処理に特徴がある。この点については追って詳述する。
図2は、図1に示した負荷分散装置10及びサーバ2のブロック構成図である。本実施の形態における負荷分散装置10は、サービス状態監視処理部11、サービス処理制御部12、サーバ決定処理部13、障害レベル情報テーブル14及びサービス状態管理テーブル15を有している。サービス状態監視処理部11は、各サーバの状態を定期的に監視し、サービスの提供に関わる障害発生状況を各サーバ2から収集する。サービス処理制御部12は、クライアント4が発信したサービス要求を受信する要求受信手段及びサーバ決定処理部13が決定したサーバ2へ受信したサービス要求を転送する要求転送手段として機能する。サーバ決定処理部13は、サービス処理制御部12が受信したサービス要求により指定されたサービスを実行するサーバ2を、サービス状態管理テーブル15に記憶されている障害情報を参照に予め決められたサーバ決定ルールに従い決定する。なお、障害レベル情報テーブル14及びサービス状態管理テーブル15に関しては、追って説明する。
一方、サーバ2は、サービス実行部21と障害監視部22を有している。サービス実行部21は、負荷分散装置10から転送されてきたサービス要求に応じて該当するサービスを実行し、その処理結果を負荷分散装置10へ転送する。障害監視部22は、負荷分散装置10からの問合せに応じて自サーバに関わる障害発生状況、具体的には障害の発生の有無及び障害が発生している場合には、その障害の内容等自サーバの現在の状態を通知する。なお、図2では、説明の便宜上、4台のサーバ2a〜2dで構成した例を示している。各サーバ2a〜2dは、それぞれ前述した構成要素21,22を有しているが、処理能力等の相違によって提供可能なサービスの数や種類が異なる。
負荷分散装置10及びサーバ2をそれぞれ形成するコンピュータは、CPU、ROM、RAM、外部記憶装置として設けられたハードディスクドライブ(HDD)、入力手段として設けられたマウス及びキーボード、表示装置として設けられたディスプレイなどをそれぞれバスで接続して構成される。各構成要素11〜13,21〜22における処理機能は、コンピュータと当該処理機能を実現する1または複数の負荷分散プログラムとの協調動作により実現される。また、障害レベル情報テーブル14及びサービス状態管理テーブル15は、HDDで実現することを想定しているが、RAMに必要なデータをコピーしてから使用するようにしてもよい。
図3は、本実施の形態における障害レベル情報テーブル14に設定登録された障害レベル情報のデータ構成例を示した図である。図3に示したように、障害レベル情報テーブル14には、サーバ2において発生しうる障害の種類と各障害の程度を示す障害レベルとが対応付けして設定される。本実施の形態では、最低限必要な障害レベルとして、サーバ2がサービスを提供できない障害が発生した状態(「サービス不能」)であることを示す障害レベル0と、障害が発生していないためにサーバ2がサービスを正常に提供できる状態(「正常」)であることを示す障害レベル2と、障害が発生していているもののその障害の程度が軽微であるためにサーバ2がサービスを提供できる状態であることを示す障害レベル1との3パターンを用意した。従来では、障害の有無のみによって各サーバのサービスの提供が可能か否かを判断していたところを、本実施の形態では、障害が発生している「有」の状態を、サービスの提供が不能な状態と、サービスの提供が可能な状態とに更に区別して取り扱うようにしたことを特徴としている。本実施の形態では、障害レベル1として図3に示したように「バックアップ失敗」と「H/W冗長性喪失」とを例示している。サービス自体の提供に影響が及ばないようなデータのバックアップが失敗しても、あるいはミラーディスクの破損等HDDの冗長性が維持されていない状態でも、サービスを提供することには支障は来さないと考えられるからである。なお、本実施の形態では、サービス不能でない程度が軽微な障害を障害レベル1という1段階のみで構成したが、複数段階に分けて障害を分類するようにしてもよい。
図4は、本実施の形態におけるサービス状態管理テーブル15のデータ構成例を示した図である。図4に示したように、本システムが提供するサービス毎に、サーバ下限台数と、Webアプリケーションがインストールされていることにより当該サービスを実行しうるサーバと、当該各サーバにおける現在の障害の程度を示す障害レベル情報とが対応付けされた障害情報とが対応付けして登録される。「サーバ下限台数」というのは、負荷分散するために当該サービスを提供可能なサーバとして確保しておきたいサーバの台数である。詳細は後述するように、サーバ下限台数は、サーバ2から取得した状態が障害レベル1に相当するときに、当該サーバ2を負荷分散対象とするか、除外するかを判断する際の閾値として利用される。各サービスに対して「サーバ下限台数」と「サーバ」とは、各サービスに対して事前に設定しておく必要がある。なお、あるサービスを提供可能なサーバ2はどれかということは、システム起動時において負荷分散装置10と各サーバ2との間の情報交換で自動的に収集し、サービス状態管理テーブル15に設定登録することは可能である。
障害情報は、「サーバ状態」、「障害レベル」及び「負荷分散対象」で構成され、各サーバに対応付けして設定登録される。「サーバ状態」は、現在のサーバ2の状態を示す情報である。本実施の形態では、障害発生状況に関する情報であって、具体的には障害の発生の有無及び障害が発生している場合には、その障害の程度を示す情報が設定される。「障害レベル」は、「サーバ状態」を数値化したデータである。負荷分散装置10は、サービス要求が送られてきたとき、その要求された種類のサービスを、当該サービスを提供するためのWebアプリケーションがインストールされたサーバ2のうち各サーバ2の現在の負荷等を考慮していずれかのサーバ2に提供させることになるが、「負荷分散対象」には、サーバ2が負荷分散される選択候補であるか(“Yes”)、あるいは選択宝庫から除外されているか(“No”)、が設定される。
サービス状態監視処理部11は、各サーバ2の状態を定期的に監視し、サーバ2の状態の変化を検出したときには、その変化した状態に応じてサービス状態管理テーブル15の「サーバ状態」、「障害レベル」及び「負荷分散対象」を更新するが、ここで、サービス状態管理テーブル15のデータ構成の詳細な説明と共に本実施の形態におけるサーバ状態監視処理を図5に示したフローチャートを用いて説明する。
サービス状態監視処理部11は、定期的に起動され、定時処理として以下の処理を行う。まず、サービス状態監視処理部11は、サービス状態管理テーブル15を参照することによりサーバ2を1台選択し、現在の障害発生状況を問い合わせる(ステップ110)。本実施の形態では、4台のサーバ2a〜2dでサーバ群を形成しているので、以下の処理を4回繰り返し実行することになる。当該サーバ2の障害監視部22は、サービス状態監視処理部11による問合せに応じてサーバ2にてサービスの提供に関わる障害発生状況、すなわち障害の発生の有無、そして障害が発生している場合には、その障害の内容を返信する。サービス状態監視処理部11は、このようにして処理対象のサーバ2の状態を取得する(ステップ120)。
続いて、サービス状態監視処理部11は、サービス状態管理テーブル15に記憶されている処理対象のサーバ2のサーバ状態を読み出し、その読み出したサーバ状態と、取得したサーバ2の障害発生状況とを比較し、その結果、一致しないことによりサーバ2の状態が変化したと判断した場合には(ステップ130でY)、取得したサーバ2の状態でサービス状態管理テーブル15を更新する(ステップ140)。この更新と共に、障害レベル情報テーブル14を参照することによって更新したサーバ2の状態の障害レベルを特定し、その特定した障害レベルでサービス状態管理テーブル15を更新する。そして、サーバ状態が「正常」に更新されたときには(ステップ150でY)、サービス状態管理テーブル15に記憶されている当該サーバ2の負荷分散対象を“Yes”に変更した後(ステップ220)、ステップ190に移行する。
サーバ状態が「正常」でない場合、すなわち、処理対象のサーバ2に何らかの障害が発生しているときには(ステップ150でN)、以下のステップ160〜180における処理を実施する。なお、ステップ160に移行する場合というのは、直前のサーバ状態が「正常」か、同じ障害レベル1の他の種類の障害が新たに発生した場合である。障害レベル0の「サービス不能」であった場合は、障害レベル1に直接移行する場合はなく、いったん障害レベル2の「正常」に戻ることになる。
まず、サービス状態監視処理部11は、更新したサーバ2の状態が軽微な障害レベルに更新されたか否かを判断する(ステップ160)。本実施の形態でいう「軽微な障害レベル」というのは、「バックアップ失敗」などのように発生してもなおサービスを継続して提供できるような障害の程度を言う。本実施の形態では、軽微な障害レベルではない障害に該当するのは、「サービス不能」に割り当てた障害レベル0の障害だけであり、正常なサーバ状態を意味する障害レベル2を除くその他の障害レベルが軽微な障害レベルに該当する。本実施の形態では、便宜的に軽微な障害レベルを1段階のみ設定したので、障害レベル1のみが軽微な障害レベルに該当する。
軽微な障害が発生している場合(ステップ160でY)、サービス状態監視処理部11は、処理対象のサーバ2が提供するサービス毎に、以下の計算を行う。この計算について、処理対象中のサーバがサーバAであるときを例にして説明する。例えば、図6に示したサービス状態管理テーブル15の「サーバ」への設定例からサービス1についてのサービス要求の転送先候補がサーバA〜Dであることが理解できる。そして、処理対象中のサーバAを除く他のサーバB〜Dのうち負荷分散対象が“Yes”であるサーバ2の台数を積算する。この例では、サーバC,Dの2台である。ここで、積算値とサービス1に対して設定されたサーバ下限台数は共に2であることから、ステップ170における判定式(負荷分散対象数≧サーバ下限台数)を満たすことがわかる。つまり、サービス1を提供する際の負荷分散のためにサーバ下限台数が確保されているので、処理対象のサーバAの負荷分散対象を“No”に設定する(ステップ180)。一方、ステップ170における判定式を満たさない場合、サーバAの負荷分散対象を“No”に変更してしまうと、負荷分散対象数が確保できなくなってしまうため、上記設定変更を行わない。
その後、サービス状態監視処理部11は、必要に応じて負荷分散対象を変更する(ステップ190)。この処理については、追って説明する。そして、処理対象のサーバ2につき上記処理を処理対象としていないサービスが存在する場合には(ステップS200でY)、ステップ130に戻り、前述した処理を繰り返し行う。
ここで、処理対象中のサーバがサーバAであるときを例にして説明を続ける。サーバAにおいては、今度はサービス2についてステップ160〜180の処理を行うことになる。図6に示したサービス状態管理テーブル15への設定例から、負荷分散のためにサービス2についてのサービス要求の転送先候補がサーバA〜Cであることが理解できる。そして、処理対象中のサーバAを除く他のサーバB〜Cのうち負荷分散対象が“Yes”であるサーバ2の台数を積算する。この例では、サーバCの1台のみである。ここで、積算値は、サービス2に対して設定されたサーバ下限台数“2”を下回ることから、ステップ170における判定式(負荷分散対象数≧サーバ下限台数)を満たすことがわかる。従って、サーバAの負荷分散対象を“No”に変更しない。
以上のように、軽微な障害が発生したサーバAに対して、サービス1においてはサーバ下限台数を確保できているので負荷分散対象から除外する一方、サービス2においては、設定を“No”にしてしまうとサーバ下限台数を確保できなくなるので負荷分散対象から除外しない。このように、本実施の形態では、軽微な障害が発生したサーバに関しては、サーバ下限台数と負荷分散対象の数との比較によって負荷分散の対象とするかしないかを決定するようにした。ここで、上記において説明しなかった負荷分散対象の設定に関するステップ190について詳述する。
図6に示したサービス状態管理テーブル15の状態、例えば図6に例示したサービス2の設定内容となる直前の状態は、図7に例示した2通りが考えられる。通常は、図7(a)に示した状態、すなわち、正常であったサーバAにおいて「バックアップ失敗」等の軽微な障害が発生した場合である。この場合は、前述したようにサービス2におけるサーバAの負荷分散対象を“No”に設定変更してしまうと、サーバ下限台数を確保できなくなるので“Yes”に維持したままとする。
一方、図7(b)に示したように、サーバAで「バックアップ失敗」が発生した時点では、サーバB,Cが共に正常であったためにサービス2のサーバ下限台数が確保されていることから、サーバAの負荷分散対象には“No”が設定されることになる(ステップ170でY、180)。しかし、この後に、サーバBにサービス2の提供が不可能となる障害が発生したとする。この場合、サーバBの負荷分散対象を“No”に設定変更しなければならないが、サーバBの負荷分散対象を“No”に変更すると、サービス2は、サーバ下限台数を確保できなくなってしまう。
従って、障害発生時には“No”と設定されたサーバAの負荷分散対象を、“Yes”に設定変更することによってサービス2のサーバ下限台数を確保するように調整した方が好ましいと考えられる。そこで、ステップ190において、サービスのサーバ下限台数を確保できるように各サービスにつき負荷分散対象を調整するようにした。
サービス状態監視処理部11は、前述した処理を各サーバにつきサービス毎に行うことで(ステップ200,210)、サービス状態管理テーブル15の更新を行う。
本実施の形態においては、以上説明したように、いずれかのサーバ2にて軽微な障害が発生したときには、障害が発生したとして当該サーバによるサービスの提供を不能、すなわち負荷分散対象から無条件に除外するのではなく、サーバ下限台数の確保を図りつつ負荷分散の効率化を実現できるようにした。従って、軽微な障害が発生したサーバ2が、あるサービスにおいてはサービス提供可能なサーバとして位置づけられ、他のサービスにおいてはサービス不能能なサーバとして位置づけられる場合が生じてくる。
なお、サービス状態監視処理部11と障害監視部22との間で授受される情報というのは、障害に関する情報であれば何でもよいというわけでなく、より具体的にいうと障害が発生してもなおサービスの提供が継続して可能か否かの判断指標となりうる情報である必要がある。
また、本実施の形態では、図3から明らかなように同じサーバ状態に対して同一の障害レベルを便宜的に割り当てた。つまり、サーバ状態と障害レベルとを1対1の関係にした。しかし、例えば、スキャナ機能の障害によって提供ができなくなるサービスや、スキャナ機能に障害が発生してもサービスを継続して提供できるサービスもあり得る。つまり、同じ障害が発生してもサービスの種類によって提供不能になったり、あるいは提供可能な状態を維持できたりする場合も考えられる。従って、サービス状態監視処理部11は、サービスの内容(使用するハードウェア構成、機能等)と発生した障害の内容との関係に従って、当該サービスの処理対象のサーバに対して適切な障害レベルを設定できるようにすることが望ましい。
以上のようにしてサービス状態管理テーブル15の設定内容は、定期的に更新されることになるが、続いて、本システムがこのサービス状態管理テーブル15を利用しながらクライアント4からの要求に応じてサービスを提供するときの処理について図8に示したフローチャートを用いて説明する。
サービス処理制御部12は、いずれかのクライアント4から送られてきたサービス要求を受信すると(ステップ310)、そのサービス要求に含まれている各種情報を読み込む(ステップ320)。そして、サービス処理制御部12は、本システムが提供するサービスが、受信したサービス要求に指定されているかを確認し、もし、指定されていなかった場合には(ステップ330でN)、サービス要求発信元のクライアント4に対してその旨のエラーを通知する(ステップ390)。
本システムが提供するサービス利用であることが確認されると(ステップ330でY)、サーバ決定処理部13は、要求されたサービスが提供可能なサーバが存在するかを確認する。これは、サービス状態管理テーブル15を参照することにより、要求されたサービスを提供するサーバ2のうち負荷分散対象に“Yes”と設定されているサーバが少なくとも1台存在すれば、当該サービスの提供が可能と判断する。これに対し、全てのサーバの負荷分散対象に“No”と設定されていれば、サービスの提供が不能と判断して(ステップ340でN)、サービス要求発信元のクライアントに対してその旨のエラーを通知する(ステップ390)。
サービスの提供が可能と判断した場合(ステップ340でY)、サーバ決定処理部13は、負荷分散対象に“Yes”と設定されているサーバ2が1台のみであれば、そのサーバ2を、サービスを提供するサーバ2として決定し、負荷分散対象に“Yes”と設定されているサーバ2が複数台存在すれば、その中からサービスを提供する1台のサーバ2を決定する(ステップ350)。この1台のサーバ2を決定する方法については、後述する。
サーバ決定処理部13がサービスを提供するサーバ2を決定すると、サービス処理制御部12は、受信したサービス要求をその決定されたサーバ2へ転送する(ステップ360)。サービス要求が転送されてくると、そのサーバ2のサービス実行部21は、要求されたサービスに対応するWebアプリケーションを起動することで当該サービスを実行し、そのサービス処理の結果を得る。サービス処理制御部12は、転送したサービス要求に応じてサーバ2から送られてきた処理結果を取得すると(ステップ370)、その処理結果を、サービス要求発信元のクライアント4へ転送する(ステップ380)。
本実施の形態によれば、以上のようにしてクライアント4へサービスを提供する。ここで、複数台のサーバ2がサービスの提供が可能な状態であるときに、その中からサービスを提供する1台のサーバ2を決定するステップ350における処理について説明する。
サーバ決定方法としては、種々のパターンが考えられるので、ここで、いくつかの決定方法について説明する。
サービスの提供が可能な(負荷分散対象が“Yes”である)サーバ2は、障害レベル2のサーバ状態が「正常」のサーバ2のみならず、障害レベル1の軽微な障害が発生しているサーバも存在しうる。障害レベルが同じサーバ間においては、負荷が均等に分散されるようにサービス要求を均等に分配すればよいが、異なる障害レベルが混在している場合、すなわち障害レベルが2と1のサーバ2が混在している場合もある。障害レベル1のサーバ2は、サービスの提供が可能なサーバ状態であるものの、たとえ軽微であるとはいえ障害が発生していることには変わりがなく、性能が低下している可能性もある。従って、軽微な障害が発生しているサーバ2を正常なサーバ2と全く同等に負荷分散の対象として扱うのが適切であるとは限らない。そこで、本実施の形態では、障害レベルに応じて負荷分散対象のサーバ2に優先順位を付け、そしてその優先順位に従い決められた順番にサービス要求の転送先を決定するようにした。なお、この決定方法は、予めサーバ決定ルールとして設定しておく。
例えば、第1の方法としては、サービス要求を一定割合に従ってサーバ状態が正常であるサーバ2に対して優先的に割り振る方法が考えられる。このサービス要求を割り振る概念を図9(a)に示す。
図9では、サービスの提供が可能なサーバ状態にあるサーバとして、障害レベル2の2台のサーバA,Bと、障害レベル1の1台のサーバCが存在していることを示している。そして、各サーバA〜Cの下方の数字が、各サーバ決定方法により定義されたルールに従って選択される順番を意味する。図9(a)では、障害レベル2のサーバと、障害レベル1のサーバとが2対1の割合でサービス要求が転送されるように設定されている例である。従って、障害レベル2のサーバAとサーバBは、交互に選択され、障害レベル1のサーバCは、サーバA,Bが2回ずつ選択された後に1回選択されることになる。サーバ決定処理部13は、第1の方法として、一定の割合(m:n、m>n)で各サーバA〜Cが選択されるように、サービス要求を転送するサーバを決定する。このようにして、負荷分散を実現しつつ軽微な障害が発生しているサーバCへの負荷の軽減を図ることができる。
第2の方法としては、割り振る数の上限値として基準値を設定する。このサービス要求を割り振る概念を図9(b)に示す。図9(b)では、基準値として“5”を設定したときの例である。従って、基準値に達するまでは、障害の程度の低い障害レベル2のサーバAとサーバBが交互に選択され、各サーバA,Bへの転送数が基準値に達した後に障害レベル1のサーバCを転送対象として選択する。サーバ決定処理部13は、第2の方法として、正常なサーバA,Bへの転送数が一定の上限値に達するまでは、軽微な障害が発生しているサーバCへの転送を控えることができるので、負荷分散を実現しつつ軽微な障害が発生しているサーバCへの負荷の軽減を図ることができる。
上記方法がサービス要求の転送数のみに着目して次に受信したサービス要求を転送するサーバを決定するのに対し、ここで説明する第3の方法は、更に各サーバにかかっている負荷を更に考慮してサービスを提供させるサーバを決定するものである。
すなわち、サービス状態監視処理部11は、サーバ2の負荷の状態を定期的に監視する。サーバ2にかかる負荷というのは、CPUの使用率等によって計測することができる。そして、負荷の上限値を予め設定しておき、サーバ決定処理部13は、障害レベル2のサーバA,Bにかかる負荷がその上限値に達するまでは、サーバA,Bにかかる負荷が均等になるようにいずれかのサーバA,Bを選択する。そして、サーバA,B双方の負荷が上限値に達した後に、障害レベル1のサーバCを選択するようにする。
サービスの実行が終了すると、サーバにかかる負荷は軽減される。サーバ決定処理部13は、第3の方法として、実際の負荷を監視しながらサービスを提供させるサーバを決定するようにしたので、負荷分散を実現しつつ軽微な障害が発生しているサーバCへの負荷の軽減を図ることができる。なお、第3の方法は、第1又は第2の方法と組み合わせて実行するようにしてもよい。あるいは、各障害レベル2,1のCPU使用率を40%と20%などと一定の割合に設定するなど第1の方法の考え方を第3の方法に取り入れるようにしてもよい。
本実施の形態では、以上のように、障害の程度に応じてサービス要求の転送先とするサーバ2を決定する。
本実施の形態によれば、障害が発生したからといってそのサーバを無条件に負荷分散の候補から除外するのではなく、発生した障害の程度に応じてサービスの提供をさせるか否かを決定するようにした。これにより、正常なサーバ2への負荷の集中の回避と、障害が発生したとはいえサービスの提供が可能なサーバ2の有効利用が可能となるので、より効果的な負荷分散を実現することができる。
本発明に係るサービスシステムの一実施の形態を示した全体構成図である。 図1に示した負荷分散装置及びサーバのブロック構成図である。 本実施の形態における障害レベル情報テーブルに設定登録された障害レベル情報のデータ構成例を示した図である。 本実施の形態におけるサービス状態管理テーブルのデータ構成例を示した図である。 本実施の形態におけるサーバ状態監視処理を示したフローチャートである。 本実施の形態におけるサービス状態管理テーブルの他のデータ設定例を示した図である。 本実施の形態におけるサービス状態管理テーブルへのデータ設定を説明するために用いる図である。 本実施の形態におけるサービス提供処理を示したフローチャートである。 本実施の形態におけるサーバ決定ルールの例を示した概念図である。
符号の説明
2,2a〜2d サーバ、4 クライアント、6 ファイアウォール、8 インターネット、10 負荷分散装置、11 サービス状態監視処理部、12 サービス処理制御部、13 サーバ決定処理部、14 障害レベル情報テーブル、15 サービス状態管理テーブル、21 サービス実行部、22 障害監視部。

Claims (9)

  1. 1または複数のサービスを実行する複数のコンピュータと共に、受信したサービス要求に応じてサービスを提供するサービスシステムに含まれ、受信したサービス要求を、各コンピュータにかかる負荷が分散されるようにいずれかのコンピュータに転送する負荷分散用コンピュータを、
    サービスシステムが提供する各サービスを実行しうるコンピュータと当該各コンピュータにおける現在の障害の程度を示す障害レベル情報とが対応付けされた障害情報をサービス毎に記憶するサービス状態記憶手段、
    各サービスの提供に関わる障害発生状況を各コンピュータから収集し、その収集した障害発生状況に基づいて、前記サービス状態記憶手段に記憶された障害情報を更新するサービス状態監視手段、
    サービス要求を受信する要求受信手段、
    前記要求受信手段が受信したサービス要求により指定されたサービスを実行するコンピュータを、前記サービス状態記憶手段に記憶されている当該サービスを実行しうる各コンピュータの障害情報と予め決められた決定ルールによって決定する決定処理手段、
    前記決定処理手段が決定したコンピュータへ当該サービス要求を転送する要求転送手段、
    として機能させる負荷分散プログラム。
  2. 請求項1記載の負荷分散プログラムにおいて、
    前記決定処理手段は、障害レベル情報により特定される障害の程度に応じて決められたサービス要求転送先の順番に従うという決定ルールに従い当該サービスを実行するコンピュータを決定する負荷分散プログラム。
  3. 請求項2記載の負荷分散プログラムにおいて、
    前記サーバ決定処理手段は、当該サービスを実行しうる各コンピュータへのサービス要求転送数が、障害レベル情報により特定される障害の程度に応じて決められた一定割合となるように当該サービスを実行するコンピュータを決定する負荷分散プログラム。
  4. 請求項2記載の負荷分散プログラムにおいて、
    前記サーバ決定処理手段は、障害レベル情報により特定される障害の程度に応じて決められたサービス要求転送数上限値に達するまで障害の程度の低いコンピュータから優先的に当該サービスを実行するコンピュータとして選出する負荷分散プログラム。
  5. 請求項1記載の負荷分散プログラムにおいて、前記負荷分散用コンピュータを更に、
    各コンピュータにおける負荷状況を取得する負荷状況取得手段として機能させ、
    前記決定処理手段は、前記負荷状況取得手段が取得した当該サービスを実行しうる各コンピュータの負荷状況に基づいて当該サービスを実行するコンピュータを決定する負荷分散プログラム。
  6. 請求項1記載の負荷分散プログラムにおいて、
    前記サービス状態記憶手段には、サービスシステムが提供する各サービスに対応させて、負荷分散するために当該サービスを提供可能なコンピュータとして確保しておきたい下限台数が設定されており、
    前記サービス状態監視手段は、各コンピュータから収集した障害発生状況からサービスの提供が不能ではない程度の障害が発生していると判定したコンピュータを、前記サービス状態記憶手段に設定されている下限台数とすでに負荷分散対象として選択されているコンピュータの台数との関係に基づき負荷分散対象とするか否かを判断し、その判断結果を障害情報の一部として前記サービス状態記憶手段に設定登録する負荷分散プログラム。
  7. 1または複数のサービスを実行する複数のコンピュータと共に、サービス要求に応じてサービスを提供するサービスシステムに含まれ、受信したサービス要求を、各コンピュータにかかる負荷が分散されるようにいずれかのコンピュータに転送する負荷分散用装置において、
    サービスシステムが提供するサービス毎に、当該サービスを実行しうるコンピュータと当該各コンピュータにおける現在の障害の程度を示す障害レベル情報とが対応付けされた障害情報を記憶するサービス状態記憶手段と、
    各サービスの提供に関わる障害発生状況を各コンピュータから収集し、その収集した障害発生状況に基づいて、前記サービス状態記憶手段に記憶された障害情報を更新するサービス状態監視手段と、
    サービス要求を受信する要求受信手段と、
    前記要求受信手段が受信したサービス要求により指定されたサービスを実行するコンピュータを、前記サービス状態記憶手段に記憶されている当該サービスを実行しうる各コンピュータの障害情報と予め決められたサーバ決定ルールによって決定する決定処理手段と、
    前記決定処理手段が決定したコンピュータへ当該サービス要求を転送する要求転送手段と、
    を有することを特徴とする負荷分散装置。
  8. 1または複数のサービスを実行する複数のコンピュータと、
    受信したサービス要求に応じてサービスを提供するサービスシステムに含まれ、受信したサービス要求を、各コンピュータにかかる負荷が分散されるようにいずれかのコンピュータに転送する負荷分散装置と、
    を有するサービスシステムにおいて、
    前記負荷分散装置は、
    サービスシステムが提供するサービス毎に、当該サービスを実行しうるコンピュータと当該各コンピュータにおける現在の障害の程度を示す障害レベル情報とが対応付けされた障害情報を記憶するサービス状態記憶手段と、
    各サービスの提供に関わる障害発生状況を各コンピュータから収集し、その収集した障害発生状況に基づいて、前記サービス状態記憶手段に記憶された障害情報を更新するサービス状態監視手段と、
    サービス要求を受信する要求受信手段と、
    前記要求受信手段が受信したサービス要求により指定されたサービスを実行するコンピュータを、前記サービス状態記憶手段に記憶されている当該サービスを実行しうる各コンピュータの障害情報と予め決められたサーバ決定ルールによって決定する決定処理手段と、
    前記決定処理手段が決定したコンピュータへ当該サービス要求を転送する要求転送手段と、
    を有することを特徴とするサービスシステム。
  9. 請求項8記載のサービスシステムにおいて、
    前記各コンピュータは、前記サービス状態監視手段からの問合せに応じて自コンピュータに関わる障害発生状況を送信する障害監視手段を有し、
    前記サービス状態監視手段は、前記各障害監視手段へ障害通知要求を発信することによって、各コンピュータから障害発生状況を収集することを特徴とするサービスシステム。
JP2005356300A 2005-12-09 2005-12-09 負荷分散プログラム、負荷分散装置、サービスシステム Pending JP2007164264A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005356300A JP2007164264A (ja) 2005-12-09 2005-12-09 負荷分散プログラム、負荷分散装置、サービスシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005356300A JP2007164264A (ja) 2005-12-09 2005-12-09 負荷分散プログラム、負荷分散装置、サービスシステム

Publications (1)

Publication Number Publication Date
JP2007164264A true JP2007164264A (ja) 2007-06-28

Family

ID=38247113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005356300A Pending JP2007164264A (ja) 2005-12-09 2005-12-09 負荷分散プログラム、負荷分散装置、サービスシステム

Country Status (1)

Country Link
JP (1) JP2007164264A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009020574A (ja) * 2007-07-10 2009-01-29 Osaka Univ Webサービスシステム
WO2009066347A1 (ja) * 2007-11-19 2009-05-28 Duaxes Corporation 負荷分散装置及び負荷分散方法
JP2009175889A (ja) * 2008-01-22 2009-08-06 Fujitsu Ltd 帯域制御機能を有する負荷分散装置およびその設定方法
JP2010003121A (ja) * 2008-06-20 2010-01-07 Mitsubishi Electric Corp データ転送システム及び転送装置及び監視装置及び転送プログラム及び監視プログラム
JP2010146261A (ja) * 2008-12-18 2010-07-01 Toshiba Corp 提供元報知装置及び提供元報知方法
JP2011248428A (ja) * 2010-05-24 2011-12-08 Fujitsu Ltd 負荷分散装置及び負荷分散制御方法
JP2013008251A (ja) * 2011-06-24 2013-01-10 Mitsubishi Electric Corp 情報処理システム、通信制御装置、及びプログラム
JP2014232442A (ja) * 2013-05-29 2014-12-11 西日本電信電話株式会社 Webサーバシステム、Webサーバ連携方法、及びプログラム
JP2016511451A (ja) * 2012-12-31 2016-04-14 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. ネットワーク機能を開くためのシステムおよび方法、ならびに関連するネットワーク要素
JP2018060420A (ja) * 2016-10-06 2018-04-12 富士ゼロックス株式会社 情報処理システム、情報処理装置およびプログラム
JP2022151519A (ja) * 2021-03-23 2022-10-07 スターライト テクノロジーズ リミテッド コンバージドネットワークインフラストラクチャーを提供するための方法およびエッジオーケストレーションプラットフォーム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009020574A (ja) * 2007-07-10 2009-01-29 Osaka Univ Webサービスシステム
WO2009066347A1 (ja) * 2007-11-19 2009-05-28 Duaxes Corporation 負荷分散装置及び負荷分散方法
JPWO2009066347A1 (ja) * 2007-11-19 2011-03-31 デュアキシズ株式会社 負荷分散装置
JP2009175889A (ja) * 2008-01-22 2009-08-06 Fujitsu Ltd 帯域制御機能を有する負荷分散装置およびその設定方法
JP2010003121A (ja) * 2008-06-20 2010-01-07 Mitsubishi Electric Corp データ転送システム及び転送装置及び監視装置及び転送プログラム及び監視プログラム
JP2010146261A (ja) * 2008-12-18 2010-07-01 Toshiba Corp 提供元報知装置及び提供元報知方法
JP2011248428A (ja) * 2010-05-24 2011-12-08 Fujitsu Ltd 負荷分散装置及び負荷分散制御方法
JP2013008251A (ja) * 2011-06-24 2013-01-10 Mitsubishi Electric Corp 情報処理システム、通信制御装置、及びプログラム
JP2016511451A (ja) * 2012-12-31 2016-04-14 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. ネットワーク機能を開くためのシステムおよび方法、ならびに関連するネットワーク要素
JP2014232442A (ja) * 2013-05-29 2014-12-11 西日本電信電話株式会社 Webサーバシステム、Webサーバ連携方法、及びプログラム
JP2018060420A (ja) * 2016-10-06 2018-04-12 富士ゼロックス株式会社 情報処理システム、情報処理装置およびプログラム
JP2022151519A (ja) * 2021-03-23 2022-10-07 スターライト テクノロジーズ リミテッド コンバージドネットワークインフラストラクチャーを提供するための方法およびエッジオーケストレーションプラットフォーム

Similar Documents

Publication Publication Date Title
JP2007164264A (ja) 負荷分散プログラム、負荷分散装置、サービスシステム
US7225356B2 (en) System for managing operational failure occurrences in processing devices
JP4087903B2 (ja) ネットワーク・サービスの負荷平衡化及びフェールオーバ
US9659075B2 (en) Providing high availability in an active/active appliance cluster
US8095935B2 (en) Adapting message delivery assignments with hashing and mapping techniques
CN112887368B (zh) 对复制型数据库的访问进行负载平衡
US8140677B2 (en) Autonomic web services hosting service
JP5863942B2 (ja) ウィットネスサービスの提供
US20090248804A1 (en) Access request transfer system, access request transfer method, and recording medium storing access request transfer program
US9830235B1 (en) Cooperative fault tolerance and load balancing
US8112518B2 (en) Redundant systems management frameworks for network environments
JP2010113495A (ja) クラスタシステムおよびクラスタ制御方法
US7835286B2 (en) Dynamic multi-objective grid resources access
JP2009086741A (ja) 異種ノード混在の分散環境における分散処理制御方法、そのシステム及びそのプログラム
JP5613119B2 (ja) マスター/スレーブシステム、制御装置、マスター/スレーブ切替方法、および、マスター/スレーブ切替プログラム
JP2011203941A (ja) 情報処理装置、監視方法、および監視プログラム
JP5526780B2 (ja) 負荷分散システム、サービス処理サーバ、負荷分散方法及び負荷分散プログラム
Verma et al. Hbi-lb: A dependable fault-tolerant load balancing approach for fog based internet-of-things environment
JP2009223371A (ja) コンピュータリンク方法及びシステム
JP2006235736A (ja) クラスタシステムのキャッシュ同期制御方法
US11374849B1 (en) High availability router switchover decision using monitoring and policies
CN117882340A (zh) 为网络节点的客户端未知晓滚动进行的协调重连接
JP4743904B2 (ja) リソース過分配防止システム
JP2010182017A (ja) 分散計算機システム、マネージャ引き継ぎ方法及びマネージャ引き継ぎプログラム
JP2006031096A (ja) 分散処理システムおよびその再起動制御方法および再起動制御プログラム