WO2011070607A1

WO2011070607A1 - サーバシステムの制御方法及びサーバの制御プログラム

Info

Publication number: WO2011070607A1
Application number: PCT/JP2009/006676
Authority: WO
Inventors: 松村泰宏
Original assignee: 富士通株式会社
Priority date: 2009-12-07
Filing date: 2009-12-07
Publication date: 2011-06-16

Abstract

　本発明は、サーバ監視の監視レスポンスの低下を抑制するサーバシステムの制御方法を提供する。　ネットワークで接続された複数のサーバを有するサーバシステムの制御方法であって、複数のサーバの１つである第１サーバは、第１サーバと他のサーバの運用状況を監視し、第１サーバは、第１サーバの第１負荷を検出し、第１サーバは、第１負荷の検出結果と所定の閾値とを比較し、第１負荷が閾値よりも大きいときに、第１サーバは、他のサーバである第２サーバに対して第２サーバの第２負荷の検出の依頼を送信し、第２サーバは、第１サーバからの第２負荷の検出の依頼を受信して、第２サーバの第２負荷を検出し、第２サーバは、第２負荷の検出結果を第１サーバに対して送信し、第１サーバは、第２サーバから送信された第２負荷の検出結果を受信する。

Description

サーバシステムの制御方法及びサーバの制御プログラム

　本発明は、複数のサーバをネットワーク上で接続し、サーバに接続されたクライアントからの要求に応じて処理を実行するサーバシステムの制御方法に関する。

　サーバシステムはネットワークで接続された複数のサーバによって構成されている。複数のサーバには、ネットワークを介してクライアントが接続されている。複数のサーバは、クライアントからの要求に応じて処理を実行する。サーバシステム内の複数のサーバは、監視サーバと、監視サーバによって監視されるサーバに分類される。
　監視サーバは、サーバシステム内の他のサーバの運用状況を監視する。監視サーバには、サーバ監視プログラムがインストールされている。サーバ監視プログラムは、監視されるサーバのＣｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ（ＣＰＵ）使用率を含む運用状況を継続的に取得するように動作させる。

　しかしながら、上記の構造では、監視サーバに何らかの要因で負荷が集中する場合がある。監視サーバに負荷が集中すると、監視レスポンスが低下する問題が発生する。サーバ監視のレスポンスの低下に伴い、監視サーバが監視しているサーバの故障の検出が遅延する問題が発生する。

　従来技術として、下記の文献がある。

特開２００６－１５７２９３号公報特開平１１－１２２８１５号公報特開平１１－１２２８１６号公報

　本発明は、サーバ監視の監視レスポンスの低下を抑制するサーバシステムの制御方法を提供することを目的とする。

　本発明の課題を解決するため、本発明の第１の側面によれば、
　ネットワークで接続された複数のサーバを有するサーバシステムの制御方法であって、
　前記複数のサーバの１つである第１サーバは、前記第１サーバと他のサーバの運用状況を監視し、
　前記第１サーバは、前記第１サーバの第１負荷を検出し、
　前記第１サーバは、前記第１負荷の検出結果と所定の閾値とを比較し、
　前記第１負荷が前記閾値よりも大きいときに、前記第１サーバは、他のサーバである第２サーバに対して前記第２サーバの第２負荷の検出の依頼を送信し、
　前記第２サーバは、前記第１サーバからの第２負荷の検出の依頼を受信して、前記第２サーバの第２負荷を検出し、
　前記第２サーバは、前記第２負荷の検出結果を前記第１サーバに対して送信し、
　前記第１サーバは、前記第２サーバから送信された前記第２負荷の検出結果を受信し、
　前記第１サーバは、前記第１負荷の検出結果及び前記第２負荷の検出結果に基づいて、前記第２サーバに対して前記複数のサーバの運用状況の監視を依頼し、
　前記第２サーバは、前記第１サーバからの前記複数のサーバの運用状況の監視の依頼を受信して、運用状況を監視する
ことを特徴とするサーバシステムの制御方法を提供する。

　本発明の第２の側面によれば、
　ネットワークで接続された複数のサーバを有するサーバシステムに使用されるサーバの制御プログラムであって、
　前記複数のサーバを制御する制御部を、
　自サーバと他のサーバの運用状況を監視する前記複数のサーバの１つである自サーバの第１監視手段、
　前記自サーバの第１負荷を検出する前記自サーバの第１検出手段、
　前記第１負荷の検出結果と所定の閾値とを比較する前記自サーバの第１比較手段、
　前記第１負荷が前記閾値より大きいときに、前記他のサーバに対して第２負荷の検出を依頼する前記自サーバの第１依頼手段、
　前記自サーバからの前記第２負荷の検出の依頼を受信する前記他のサーバの第１受信手段、
　前記第２負荷を検出する前記他のサーバの第２検出手段、
　前記第２負荷の前記検出結果を前記自サーバに対して送信する前記他のサーバの送信手段、
　前記他のサーバから送信された前記第２負荷の前記検出結果を受信する前記自サーバの第２受信手段、
　前記第１負荷の前記検出結果及び前記第２負荷の前記検出結果に基づいて、前記他のサーバに対して前記複数のサーバの前記運用状況の監視を依頼する前記自サーバの第２依頼手段、
　前記自サーバからの前記運用状況の監視の依頼を受信する前記他のサーバの第３受信手段、
　前記運用状況を監視する前記他のサーバの第２監視手段、
として機能させることを特徴とするサーバの制御プログラムを提供する。

　本発明によれば、複数のサーバのうち負荷の小さいサーバによって複数のサーバを監視させるため、サーバ監視の監視レスポンスの低下を抑制することができる。また、監視用のサーバを自律的に移動させることができるので、サーバの資源を有効に利用できる。

図１は、本実施例に係る監視プログラムに用いられるサーバの概略構成図を示す図である。図２は、本実施例に係る監視プログラムに用いられるサーバのシステム構成図を示す図である。図３は、本実施例に係る監視プログラムに用いられる監視対象サーバテーブルの一例を示す図である。図４は、本実施例に係る監視プログラムに用いられるマネージャ特定テーブルの一例を示す図である。図５は、本実施例に係る監視プログラムに用いられる負荷閾値テーブルの一例を示す図である。図６は、本実施例に係る監視プログラムに用いられるサーバの動作を示すフローチャートである。図７は、本実施例に係る監視プログラムに用いられるサーバの動作を示すフローチャートである。図８は、本実施例に係る監視プログラムに用いられるサーバの動作を示すフローチャートである。図９は、本実施例に係る監視プログラムに用いられるサーバの動作を示すフローチャートである。図１０は、本実施例に係る監視プログラムに用いられるサーバの動作を示すフローチャートである。図１１は、本実施例に係る監視プログラムに用いられるサーバの動作を示すフローチャートである。

　以下、本発明の実施例に係るサーバシステムの制御方法及びサーバの監視プログラムが説明される。ただし、本発明は本実施例に限定されるものではない。

　図１から図１１では、本実施例に係るサーバシステムの制御方法及びサーバの監視プログラムが説明される。　

　図１は、本発明に係るサーバ１００の概略構成図を示す。
　サーバ１００は、入出力装置３、メモリ４、サーバ管理機構５、Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ（ＣＰＵ）１０及びディスク装置２０を備える。

　入出力装置３は、ＬＯＣＡＬ　ＡＲＥＡ　ＮＥＴＷＯＲＫ（ＬＡＮ）３０を介して、他のサーバとの間でデータの送受信を行う。

　ディスク装置２０は、例えばＨＡＲＤ　ＤＩＳＫ　ＤＲＩＶＥ（ＨＤＤ）から構成されている。ディスク装置２０は、例えば監視対象サーバテーブル２０Ｇ、マネージャ特定テーブル２０Ｈ、負荷閾値テーブル２０Ｉ、ＯＰＥＲＡＴＩＯＮ　ＳＹＳＴＥＭ（ＯＳ）、アプリケーションプログラム、及び、例えばクライアントからのＨＴＴＰリクエストに対して応答するためのデータが格納されている。監視対象サーバテーブル２０Ｇ、マネージャ特定テーブル２０Ｈ、及び負荷閾値テーブル２０Ｉについての説明は後述する。

　メモリ４は、バス４０を介してディスク装置２０と接続されている。メモリ４には、サーバ１００の装置全体を管理するプログラム４ａが格納される。なお、プログラム４ａについては、必ずしもメモリ４に記憶させておく必要はなく、例えば、サーバ１００に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ、ＭＯディスク、ＤＶＤディスク、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」、または、サーバ１００の内外に備えられるディスク装置、さらには、公衆回線、インターネット、ＬＡＮ、ＷＡＮなどを介してサーバ１００に接続される「他のコンピュータ（またはサーバ）」に記憶させておき、サーバ１００がこれらからプログラム４ａを読み出して実行するようにしてもよい。

　サーバ管理機構５は、ＣＰＵ使用率及びメモリ使用量を含む現在のサーバ１００の状況を、サーバ管理機構５に係る不図示の記憶領域に記録する。そして、サーバ管理機構５は、サーバ監視部１０Ａからサーバ１００の状態に関する問い合わせを受信すると、ＣＰＵ使用率及びメモリ使用量を含む現在のサーバ１００の状況をサーバ監視部１０Ａに返信する。

　ＣＰＵ１０は、バス４０を介して入出力装置３及びディスク装置２０と接続されている。ＣＰＵ１０は、サーバ１００全体を制御する。ＣＰＵ１０は、メモリ４に格納されているプログラム４ａを読み出すことにより、サーバ監視部１０Ａ、処理能力応答部１０Ｂ、負荷状態検出部１０Ｃ、順序調停部１０Ｄ、マネージャ特定部１０Ｅ、及び状態表示部１０Ｆとして機能する。

　サーバ監視部１０Ａは、サーバ１００に接続する複数のサーバの状態の監視を行うために、サーバが備えるサーバ監視機構５に対し、サーバの状態を定期的に問い合わせる。また、サーバ監視部１０Ａは、処理能力応答部１０Ｂ、負荷状態検出部１０Ｃ、順序調停部１０Ｄ、及びマネージャ特定部１０Ｅを起動する。処理能力応答部１０Ｂ、負荷状態検出部１０Ｃ、順序調停部１０Ｄ、及びマネージャ特定部１０Ｅは普段待機状態であり、外部要求に応じ処理を実施する。また、サーバ監視部１０Ａは、サーバ１００に接続する複数のサーバに対し、監視対象サーバテーブル２０Ｇ、マネージャ特定テーブル２０Ｈ、及び負荷閾値テーブル２０Ｉを配付する。

　負荷状態検出部１０Ｃは、サーバ１００の負荷状態を継続的に検出する。負荷状態検出部１０Ｃは、処理能力応答部１０Ｂから負荷状態の取得要求を受信すると、サーバ１００における現在の負荷を測定する。負荷状態検出部１０Ｃは、例えば、ＣＰＵ１０の使用率及びメモリ４の使用容量を測定する。そして、負荷状態検出部１０Ｃは、設定した負荷状態を処理能力応答部１０Ｂへ返信する。

　処理能力応答部１０Ｂは、負荷状態検出部１０Ｃから受け取ったサーバ１００の負荷状態と、ディスク装置２０の負荷閾値テーブル２０Ｉに含まれるサーバ１００の制御の基準となる負荷の閾値とを比較する。サーバ１００の負荷状態と、サーバ１００の制御の基準となる負荷の閾値との比較結果に基づいて、処理能力応答部１０Ｂは、サーバ１００に閾値よりも大きい負荷がかかっているか否かについて判断する。処理能力応答部１０Ｂは、サーバ１００に閾値よりも大きい負荷がかかっていると判断すると、順序調停部１０Ｄに対してサーバ１００の負荷が高いことを通知する。

　順序調停部１０Ｄは、処理能力応答部１０Ｂに対し、サーバ１００に閾値よりも大きい負荷がかかっているか否かについて問い合わせる。また、順序調停部１０Ｄは、サーバ１００に接続されているサーバ監視部のうち、どの監視対象サーバにおけるサーバ監視部がサーバ監視プログラムの実行を開始するか調停する。具体的には、順序調停部１０Ｄは、監視対象サーバの一覧を記載した監視対象サーバテーブル２０Ｇを参照して、自らのサーバ監視部の監視作業を代わってくれる監視対象サーバがいないか、監視対象サーバテーブル２０Ｇに記載されている各監視対象サーバで動作する順序調停部に対して問合せる。順序調停部１０Ｄは、監視対象サーバの順序調停部が応答した負荷状態を元に、負荷が小さい監視対象サーバに対し、サーバ監視部を起動するように依頼する。

　マネージャ特定部１０Ｅは、状態表示部１０Ｆに対し、監視対象サーバのサーバ監視部の中で現在動作しているサーバ監視部を特定する。現在動作している監視対象サーバのサーバ監視部を特定する際、マネージャ特定部１０Ｅは、サーバ監視部が動作している監視対象サーバの一覧を記載したマネージャ特定テーブル２０Ｈをマネージャ特定テーブル２２０Ｈに記載し、例えば「ホスト名」及び「ＩＮＴＥＲＮＥＴ　ＰＲＯＴＯＣＯＬ（ＩＰ）アドレス」などサーバを特定する情報を用いて、サーバ監視部１０Ａが動作している監視対象サーバを特定する。

　状態表示部１０Ｆは、ネットワーク５０を介してマネージャ特定部１０Ｅと接続されている。状態表示部１０Ｆは、サーバ監視部１０Ａから取得した監視対象サーバのサーバ監視部を特定する。また、状態表示部１０Ｆは、監視対象サーバにおけるサーバ監視部が、次の監視対象サーバにおけるサーバ監視部に接続するときに、次の監視対象サーバのマネージャ特定部に対して接続要求を行う。

　図２は、本実施例に係るシステム構成図を示す図である。なお、図２に示す破線によって囲まれているユニットは、待機状態となっているユニットを示す。

　図２に示すように、本実施例に係るシステムは、サーバ２００、サーバ３００、サーバ４００、監視用端末５００、クライアント６００及びクライアント７００によって構成されている。サーバ２００、サーバ３００、サーバ４００、監視用端末５００、クライアント６００及びクライアント７００は、ネットワーク５２を介して互いに接続されている。なお、サーバ２００、サーバ３００、及びサーバ４００は同一の構成要件を備える。なお、図２に示すサーバ２００、サーバ３００、及びサーバ４００において、図１に係るサーバ１００で説明した構成と同様の構成には同一の符号を付し、説明を省略する。

　サーバ２００は、入出力装置２０３、サーバ管理機構２０５、ＣＰＵ２１０、サーバ監視部２１０Ａ、処理能力応答部２１０Ｂ、負荷状態検出部２１０Ｃ、順序調停部２１０Ｄ、マネージャ特定部２１０Ｅ、及びディスク装置２２０を備える。ディスク装置２２０は、例えば監視対象サーバテーブル２２０Ｇ、マネージャ特定テーブル２２０Ｈ、負荷閾値テーブル２２０Ｉを格納する。

　サーバ３００は、入出力装置３０３、サーバ管理機構３０５、ＣＰＵ３１０、サーバ監視部３１０Ａ、処理能力応答部３１０Ｂ、負荷状態検出部３１０Ｃ、順序調停部３１０Ｄ、マネージャ特定部３１０Ｅ、及びディスク装置３２０を備える。ディスク装置３２０は、例えば監視対象サーバテーブル３２０Ｇ、マネージャ特定テーブル３２０Ｈ、負荷閾値テーブル３２０Ｉを格納する。

　サーバ４００は、入出力装置４０３、サーバ管理機構４０５、ＣＰＵ４１０、サーバ監視部４１０Ａ、処理能力応答部４１０Ｂ、負荷状態検出部４１０Ｃ、順序調停部４１０Ｄ、マネージャ特定部４１０Ｅ、及びディスク装置４２０を備える。ディスク装置４２０は、例えば監視対象サーバテーブル４２０Ｇ、マネージャ特定テーブル４２０Ｈ、負荷閾値テーブル４２０Ｉを格納する。

　監視用端末５００は、ネットワーク５１を介して、システムを構成するサーバ２００に係るマネージャ特定部２１０Ｅ、サーバ３００に係るマネージャ特定部３１０Ｅ、又はサーバ４００に係るマネージャ特定部４１０Ｅから、現在のサーバ２００、サーバ３００、及びサーバ４００の情報を取得する。

　システムの管理者は、監視用端末５００の状態表示部５００Ｆを使用して、サーバ２００、サーバ３００、及びサーバ４００の状態を確認する。システムの管理者によるサーバ２００、サーバ３００、及びサーバ４００を常時監視したいという要求から、状態表示部５００Ｆは、通常ネットワーク５１上の一般的なＰｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ（ＰＣ）端末によって常時動作し、「マネージャ」であるサーバ２００に係るサーバ監視部２１０Ａに対し、定期的にサーバ２００、サーバ３００、及びサーバ４００の状態を問合せる。なお、起動されたサーバ監視部２１０Ａを備えるサーバ２００は、以後「マネージャ」と呼ぶこととする。

　クライアント６００及びクライアント７００は、サーバ２００、サーバ３００、及びサーバ４００に対し、例えばＨＴＴＰリクエストを送信する端末である。サーバ２００、サーバ３００、及びサーバ４００は、クライアント６００及びクライアント７００に対して、例えばＨＴＴＰサービスを提供する。

　例えば、サーバ２００は、クライアント６００からＨＴＴＰリクエストを受信する。サーバ２００は、ＨＴＴＰリクエストを対するレスポンスをクライアント６００に応答する。なお、サーバ２００、サーバ３００、及びサーバ４００における負荷は、クライアント６００及びクライアント７００から受信するＨＴＴＰリクエストの量に依存する。

　システムを構成するサーバ２００、サーバ３００、及びサーバ４００のうち、特定の一台であるサーバ２００のサーバ監視部２１０Ａが起動される。起動されたサーバ監視部２１０Ａを備えるサーバ２００は、以後「マネージャ」と呼ぶこととする。「マネージャ」であるサーバ２００は、ネットワーク５１を介して、システムを構成するサーバ２００に係るサーバ管理機構２０５、サーバ３００に係るサーバ管理機構３０５、及びサーバ４００に係るサーバ管理機構４０５から、現在のサーバ２００、サーバ３００、及びサーバ４００の情報を取得する。「マネージャ」以外のサーバ３００に係るサーバ監視部３１０Ａ、処理能力応答部３１０Ｂ、負荷状態検出部３１０Ｃ，順序調停部３１０Ｄ、及びマネージャ特定部３１０Ｅ、および、サーバ４００に係るサーバ監視部４１０Ａ、処理能力応答部４１０Ｂ、負荷状態検出部４１０Ｃ，順序調停部４１０Ｄ、及びマネージャ特定部４１０Ｅは、外部からの要求、即ち「マネージャ」であるサーバ２００のサーバ監視部２１０Ａの要求により、サーバ３００に係るサーバ監視部３１０Ａ、及びサーバ４００に係るサーバ監視部４１０Ａによる監視が開始するまでは、待機状態となる。そのため、サーバ３００、及びサーバ４００の資源を抑えることができる。

　なお、待機状態であるサーバ３００に係るサーバ監視部３１０Ａ、処理能力応答部３１０Ｂ、負荷状態検出部３１０Ｃ，順序調停部３１０Ｄ、及びマネージャ特定部３１０Ｅ、および、サーバ４００に係るサーバ監視部４１０Ａ、処理能力応答部４１０Ｂ、負荷状態検出部４１０Ｃ，順序調停部４１０Ｄ、及びマネージャ特定部４１０Ｅは、例えば６０秒間隔で自主的に起動し、例えばサーバ３００、及びサーバ４００の生存状態、及び負荷状態を検出し、「マネージャ」であるサーバ２００のサーバ監視部２１０Ａに、サーバ３００、及びサーバ４００の生存状態及び負荷状態を通知する。

　また、「マネージャ」であるサーバ２００のサーバ監視部２１０Ａは、サーバ３００及びサーバ４００に対し、サーバ２００が有する監視対象サーバテーブル２２０Ｇ及びマネージャ特定テーブル２２０Ｈを配付する。サーバ３００及びサーバ４００に対して配付された監視対象サーバテーブル２２０Ｇ及びマネージャ特定テーブル２２０Ｈは、サーバ３００が備えるディスク装置３２０、及びサーバ４００が備えるディスク装置４２０に保存される。

　また、待機状態となっているサーバ３００の順序調停部３１０Ｄ、及びサーバ４００の順序調停部４１０Ｄは、例えば６０秒間隔で自主的に起動し、「マネージャ」であるサーバ２００の順序調停部２１０Ｄに対し、サーバ２００が有する監視対象サーバテーブル２２０Ｇ及びマネージャ特定テーブル２２０Ｈが保持する「マネージャ」情報の問い合わせを行う。サーバ３００の順序調停部３１０Ｄ、及び監視対象サーバ４００の順序調停部４１０Ｄによる監視対象サーバテーブル２２０Ｇ及びマネージャ特定テーブル２２０Ｈの問い合わせにより、サーバ２００の順序調停部２１０Ｄ、サーバ３００の順序調停部３１０Ｄ、及びサーバ４００の順序調停部４１０Ｄが有する監視対象サーバテーブル４２０Ｇ及びマネージャ特定テーブル４２０Ｈの同期処理を行い、監視対象サーバテーブル及びマネージャ特定テーブルの内容がサーバ２００、サーバ３００及びサーバ４００間で同一にすることができる。

　図３は、監視対象サーバテーブル２２０Ｇのデータ構造例を示す図である。サーバ２００に係るディスク装置２２０は、監視対象サーバテーブル２２０Ｇを格納している。監視対象サーバテーブル２２０Ｇは、サーバ２００（ＩＰアドレスが“１９２．１６８．０．１”）に対応する監視対象サーバテーブル２２０Ｇである。

　監視対象サーバテーブル２２０Ｇは、現在「マネージャ」であるサーバ２００に対して監視対象となっているサーバ２００、サーバ３００、及びサーバ４００の情報が関連付けられてテーブル化されて格納されている。監視対象サーバテーブル２２０Ｇは、ホスト番号情報を示すフィールド２２１、ＩＰアドレス情報を示すフィールド２２２、及びポート番号情報を示すフィールド２２３が設けられている。各フィールドの横方向に並べられた情報同士が互いに関連付けられている。

　フィールド２２１は、サーバ２００に対して監視対象となっているサーバ２００、サーバ３００、及びサーバ４００をそれぞれ識別するホスト番号情報を示す値が設定される。

　フィールド２２２は、サーバ２００に対して監視対象となっているサーバ２００、サーバ３００、及びサーバ４００のＩＰアドレス情報が設定される。フィールド２２２に設定されるＩＰアドレス情報は、サーバ２００、サーバ３００、及びサーバ４００に対してＴＲＡＮＳＭＩＳＳＩＯＮ　ＣＯＮＴＲＯＬ　ＰＲＯＴＯＣＯＬ（ＴＣＰ）／ＩＰで通信する場合に、送信元及び送信先を識別するために設定される。

　フィールド２２３は、サーバ２００に対して監視対象となっているサーバ２００、サーバ３００、及びサーバ４００のポート番号情報が設定される。フィールド２２３に設定されるポート番号情報は、サーバ２００、サーバ３００、及びサーバ４００に対してＴＣＰ／ＩＰのトランスポート層で用いられ、同一の監視対象サーバを識別するために設定される。

　図４は、マネージャ特定テーブル２２０Ｈのデータ構造例を示す図である。サーバ２００に係るディスク装置２２０は、マネージャ特定テーブル２２０Ｈを格納している。マネージャ特定テーブル２２０Ｈは、サーバ２００（ＩＰアドレスが“１９２．１６８．０．１”に対応する監視対象サーバテーブルである。

　マネージャ特定テーブル２２０Ｈは、現在「マネージャ」であるサーバ２００に対応する情報が関連付けられてテーブル化されて格納されている。マネージャ特定テーブル２２０Ｈは、「マネージャ」であるサーバ２００に対応するホスト番号情報を示すフィールド２２４、「マネージャ」であるサーバ２００に対応するＩＰアドレス情報を示すフィールド２２５、及び「マネージャ」であるサーバ２００に対応するポート番号情報を示すフィールド２２６が設けられている。各フィールドの横方向に並べられた情報同士が互いに関連付けられている。

　フィールド２２４は、現在「マネージャ」であるサーバ２００のホスト番号情報を示す値が設定される。

　フィールド２２５は、現在「マネージャ」であるサーバ２００のＩＰアドレス情報が設定される。

　フィールド２２６は、現在「マネージャ」であるサーバ２００のポート番号情報が設定される。

　図５は、負荷閾値テーブル２２０Ｉのデータ構造例を示す図である。サーバ２００に係るディスク装置２２０は負荷閾値テーブル２２０Ｉを格納している。負荷閾値テーブル２２０Ｉは、サーバ２００（ＩＰアドレスが“１９２．１６８．０．１”に対応する負荷閾値テーブルである。

負荷閾値テーブル２２０Ｉは、サーバ２００が許容する負荷の上限値をテーブル化して格納する。負荷閾値テーブル２２０Ｉは、リソース名を示すフィールド２２７および閾値を示すフィールド２２８が設けられている。各フィールドの横方向に並べられた情報同士が互いに関連付けられている。

　フィールド２２７には、情報処理資源の資源名が設定される。図５に示した例では、“ＣＰＵ”及び“メモリ”の２つが設定されている。

　フィールド２２８には、フィールド２２７で示される情報処理資源の負荷の上限値が設定される。例えば、ＣＰＵに対しては利用率、メモリに対しては記憶容量が設定される。

　負荷閾値テーブル２２０Ｉに格納される情報は、順序調停部２１０Ｄによって適宜登録または更新される。

　図６及び図７は、本実施例に係るサーバ２００、サーバ３００、及びサーバ４００に係る監視対象サーバの切替え処理の手順を示すフローチャートである。本実施例において、サーバ２００におけるサーバ監視部２００Ａが起動されている。そのため、サーバ２００を「マネージャ」と呼ぶ。サーバ２００に係るサーバ監視部２１０Ａは、サーバ３００及びサーバ４００の負荷状態を監視する。サーバ３００及びサーバ４００の負荷状態は、例えばＣＰＵの使用率及びメモリの使用容量によって決定される。なお、図６及び図７に示すサーバ２００、サーバ３００、及びサーバ４００において、図１及び図２に係るサーバ２００、サーバ３００、及びサーバ４００で説明した構成と同様の構成には同一の符号を付し、説明を省略する。

　Ｓ１１において、サーバ２００に係る処理能力応答部２１０Ｂは、負荷状態検出部２１０Ｃを用いて、サーバ２００の負荷が高いか否かを判断する。Ｓ１１において、サーバ２００の負荷が高いと判断すると、次にＳ１２の処理を行う。

　Ｓ１２において、処理能力応答部２１０Ｂは、順序調停部２１０Ｄに対し、「マネージャ」変更依頼を行う。「マネージャ」変更依頼とは、サーバ３００、及びサーバ４００に対して、サーバ監視部の起動、及び監視対象サーバの監視の依頼を行う処理のことである。

　Ｓ１３において、サーバ２００に係る順序調停部２１０Ｄは、監視対象サーバの一覧を記載した監視対象サーバテーブル２２０Ｇを参照して、サーバ監視部２１０Ａの監視作業を代わってくれる監視対象サーバがいないか、監視対象サーバテーブル２２０Ｇに記載されているサーバ３００で動作する順序調停部３１０Ｄ、及びサーバ４００で動作する順序調停部４１０Ｄに対して問合せる。即ち、順序調停部２１０Ｄは、次の「マネージャ」候補を募集する処理を行う。具体的には、サーバ２００に係る順序調停部２１０Ｄは、監視対象サーバテーブル２２０Ｇに記載されているサーバ３００で動作する順序調停部３１０Ｄ、及びサーバ４００で動作する順序調停部４１０Ｄに対し、サーバ３００及びサーバ４００の負荷状態を問い合わせる。本実施例では、サーバ２００に係る順序調停部２１０Ｄは、サーバ３００の順序調停部３１０Ｄに対して問い合わせを行い、Ｓ１４からＳ１８までの処理を行う一例を示す。

　Ｓ１４において、サーバ３００に係る順序調停部３１０Ｄは、「マネージャ」であるサーバ２００から、「マネージャ」候補募集依頼を受信する。

　Ｓ１５において、サーバ３００に係る処理能力応答部３１０Ｂは、サーバ３００に係る負荷状態検出部３１０Ｃに対し、例えばＣＰＵの使用率及びメモリの使用容量に基づくサーバ３００の負荷状態を問い合わせる。

　Ｓ１６において、サーバ３００に係る負荷状態検出部３１０Ｃは、サーバ３００に係る処理能力応答部３１０Ｂに対し、サーバ３００の負荷状態を回答する。

　Ｓ１７において、サーバ３００に係る処理能力応答部３１０Ｂは、サーバ３００に係る順序調停部３１０Ｄに対し、サーバ３００の負荷状態を回答する。

　Ｓ１８において、サーバ３００に係る順序調停部３１０Ｄは、「マネージャ」であるサーバ２００の順序調停部２１０Ｄに対し、サーバ３００の負荷状態を回答する。

　Ｓ１９において、「マネージャ」であるサーバ２００に係る順序調停部２１０Ｄは、サーバ２００自らの負荷状態、サーバ３００の順序調停部３１０Ｄから回答されたサーバ３００の負荷状態、及びサーバ４００の順序調停部４１０Ｄから回答されたサーバ４００の負荷状態を比較する。順序調停部２１０Ｄは、各サーバの負荷状態と負荷閾値テーブルに格納された“ＣＰＵ”及び“メモリ”の上限値と比較し、新「マネージャ」候補となるサーバを探す。

　「マネージャ」であるサーバ２００に係る順序調停部２１０Ｄが、新「マネージャ」候補となるサーバを探す第１の方法としては、サーバ３００の負荷が、図５に係る負荷閾値テーブル２２０Ｉに格納された負荷の上限値よりも小さい場合、「マネージャ」であるサーバ２００は、サーバ３００を新「マネージャ」候補として、Ｓ３１の処理を行う方法がある。

　「マネージャ」であるサーバ２００に係る順序調停部２１０Ｄが、新「マネージャ」候補となるサーバを探す第２の方法としては、サーバ３００の負荷が「マネージャ」であるサーバ２００の負荷よりも小さい場合、「マネージャ」であるサーバ２００は、サーバ３００を新「マネージャ」候補として、Ｓ３１の処理を行う方法がある。
　なお、Ｓ１９において、サーバ３００の負荷が、図５に係る負荷閾値テーブル２２０Ｉに格納された負荷の上限値よりも大きい場合、又は、サーバ３００の負荷が「マネージャ」であるサーバ２００の負荷よりも大きいである場合、サーバ２００に係る順序調停部３１０Ｄは、Ｓ２１の処理を行う。

　Ｓ２０において、「マネージャ」であるサーバ２００に係る順序調停部２１０Ｄは、監視対象サーバテーブル２２０Ｇに記載されているサーバ３００で動作する順序調停部３１０Ｄ、及びサーバ４００で動作する順序調停部４１０Ｄに対して、サーバ監視部２１０Ａの監視作業を代わってくれる「マネージャ」候補を探す依頼を取り止める。

　Ｓ２１において、「マネージャ」であるサーバ２００に係る処理能力応答部２１０Ｂは、一定期間、例えば６０秒の間、処理能力応答部２１０Ｂを自主的に停止させる。同様に、Ｓ１１において、処理能力応答部２１０Ｂは、サーバ２００の負荷が高いと判断すると、一定期間、例えば６０秒の間、処理能力応答部２１０Ｂを自主的に停止させる。処理能力応答部２１０Ｂを自主的に停止させることによって、サーバ２００の資源を抑えることができる。

　Ｓ３１において、Ｓ１９において新「マネージャ」候補が見つかった場合、「マネージャ」であるサーバ２００に係る順序調停部２１０Ｄは、負荷が小さいサーバを新「マネージャ」として決定する。本実施例では、サーバ３００を新「マネージャ」とする。

　Ｓ３２において、「マネージャ」であるサーバ２００に係る順序調停部２１０Ｄは、新「マネージャ」であるサーバ３００の順序調停部３１０Ｄに対し、「マネージャ」変更依頼を送信する。

　Ｓ３３からＳ３５は、サーバ３００の順序調停部３１０Ｄに係る処理を示す。新「マネージャ」であるサーバ３００は、現在の「マネージャ」であるサーバ２００に代わって、サーバ２００、サーバ３００、及びサーバ４００の負荷状態を監視する。

　Ｓ３３において、新「マネージャ」であるサーバ３００に係る順序調停部３１０Ｄは、今の「マネージャ」であるサーバ２００の順序調停部２１０Ｄに対し、「マネージャ」変更依頼を受信する。

　Ｓ３４において、新「マネージャ」であるサーバ３００に係る順序調停部３１０Ｄは、ディスク装置３２０に格納されているマネージャ特定テーブル３２０Ｈに係る情報を、前の「マネージャ」であったサーバ２００の情報から、新「マネージャ」であるサーバ３００の情報に更新する。

　Ｓ３５において、新「マネージャ」であるサーバ３００に係る順序調停部３１０Ｄは、サーバ３００に係るサーバ監視部３１０Ａの起動を行う。順序調停部３１０Ｄは、サーバ監視部３１０Ａの起動を確認した後、前の「マネージャ」であるサーバ２００に対し、サーバ監視部３１０Ａが起動したことを通知する。

　Ｓ３６において、サーバ２００に係る順序調停部２１０Ｄは、新「マネージャ」であるサーバ３００に係る順序調停部３１０Ｄから、新「マネージャ」であるサーバ監視部３１０Ａが起動したとの通知を受ける。新「マネージャ」であるサーバ監視部３１０Ａが起動したとの通知を受けたことにより、サーバ２００に係る順序調停部２１０Ｄは、新「マネージャ」であるサーバ３００が起動したことを確認する。

　Ｓ３７において、サーバ２００に係る順序調停部２１０Ｄは、他の監視対象サーバ、例えばサーバ４００に対し、「マネージャ」がサーバ２００からサーバ４００に変更されたことを通知する。本実施例では、サーバ２００に係る順序調停部２１０Ｄは、サーバ４００に係る順序調停部４１０Ｄに対して通知を行い、サーバ４００に係る順序調停部４１０ＤはＳ４０の処理を行う。Ｓ４０の処理については後述する。

　Ｓ３８において、サーバ２００に係る順序調停部２１０Ｄは、ディスク装置２２０に格納されているマネージャ特定テーブル２２０Ｈを、前の「マネージャ」であるサーバ２００の情報から、新「マネージャ」であるサーバ３００に更新する。

　Ｓ３９において、サーバ２００に係る順序調停部２１０Ｈは、サーバ監視部２１０Ａを停止する。

　Ｓ４０からＳ４１は、サーバ４００の順序調停部４１０Ｄに係る処理を示す。

　Ｓ４０において、サーバ４００に係る順序調停部４１０Ｄは、先のＳ３７においてサーバ２００に係る順序調停部２１０Ｄからサーバ４００に係る順序調停部４１０Ｄから「マネージャ」がサーバ２００からサーバ４００に変更された通知を受信する。

　Ｓ４１において、サーバ４００に係る順序調停部４１０Ｄは、ディスク装置４２０に格納されているマネージャ特定テーブル４２０Ｈを、前の「マネージャ」であるサーバ２００の情報から、新「マネージャ」であるサーバ３００に更新する。

　図８及び図９は、本実施例に係る監視用端末５００、及びサーバ３００に係る監視対象サーバの切替え処理の手順を示すフローチャートである。なお、図８及び図９に係る監視用端末５００、及びサーバ３００において、図１及び図２に係る監視用端末５００、及びサーバ３００で説明した構成と同様の構成には同一の符号を付し、説明を省略する。

　Ｓ５１において、監視用端末５００に係る状態表示部５００Ｆは、監視用端末５００に接続しているサーバ３００に対して接続要求を実施する。

　Ｓ５２において、サーバ３００に係るマネージャ特定部３１０Ｅは、監視用端末５００に係る状態表示部５００Ｆからの接続要求により、待機状態を解除して動作を開始する。

　Ｓ５３において、サーバ３００に係るマネージャ特定部３１０Ｅは、ディスク装置３２０に格納されているマネージャ特定テーブル３２０Ｈを参照する。

　Ｓ５４において、サーバ３００に係るマネージャ特定部３１０Ｅは、マネージャ特定テーブル３２０Ｈの参照結果から、「マネージャ」が自身のサーバ、即ちサーバ３００であるか否か判定する。「マネージャ」がサーバ３００である場合、サーバ３００に係るマネージャ特定部３１０ＥはＳ５５の処理を行う。「マネージャ」がサーバ３００で無い場合、サーバ３００に係るマネージャ特定部３１０ＥはＳ５６の処理を行う。

　Ｓ５５において、サーバ３００に係るマネージャ特定部３１０Ｅは、監視用端末５００に係る状態表示部５００Ｆからの接続要求を受け入れ、Ｓ５７の処理を行う。

　Ｓ５６において、サーバ３００に係るマネージャ特定部３１０Ｅは、ディスク装置３２０に格納されているマネージャ特定テーブル３２０Ｈを参照して、正しい「マネージャ」である監視対象サーバを確認し、Ｓ５７の処理を行う。

　Ｓ５７において、サーバ３００に係るマネージャ特定部３１０Ｅは、Ｓ５５又はＳ５６の処理に基づいて、監視用端末５００に係る状態表示部５００Ｆに対して現在の「マネージャ」を通知する。

　Ｓ６１において、監視用端末５００に係る状態表示部５００Ｆは、Ｓ５７におけるサーバ３００に係るマネージャ特定部３１０Ｅの通知結果に基づいて、サーバ３００に対する接続要求が受け入れられたか否か判定する。サーバ３００に対する接続要求が受け入れられた場合は、状態表示部５００ＦはＳ６２の処理を行う。サーバ３００に対する接続要求が受け入れられなかった場合は、状態表示部５００ＦはＳ６３の処理を行う。

　Ｓ６２において、監視用端末５００に係る状態表示部５００Ｆは、サーバ３００が「マネージャ」であると確認したので、接続中であるサーバ３００にそのまま接続する。

　Ｓ６３において、監視用端末５００に係る状態表示部５００Ｆは、サーバ３００に係るマネージャ特定部３１０Ｅによって通知された現在の「マネージャ」である監視対象サーバに対して接続要求を行う。

　図１０及び図１１は、本実施例に係るサーバ３００、及びサーバ４００に係り、「マネージャ」であるサーバ２００の停止を最初に検出した監視対象サーバの処理の手順を示す図である。図１０及び図１１において、サーバ２００におけるサーバ監視部２００Ａが起動されている。そのため、サーバ２００を「マネージャ」とよぶ。サーバ２００に係るサーバ監視部２１０Ａは、サーバ３００及びサーバ４００の負荷状態を監視する。なお、図１０及び図１１に示すサーバ２００、サーバ３００、及びサーバ４００において、図１及び図２に係るサーバ２００、サーバ３００、及びサーバ４００で説明した構成と同様の構成には同一の符号を付し、説明を省略する。

　Ｓ７１において、待機状態となっているサーバ３００に係る順序調停部３１０Ｄは、例えば６０秒間隔で自主的に起動し、「マネージャ」であるサーバ２００の順序調停部２１０Ｄに対し、定期的に「マネージャ」であるサーバ２００が生存していることを確認する。サーバ２００の生存は、サーバ２００から定期的に出力されるべきハートビート（稼動していることを通知する信号）をサーバ３００によって検出することにより、サーバ２００の生存を認識できる。

　Ｓ７２において、サーバ３００に係る順序調停部３１０Ｄは、「マネージャ」であるサーバ２００が停止していることを確認する。サーバ３００は、サーバ２００から定期的に出力されるべきハートビートが所定期間途絶えたことを検出することにより、サーバ２００の停止を認識できる。

　Ｓ７３において、サーバ３００に係る順序調停部３１０Ｄは、監視対象サーバの一覧を記載した監視対象サーバテーブル３２０Ｇを参照して、サーバ監視部２１０Ａの監視作業を代わってくれる監視対象サーバがいないか、監視対象サーバテーブル３２０Ｇに記載されているサーバ３００で動作する順序調停部３１０Ｄ、及びサーバ４００で動作する順序調停部４１０Ｄに対して問合せる。即ち、順序調停部３１０Ｄは、次の「マネージャ」候補を募集する処理を行う。具体的には、サーバ３００に係る順序調停部３１０Ｄは、監視対象サーバテーブル３２０Ｇに記載されているサーバ３００で動作する順序調停部３１０Ｄ、及びサーバ４００で動作する順序調停部４１０Ｄに対し、サーバ３００及びサーバ４００の負荷状態を問い合わせる。本実施例では、サーバ３００に係る順序調停部３１０Ｄは、サーバ４００の順序調停部４１０Ｄに対して問い合わせを行い、Ｓ７４からＳ７８までの処理を行う一例を示す。

　Ｓ７４において、サーバ４００に係る順序調停部４１０Ｄは、サーバ３００から、「マネージャ」候補募集依頼を受信する。

　Ｓ７５において、サーバ４００に係る処理能力応答部４１０Ｂは、サーバ４００に係る負荷状態検出部４１０Ｃに対し、例えばＣＰＵの使用率及びメモリの使用容量に基づくサーバ４００の負荷状態を問い合わせる。

　Ｓ７６において、サーバ４００に係る負荷状態検出部４１０Ｃは、サーバ４００に係る処理能力応答部４１０Ｂに対し、サーバ４００の負荷状態を回答する。

　Ｓ７７において、サーバ４００に係る処理能力応答部４１０Ｂは、サーバ４００に係る順序調停部４１０Ｄに対し、サーバ４００の負荷状態を回答する。

　Ｓ７８において、サーバ４００に係る順序調停部４１０Ｄは、サーバ４００の順序調停部３１０Ｄに対し、サーバ４００の負荷状態を回答する。

　Ｓ８１において、サーバ３００に係る順序調停部３１０Ｄは、自身であるサーバ３００の負荷、及びサーバ４００に係る負荷と負荷閾値テーブル３２０Ｉに格納された負荷の上限値とを比較して、負荷が小さいサーバを、新「マネージャ」として決定する。

　Ｓ８２において、サーバ３００に係る順序調停部３１０Ｄは、サーバ３００が自ら新「マネージャ」となるか否か判断する。サーバ３００の負荷が負荷閾値テーブル３２０Ｉの上限値より小さい値であり、サーバ３００が自ら新「マネージャ」となる場合、サーバ３００に係る順序調停部３１０ＤはＳ８３からＳ８４までの処理を行う。サーバ３００の負荷が負荷閾値テーブル３２０Ｉの上限値よりも大きい値であり、サーバ３００が自ら新「マネージャ」とならない場合、サーバ３００に係る順序調停部３１０ＤはＳ８５からＳ８７までの処理を行う。

　Ｓ８３において、サーバ３００に係る順序調停部３１０Ｄは、マネージャ特定テーブル３２０Ｈを、前の「マネージャ」であったサーバ２００の情報から、新「マネージャ」となるサーバ３００に更新する。

　Ｓ８４において、新「マネージャ」となるサーバ３００に係る順序調停部３１０Ｄは、サーバ３００に係るサーバ監視部３１０Ａの起動を行う。

　Ｓ８５において、サーバ３００に係る順序調停部３１０Ｄは、サーバ４００の順序調停部４１０Ｄに対し、「マネージャ」変更依頼を送信する。変更依頼を受けた新「マネージャ」となるサーバ４００に係る順序調停部４１０Ｄは、サーバ４００に係るサーバ監視部４１０Ａの起動を行う。サーバ４００に係る順序調停部４１０Ｄは、サーバ監視部４１０Ａの起動を確認した後、サーバ３００に係る順序調停部３１０Ｄに対し、サーバ４００に係るサーバ監視部４１０Ａが起動したこと、即ち新「マネージャ」が起動したことを通知する。

　Ｓ８６において、サーバ３００に係る順序調停部３１０Ｄは、不図示の監視対象サーバに対し、「マネージャ」がサーバ２００からサーバ４００に変更されたことを通知する。

　Ｓ８７において、サーバ３００に係る順序調停部３１０Ｄは、マネージャ特定テーブル３２０Ｈを、前の「マネージャ」であるサーバ２００の情報から、新「マネージャ」であるサーバ４００に更新する。

　なお、複数の順序調停部、例えばサーバ３００に係る順序調停部３１０Ｄ、及びサーバ４００に係る順序調停部４１０Ｄが、同時に「マネージャ」であるサーバ２００の停止を検出した場合は、例えば、図３に示す監視対象サーバテーブル２２０Ｇの上に記載されている監視対象サーバに係る順序調停部が、Ｓ７３における次の「マネージャ」候補を募集する処理を行う。

　このような監視対象サーバから構成されるサーバシステム及びサーバの制御プログラムによれば、複数のサーバのうち負荷の小さいサーバによって複数のサーバを監視させるため、サーバ監視の監視レスポンスの低下を抑制することができる。また、監視サーバを自律的に移動させることができるので、サーバの資源を有効に利用できる。また、サーバ監視プログラムが動作している監視サーバが停止した場合も、監視サーバは別のサーバに自律的に移動するため、サーバ監視機能を維持できるサーバの制御プログラムを提供できる。

　本発明に係るサーバシステムの制御方法及びサーバの制御プログラムによれば、複数のサーバのうち負荷の小さいサーバによって複数のサーバを監視させるため、サーバ監視の監視レスポンスの低下を抑制することができる。また、監視用のサーバを自律的に移動させることができるので、サーバの資源を有効に利用できる。

　３　入出力装置
　４　メモリ
　５　サーバ管理機構
　１０　Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ（ＣＰＵ）
　１０Ａ　サーバ監視部
　１０Ｂ　処理能力応答部
　１０Ｃ　負荷状態検出部
　１０Ｄ　順序調停部
　１０Ｅ　マネージャ特定部
　１０Ｆ　状態表示部
　２０　ディスク装置
　２０Ｇ　監視対象サーバテーブル
　２０Ｈ　マネージャ特定テーブル
　２０Ｉ　負荷閾値テーブル
　３０　ＬＡＮ
　４０　内部バス
　５０　ネットワーク
　５１　ネットワーク
　５２　ネットワーク
　１００　サーバ
　２００　サーバ
　２０５　サーバ管理機構
　２１０　ＣＰＵ
　２１０Ａ　サーバ監視部
　２１０Ｂ　処理能力応答部
　２１０Ｃ　負荷状態検出部
　２１０Ｄ　順序調停部
　２１０Ｅ　マネージャ特定部
　２２０　ディスク装置
　２２０Ｇ　監視対象サーバテーブル
　２２０Ｈ　マネージャ特定テーブル
　２２０Ｉ　負荷閾値テーブル
　２２１　フィールド（ホスト番号）
　２２２　フィールド（ＩＰアドレス）
　２２３　フィールド（ポート番号）
　２２４　フィールド（サーバ番号）
　２２５　フィールド（ＩＰアドレス）
　２２６　フィールド（ポート番号）
　２２７　フィールド（情報処理資源の資源名）
　２２８　フィールド（情報処理資源の負荷の上限値）
　３００　サーバ
　３０５　サーバ管理機構
　３１０　ＣＰＵ
　３１０Ａ　サーバ監視部
　３１０Ｂ　処理能力応答部
　３１０Ｃ　負荷状態検出部
　３１０Ｄ　順序調停部
　３１０Ｅ　マネージャ特定部
　３２０　ディスク装置
　３２０Ｇ　監視対象サーバテーブル
　３２０Ｈ　マネージャ特定テーブル
　４００　サーバ
　４０５　サーバ管理機構
　４１０　ＣＰＵ
　４１０Ａ　サーバ監視部
　４１０Ｂ　処理能力応答部
　４１０Ｃ　負荷状態検出部
　４１０Ｄ　順序調停部
　４１０Ｅ　マネージャ特定部
　４２０　ディスク装置
　４２０Ｇ　監視対象サーバテーブル
　４２０Ｈ　マネージャ特定テーブル
　５００　監視用端末
　５１０Ｆ　状態表示部
　６００　クライアント
　７００　クライアント

Claims

　ネットワークで接続された複数のサーバを有するサーバシステムの制御方法であって、
　前記複数のサーバの１つである第１サーバは、前記第１サーバと他のサーバの運用状況を監視し、
　前記第１サーバは、前記第１サーバの第１負荷を検出し、
　前記第１サーバは、前記第１負荷の検出結果と所定の閾値とを比較し、
　前記第１負荷が前記閾値よりも大きいときに、前記第１サーバは、他のサーバである第２サーバに対して前記第２サーバの第２負荷の検出の依頼を送信し、
　前記第２サーバは、前記第１サーバからの第２負荷の検出の依頼を受信して、前記第２サーバの第２負荷を検出し、
　前記第２サーバは、前記第２負荷の検出結果を前記第１サーバに対して送信し、
　前記第１サーバは、前記第２サーバから送信された前記第２負荷の検出結果を受信し、
　前記第１サーバは、前記第１負荷の検出結果及び前記第２負荷の検出結果に基づいて、前記第２サーバに対して前記複数のサーバの運用状況の監視を依頼し、
　前記第２サーバは、前記第１サーバからの前記複数のサーバの運用状況の監視の依頼を受信して、運用状況を監視する
ことを特徴とするサーバシステムの制御方法。
　前記第１サーバは、前記第２サーバの検出結果が所定の負荷よりも小さい場合に、前記第２サーバに対して前記複数のサーバの運用状況の監視を依頼することを特徴とする請求項１記載のサーバシステムの制御方法。
　前記第１サーバは、前記第２負荷の検出結果と前記第１負荷の検出結果とを比較し、前記第２負荷の検出結果が、前記第１負荷の検出結果よりも小さい場合に、前記第２サーバに対して前記複数のサーバの運用状況の監視を依頼することを特徴とする請求項１記載のサーバシステムの制御方法。
　前記第１サーバは、前記第２サーバに対して前記運用状況の監視を依頼した後に、前記運用状況の監視を止めることを特徴とする請求項１に記載のサーバシステムの制御方法。
　前記第１サーバは、前記第２負荷の検出結果が、前記閾値よりも大きいときときに、前記第１サーバは、前記複数のサーバの１つである第３サーバに対して前記第３サーバの第３負荷の検出の依頼を送信し、
　前記第３サーバは、前記第１サーバからの第３負荷の検出の依頼を受信して、前記第２サーバの第３負荷を検出し、
　前記第３サーバは、前記第３負荷の検出結果を前記第１サーバに対して送信し、
　前記第１サーバは、前記第３サーバから送信された前記第３負荷の検出結果を受信し、
　前記第１サーバは、前記第１負荷の検出結果及び前記第３負荷の検出結果に基づいて、前記第３サーバに対して前記複数のサーバの運用状況の監視を依頼し、
　前記第３サーバは、前記第１サーバからの前記複数のサーバの運用状況の監視の依頼を受信して、運用状況を監視することを特徴とする請求項１に記載のサーバシステムの制御方法。
　前記第１サーバは、前記第１負荷の検出結果、前記第２負荷の検出結果、及び前記第３負荷の検出結果を、前記第１サーバの記憶部に格納することを特徴とする請求項１に記載のサーバシステムの制御方法。
　ネットワークで接続された複数のサーバを有するサーバシステムに使用されるサーバの制御プログラムであって、
　前記複数のサーバを制御する制御部を、
　自サーバと他のサーバの運用状況を監視する前記複数のサーバの１つである自サーバの第１監視手段、
　前記自サーバの第１負荷を検出する前記自サーバの第１検出手段、
　前記第１負荷の検出結果と所定の閾値とを比較する前記自サーバの第１比較手段、
　前記第１負荷が前記閾値より大きいときに、前記他のサーバに対して第２負荷の検出を依頼する前記自サーバの第１依頼手段、
　前記自サーバからの前記第２負荷の検出の依頼を受信する前記他のサーバの第１受信手段、
　前記第２負荷を検出する前記他のサーバの第２検出手段、
　前記第２負荷の前記検出結果を前記自サーバに対して送信する前記他のサーバの送信手段、
　前記他のサーバから送信された前記第２負荷の前記検出結果を受信する前記自サーバの第２受信手段、
　前記第１負荷の前記検出結果及び前記第２負荷の前記検出結果に基づいて、前記他のサーバに対して前記複数のサーバの前記運用状況の監視を依頼する前記自サーバの第２依頼手段、
　前記自サーバからの前記運用状況の監視の依頼を受信する前記他のサーバの第３受信手段、
　前記運用状況を監視する前記他のサーバの第２監視手段、
として機能させることを特徴とするサーバの制御プログラム。
　前記制御部を、前記他のサーバの前記検出結果が所定の負荷よりも小さい場合に、前記他のサーバに対して前記複数のサーバの前記運用状況の監視を依頼する前記自サーバの前記第２依頼手段として機能させることを特徴とする請求項７記載のサーバの制御プログラム。
　前記制御部を、前記第２負荷の前記検出結果と前記第１負荷の前記検出結果とを比較する前記自サーバの第２比較手段、前記第２負荷の前記検出結果が、前記第１負荷の前記検出結果よりも小さい場合に、前記自サーバは、前記他のサーバに対して前記運用状況の監視を依頼する前記自サーバの前記第２依頼手段として機能させることを特徴とする請求項７記載のサーバの制御プログラム。
　前記制御部を、更に、前記他のサーバに対して前記運用状況の監視を依頼した後に、前記自サーバは前記運用状況の監視を止める前記自サーバの監視停止手段として機能させることを特徴とする
請求項７に記載のサーバの制御プログラム。
　前記制御部を、更に、前記第１負荷の前記検出結果、及び前記第２負荷の前記検出結果を前記自サーバの記憶部に格納する前記自サーバの格納手段として機能させることを特徴とする請求項７に記載のサーバの制御プログラム。