JP2000003344A - コンピュータ監視装置および同装置を用いたコンピュータ監視システムおよび監視方法 - Google Patents

コンピュータ監視装置および同装置を用いたコンピュータ監視システムおよび監視方法

Info

Publication number
JP2000003344A
JP2000003344A JP10168793A JP16879398A JP2000003344A JP 2000003344 A JP2000003344 A JP 2000003344A JP 10168793 A JP10168793 A JP 10168793A JP 16879398 A JP16879398 A JP 16879398A JP 2000003344 A JP2000003344 A JP 2000003344A
Authority
JP
Japan
Prior art keywords
computer
computer monitoring
status information
management information
server monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10168793A
Other languages
English (en)
Inventor
Yuji Fujiwara
勇治 藤原
Koji Kato
浩二 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10168793A priority Critical patent/JP2000003344A/ja
Publication of JP2000003344A publication Critical patent/JP2000003344A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Hardware Redundancy (AREA)

Abstract

(57)【要約】 【課題】サーバ監視のためのハードウェアがダウンして
いても、同一ネットワーク上の他のサーバ監視のための
ハードウェアからそのコンピュータの管理情報を取得で
きるようにする。 【解決手段】各サーバ監視カード111,121,13
1は、それぞれ対応するコンピュータ11,12,13
から管理情報Ax,Bx,Cxを取得する。そして、互
いに管理情報の受け渡しを行い、サーバ監視カード11
1は、ネットワークに接続された他のサーバ監視カード
121,131から管理情報Bx、Cxを取得して管理
情報リスト21に保管する。同様に、サーバ監視カード
121は管理情報Cx、Axをサーバ監視カード13
1,111から取得して管理情報リスト22に保管し、
サーバ監視カード131は管理情報Ax、Bxをサーバ
監視カード111,121から取得して管理情報リスト
23に保管する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はサーバコンピュータ
などのコンピュータの動作を監視するコンピュータ監視
システムおよび同システムに適用される監視方法監視方
法に関する。
【0002】
【従来の技術】近年、オフィスの情報化ツールとして、
パーソナルコンピュータ(PC)やPCサーバを用いた
システム構築が盛んに行われている。このようなシステ
ムにおいては、システム維持管理の総経費(TCO;T
otal Cost of Ownership)を下
げるために、ネットワークを介して、各PC、特に業務
毎に分散配置された各PCサーバの状態をリモート監視
するための方法の実現が要求されている。
【0003】そこで、最近では、PCサーバに、その状
態を監視するための専用のハードウェアであるサーバ監
視装置を接続し、そのサーバ監視装置にて自動的にPC
サーバの状態をサーバ管理情報として採取してサーバ監
視装置内に保存する方法が考えられている。この場合、
システム管理者等は、管理端末をサーバ監視装置にネッ
トワーク接続することにより、PCサーバの管理情報を
画面表示して確認することが可能となる。
【0004】しかし、このような監視システムでは、P
Cサーバに内蔵されたサーバ監視装置はそのコンピュー
タだけの管理情報を取得して自分の記憶装置に保存する
ので、システム管理者は、管理情報を調べたいPCサー
バ毎に個々にそこに内蔵されたサーバ監視装置にネット
ワーク接続することが必要とされる。このため、サーバ
監視装置がダウンしてしまうと、そのサーバ監視装置に
対応するPCサーバの情報を見ることができなくなると
いう問題が生じる。
【0005】
【発明が解決しようとする課題】上述したように、従来
では、一つのサーバ監視装置からはそのサーバ監視装置
が設けられたコンピュータの管理情報しか取得すること
ができず、そのサーバ監視装置がダウンしている時に
は、専用の管理端末はそのコンピュータの管理情報を表
示することができないという問題があった。
【0006】また、別のコンピュータの管理情報を取得
したい場合には、そのコンピュータに対応するサーバ監
視装置に接続し直さなければならないという問題があっ
た。本発明はこのような事情に鑑みてなされたものであ
り、サーバ監視のためのハードウェアがダウンしていて
も、同一ネットワーク上の他のサーバ監視のためのハー
ドウェアからそのコンピュータの管理情報を取得した
り、あるいはネットワーク内の一つのサーバ監視のため
のハードウェアに接続するだけで、同一ネットワーク内
の他のコンピュータの管理情報をも取得できるように
し、信頼性が高く、且つ効率よくコンピュータの監視を
行うことが可能なコンピュータ監視システムおよび同シ
ステムに適用される監視方法を提供することを目的とす
る。
【0007】
【課題を解決するための手段】上述の課題を解決するた
め、本発明は、コンピュータの動作状態を監視するコン
ピュータ監視装置において、監視対象のコンピュータに
設けられ、そのコンピュータの各種状態情報を取得する
手段と、前記状態情報をバックアップするために、他の
コンピュータに設けられたコンピュータ監視装置との間
でネットワークを介して前記状態情報を授受する状態情
報通信手段とを具備することを特徴とする。
【0008】このコンピュータ監視装置においては、他
のコンピュータに設けられた他のコンピュータ監視装置
との間で互いのコンピュータの状態情報を授受する機能
が設けられている。これにより、各コンピュータ監視装
置の状態情報を他のコンピュータ監視装置に保存してバ
ックアップすることが可能となり、あるコンピュータ監
視装置がダウンしていても、同一ネットワーク上の他の
コンピュータ監視装置からそのコンピュータの状態情報
を取得することができる。また、専用の管理端末を一つ
のコンピュータ監視装置にネットワーク接続するだけ
で、同一ネットワーク内の他のコンピュータの状態情報
を取得することが可能となる。
【0009】特に、コンピュータ監視装置自体がコンピ
ュータとは独立に相互に状態情報を相手のコンピュータ
監視装置と授受するように構成することが好ましい。こ
れにより、専用の監視ソフトウェアを個々のコンピュー
タに用意することなく、各コンピュータの状態情報を自
動的にバックアップすることができる。
【0010】また、各コンピュータ監視装置に設けられ
た状態情報通信手段は、各コンピュータ監視装置に同一
ネットワーク内の他の全てのコンピュータ監視装置の状
態情報がバックアップされるように、前記他の全てのコ
ンピュータ監視装置との間で状態情報を授受することが
好ましい。
【0011】これにより、たとえN台のコンピュータ監
視装置の中のN−1台がダウンしている場合であって
も、残りの一台のコンピュータ監視装置からN台全ての
状態情報を取得することが可能となる。
【0012】また、各コンピュータ監視装置に設けられ
た状態情報通信手段は、各コンピュータ監視装置の状態
情報が同一ネットワーク内の他の複数のコンピュータ監
視装置に分散してバックアップされるように、前記監視
対象コンピュータの状態情報を複数に分割し、それら複
数の分割状態情報を、バックアップ先となる複数のコン
ピュータ監視装置にそれぞれ送信し、且つバックアップ
対象のコンピュータ監視装置から送信された分割状態情
報を受信して保存することを特徴とする。
【0013】これにより、例えば状態情報を2分割し
て、他の2台のコンピュータ監視装置にそれぞれ分割情
報を分散して保存した場合には、一台当たりのコンピュ
ータ監視装置にて保存する事が必要な状態情報は常に2
台分のみとなり、各コンピュータ監視装置データ記憶サ
イズを低減できるようになる。
【0014】また、各コンピュータ監視装置に設けられ
た状態情報通信手段は、各コンピュータ監視装置の状態
情報が同一ネットワーク内の他の一台のコンピュータ監
視装置によってバックアップされるように、前記監視対
象コンピュータの状態情報をバックアップ先のコンピュ
ータ監視装置に送信し、且つバックアップ対象のコンピ
ュータ監視装置から送信された状態情報を受信して保存
することを特徴とする。
【0015】この場合においても、一台当たりのコンピ
ュータ監視装置にて保存する事が必要な状態情報は常に
2台分のみとなり、各コンピュータ監視装置データ記憶
サイズを低減できるようになる。
【0016】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を説明する。 (第1実施形態)図1には、本発明の第1実施形態に係
るコンピュータ監視システムの構成例が示されている。
この監視システムは、PCサーバなどの監視対象コンピ
ュータ11,12,13それぞれに専用のハードウェア
であるサーバ監視カード111,121,131を設
け、それらサーバ監視カード111,121,131間
で互いにコンピュータの管理情報を交換し合う構成であ
る。
【0017】各サーバ監視カード111,121,13
1は、コンピュータの拡張カードとして実現されてお
り、そこには、コンピュータとは独立して動作できるよ
うに、MPU、記憶装置、制御プログラムが格納された
ブートROM、各種センサなどが搭載されている。セン
サは、対応するコンピュータ内の温度や、電源電圧、フ
ァン回転に関する情報を取得するために用いられる。ま
た、各サーバ監視カード111,121,131の動作
電源としては、それが設けられているコンピュータがパ
ワーオフの時でも動作できるように、対応するコンピュ
ータに設けられたバッテリなどの補助電源が用いられ
る。
【0018】各サーバ監視カード111,121,13
1によって採取される各コンピュータの状態情報(管理
情報)としては、前述の電源電圧、発熱温度、ファンの
回転などに関する情報の他、コンピュータのCPUの状
態、ディスクの状態などが含まれる。これらCPUやデ
ィスクの状態などは、例えばコンピュータの起動時など
に、サーバ監視カード上のブートROMに制御プログラ
ムの一つとして格納されている拡張BIOSを実行する
ことにより採取される。
【0019】これら状態情報は、コンピュータ管理情報
としてそれぞれのサーバ監視カード111,121,1
31内の管理情報リスト21,22,23に保存され
る。すなわち、図1に示すように、サーバ監視カード1
11,121,131は、コンピュータ(A、B、C)
11,12,13の管理情報Ax、Bx、Cxを管理情
報リスト21,22,23に保持する。
【0020】また、各サーバ監視カード111,12
1,131には、他のサーバ監視カードとLANを介し
て通信するための機能が設けられており、コンピュータ
の動作とは独立にサーバ監視カード間の通信が行われ
る。この通信は、互いの管理情報をサーバ監視カード間
で交換し合うために行われる。
【0021】さらに、各サーバ監視カード111,12
1,131には、管理情報の交換相手となるサーバ監視
カードを管理するために、互いをIPアドレスまたはM
ACアドレスのように一意に定まるIDによって区別す
るためのIDリスト31,32,33が設けられてい
る。このIDリストには、図2に示すように、自カード
をも含めて同一ネットワーク内の全てのサーバ監視カー
ドのIDが順番に登録されている。IDの登録順は、管
理情報受け渡しの順番を管理するために用いられる。図
2は、サーバ監視カード111のIDリスト31に対応
するものであり、ID(A),ID(B),ID(C)
はそれぞれサーバ監視カード111,121,131固
有のIPアドレスまたはMACアドレスを示している。
管理情報の受け渡しの順が、サーバ監視カード111,
121,131の場合には、図示のように、ID
(A),ID(B),ID(C)の順番で登録されるこ
とになる。
【0022】なお、サーバ監視カード111,121,
131が管理情報の受け渡しに使用するLANとしては
専用のものを使用することもできるが、通常は、コンピ
ュータ11,12,13がそれらの通信のために使用す
るLANを用いてサーバ監視カード111,121,1
31が管理情報の受け渡しを行うようにすることが好ま
しい。この場合においても、コンピュータの動作とは独
立にサーバ監視カード111,121,131間での管
理情報の受け渡しを行えるようにするために、コンピュ
ータ11,12,13にはサーバ監視カード111,1
21,131以外にネットワーク接続用の専用のLAN
カードを搭載することが好ましい。
【0023】このようにサーバ監視カード111,12
1,131の各々に設けられた主な機能は、対応するコ
ンピュータの管理情報を採取して管理情報リストに保存
する機能と、IDリストに基づいて、他のサーバ監視カ
ードとの間で管理情報の受け渡しを行う機能である。前
述したように、これら機能は、コンピュータ動作とは独
立に実行される。
【0024】図3には、サーバ監視カード111,12
1,131間の管理情報の受け渡しの様子が示されてい
る。図3に示すように、コンピュータ(A)11に設け
られたサーバ監視カード(a)111は、ネットワーク
に接続された他のサーバ監視カード(b、c)121,
131から管理情報Bx、Cxを取得して管理情報リス
ト21に保管する。同様に、コンピュータ(B)12に
対応するサーバ監視カード(b)121は管理情報C
x、Axをサーバ監視カード(c、a)131,111
から取得して管理情報リスト22に保管し、コンピュー
タ(C)13に対応するサーバ監視カード(c)131
は管理情報Ax、Bxをサーバ監視カード(a、b)1
11,121から取得して管理情報リスト23に保管す
る。この管理情報は定期的に更新するか、または変更が
あった場合だけ更新する。
【0025】このように、第1実施形態においては、各
サーバ監視カードに同一ネットワーク内の他の全てのサ
ーバ監視カード内の管理情報がバックアップされる。し
たがって、たとえばn台のサーバ監視カードの中のn−
1台がダウンしている場合であっても、残りの一台のコ
ンピュータ監視装置からn台全ての管理情報を取得する
ことが可能となる。また、管理端末を一つのサーバ監視
カードにネットワーク接続することで、同一ネットワー
ク内の全てのコンピュータの管理情報を参照することが
可能となる。
【0026】次に、一つのサーバ監視カードが保持する
管理情報リストのサイズについて述べる。ネットワーク
にn台のサーバ監視カードが接続されているとすると、
各サーバ監視カードは自分のコンピュータの管理情報と
他の全てのコンピュータの管理情報を保持するため、管
理情報リストのサイズはn台分となる。
【0027】次に、図4に示すようにサーバ監視カード
(d)141を内蔵したコンピュータ(D)14が新た
にネットワークに追加された場合を例示して、IDリス
ト作成処理、管理情報受け渡し処理について具体的に説
明する。
【0028】図5は、新たに追加されたサーバ監視カー
ド(d)141の処理を示すフローチャート、図6は新
たに追加されたサーバ監視カード(d)141からのア
ドレスブロードキャストに対するサーバ監視カード
(a、b、c)111,121,131の応答処理動作
を示すフローチャート、また図7は各サーバ監視カード
それぞれの管理情報送信処理動作を示すフローチャート
である。
【0029】図4に示すようにサーバ監視カード(d)
141を内蔵したコンピュータ(D)14が新たにネッ
トワークに追加された場合は、サーバ監視カード(d)
141は、ネットワーク上にIPアドレスまたはMAC
アドレスをブロードキャストする(図5のステップS1
01)。
【0030】サーバ監視カード(a、b、c)111,
121,131は、ブロードキャストされたIPアドレ
スまたはMACアドレスを受信すると(図6のステップ
S111)、管理情報リスト21、22、23をそれぞ
れ調べてこのサーバ監視カード(d)141の情報がな
いことを確認する。そして、IDリストにdの管理情報
エリアを確保して、そこにブロードキャストされたIP
アドレスまたはMACアドレスを追加する(図6のステ
ップS112)。そして、サーバ監視カード(a、b、
c)111,121,131は、ブロードキャストに対
する応答として、順番に、自身のIPアドレスまたはM
ACアドレスをブロードキャストする。すなわち、サー
バ監視カード(a、b、c)111,121,131
は、まず、自身が先頭のサーバ監視カードであるか否か
をIDリスト内のID登録順によって調べ(図6のステ
ップS113)、先頭のサーバ監視カード(本実施形態
では、サーバ監視カード111が先頭)であれば、順番
を待たずに、即座に自身のIPアドレスまたはMACア
ドレスをブロードキャストする(図6のステップS11
6)。
【0031】一方、先頭以外のサーバ監視カードについ
ては、ネットワーク上にブロードキャストされるIPア
ドレスまたはMACアドレスを受信および監視し(図6
のステップS114)、そのアドレスが自分の一つ前の
サーバ監視カードからのIPアドレスまたはMACアド
レスであることを確認したときに(図6のステップS1
15)、自身のIPアドレスまたはMACアドレスをブ
ロードキャストする(図6のステップS116)。
【0032】新たにネットワークに追加されたサーバ監
視カード(d)141は、自身のIPアドレスまたはM
ACアドレスをブロードキャストした後、他のサーバ監
視カードからの応答待ちとなる(図5のステップS10
2)。所定の応答待ち時間内にIPアドレスまたはMA
Cアドレスを受信すると、それを順番に登録することに
よってIDリストを作成する(図5のステップS10
3,104)。これにより、サーバ監視カード(a、
b、c)111,121,131の順にIPアドレスま
たはMACアドレスが登録されたIDリストが作成され
ることになる。
【0033】そして、タイムアウトになると、サーバ監
視カード(d)141は、自身のIPアドレスまたはM
ACアドレスをIDリストの最後に追加する(図5のス
テップS105)。
【0034】サーバ監視カード(a、b、c、d)11
1,121,131,141は、それぞれ図7の管理情
報送信処理を行う。この管理情報送信処理は定期的に行
われ、前回の管理情報送信処理の終了から一定時間経過
すると(図7のステップS121)、IDリストから順
番に送信先のサーバ監視カードのアドレスが取得され、
そのサーバ監視カード宛に自身の管理情報を送信する
(ステップS123,S124)。ステップS123,
S124の処理は、自分以外の他の全てのサーバ監視カ
ードに対する送信処理が完了するまで繰り返し実行され
る(ステップS125)。
【0035】なお、管理情報送信処理をブロードキャス
トによって実行しても良い。この場合には、受信側で、
IDリストに載っているサーバ監視カードからの管理情
報であることを確認した後、それを管理情報リストに保
存すればよい。
【0036】また、新たにネットワークに追加されたサ
ーバ監視カード(d)141については、図5のステッ
プS105で自身のアドレスをIDリストに追加した
後、すぐに、コンピュータ(D)14から新規に管理情
報Dxを取得し、ネットワーク上に管理情報Dxをブロ
ードキャストするようにしてもよい。この場合、サーバ
監視カード(d)141からブロードキャスト送信され
た管理情報Dxは、図4に示されているように、他の全
てのサーバ監視カード(a,b,c,d)111,12
1,131それぞれの管理情報リスト21、22、23
に追加される。また、サーバ監視カード(a,b,c,
d)111,121,131は、それぞれ自分を内蔵す
るコンピュータの管理情報をサーバ監視カード(d)1
41に送信する。つまり、サーバ監視カード(a)11
1は管理情報Axを、サーバ監視カード(b)121は
管理情報Bxを、サーバ監視カード(c)131は管理
情報Cxをサーバ監視カード(d)141に送信する。
【0037】また、サーバ監視カード(d)141から
管理情報Dxを最初に受信したサーバ監視カードが、サ
ーバ監視カード(a,b,c,d)111,121,1
31全てについての管理情報をサーバ監視カード(d)
141に送信するようにしても良い。
【0038】次に、サーバ監視カードに障害が発生した
場合について述べる。例えば図3においてサーバ監視カ
ード(c)131がダウンした場合には、サーバ監視カ
ード(c)131から定期的に管理情報が来ないこと、
あるいはサーバ監視カード(c)131から定期的に通
知されるハートビート(自身が正常動作していることを
示すメッセージ)が途絶えることにより、同一ネットワ
ーク上の他のサーバ監視カード(a、b)111,12
1はサーバ監視カード(c)131がダウンしたことを
知る。そして、再びサーバ監視カード(c)131がネ
ットワークに復帰した時には、管理情報Cxは同一ネッ
トワーク上のサーバ監視カード(a)111の管理情報
リスト21およびサーバ監視カード(b)121の管理
情報リスト22にバックアップが存在するため、管理情
報リスト21または管理情報リスト22から管理情報C
xを復元することができる。実際の手順は次のようにな
る。
【0039】1.サーバ監視カード(c)131は、ネ
ットワークに復帰すると自分のIPアドレスまたはMA
Cアドレスをブロードキャストする。 2.サーバ監視カード(a)111またはサーバ監視カ
ード(b)121は、この情報を受信すると(図9のス
テップS131)、IDリストを参照して、故障から復
帰したサーバ監視カード(c)131からのアドレスで
あるか否かを確認する(図9のステップS132)。
【0040】3.サーバ監視カード(c)131からの
アドレスであれば、サーバ監視カード(a)111また
はサーバ監視カード(b)121は、管理情報Cxをサ
ーバ監視カード(c)131に送信する(ステップS1
33)。
【0041】4.サーバ監視カード(c)131は、受
信した管理情報Cxを自身のコンピュータ(C)13の
管理情報として管理情報リスト23に登録することによ
り、その管理情報を復元する。
【0042】5.そして、サーバ監視カード(c)13
1は、同時に管理情報Ax、Bxを受け取るか、また
は、定期的な管理情報のやりとりまでは管理情報Axお
よびBxは保持しない。
【0043】上記手順3については、サーバ監視カード
(a、b)111,121両者が送信する必要はなく、
先にサーバ監視カード(c)131の情報を受信した方
だけでもよい。
【0044】(第2実施形態)次に、本発明の第2実施
形態について説明する。ここでは、第1実施形態との相
違点を中心に説明する。
【0045】図10に示すように、LANなどのネット
ワークにはコンピュータ(A)11に内蔵されたサーバ
監視カード(a)111、コンピュータ(B)12に内
蔵されたサーバ監視カード(b)121、およびコンピ
ュータ(C)13に内蔵されたサーバ監視カード(c)
131が接続されている。各サーバ監視カードの基本構
成は第1実施形態と同じであり、異なるのは、それぞれ
のサーバ監視カードが、自装置に対応するコンピュータ
から取得した管理情報を以下のように2分割して管理情
報リストに記載しておき、それを他の2台のサーバ監視
カードに分散してバックアップさせる点である。
【0046】 Ax=A1+A2 Bx=B1+B2 Cx=C1+C2 そして、例えば、図12に示すように、サーバ監視カー
ド(a)111は分割した管理情報A1,A2の中で第
1の分割管理情報A1をそのバックアップ先となるサー
バ監視カード(b)121に、第2の分割管理情報A2
をそのバックアップ先となるサーバ監視カード(c)1
31に保存する。同様にして、図13に示すように、サ
ーバ監視カード(a)111の管理情報リスト21に
は、バックアップ対象となるサーバ監視カード(b)1
21の第2の分割管理情報B2およびサーバ監視カード
(c)131の第1の分割管理情報C1を、サーバ監視
カード(b)121の管理情報リスト22にはバックア
ップ対象となるサーバ監視カード(a)111の第1の
管理情報A1およびサーバ監視カード(c)131の第
2の管理情報C2を、サーバ監視カード(c)131の
管理情報リスト23にはバックアップ対象となるサーバ
監視カード(a)111の第2の管理情報A2およびサ
ーバ監視カード(b)121の第1の管理情報B1を追
加する。このようなバックアップデータの分散方法を以
下に説明する。
【0047】サーバ監視カードは、I=1、2、…、n
(Iは3台以上)台あり、それぞれがローカルに取得す
る管理情報は、Ix =I1 +I2 により分割される。I
1 は第1の分割管理情報であり、I2 は第2の分割管理
情報である。そして、サーバ監視カードIの管理情報リ
ストに記載される情報は次のようになる。
【0048】 I=1の場合、 I1 +I2 +n1 +(n−1)2 I=2の場合、 I1 +I2 +(I−1)1 +n2 I=3以上の場合、I1 +I2 +(I−1)1 +(I−2)2 ……(1) すなわち、I=1つまり先頭のサーバ監視カードについ
ては、自身のコンピュータの管理情報(I1 +I2
と、最終番目(n番目)のサーバ監視カードの第1の分
割管理情報と、n−1番目のサーバ監視カードの第2の
分割管理情報を保存する。
【0049】I=2つまり2番目のサーバ監視カードに
ついては、自身のコンピュータの管理情報(I1 +I
2 )と、I−1つまり先頭のサーバ監視カードの第1の
分割管理情報と、最終番目(n番目)のサーバ監視カー
ドの第2の分割管理情報を保存する。
【0050】I=3以上つまり3番目以降の各サーバ監
視カードについては、自身のコンピュータの管理情報
(I1 +I2 )と、一つ前(I−1)のサーバ監視カー
ドの第1の分割管理情報と、二つ前(I−2)の第2の
分割管理情報を保存する。
【0051】次に管理情報リストのサイズについて述べ
る。ネットワーク上に何台のサーバ監視カードがあると
しても、一つのサーバ監視カードが保存する管理情報リ
ストのサイズは、2台分で済むことになる。
【0052】図11には、サーバ監視カード(a、b、
c)111,121,131それぞれによる管理情報送
信処理の手順が示されている。第1実施形態と同様に、
管理情報送信処理は定期的に行われ、前回の管理情報送
信処理の終了から一定時間経過すると(図11のステッ
プS201)、前述の式(1)と、IDリストに登録さ
れている自装置の順番とに基づいて、どのサーバ監視カ
ードに、第1および第2の分割管理情報のどちらの分割
管理情報を送信するかを決定する(図11のステップS
202)。そして、バックアップ先となる送信対象のサ
ーバ監視カードに該当する分割管理情報を送信する(図
11のステップS203)。送信対象の全てのサーバ監
視カードに対する送信処理が完了したことが確認される
と(ステップS204)、管理情報送信処理が終了す
る。
【0053】次に、サーバ監視のためのハードウェアが
ダウンした場合について述べる。例えば、図13におい
てサーバ監視カード(c)131はがダウンした場合に
は、第1実施形態と同様に、サーバ監視カード(a、
b)111,121はサーバ監視カード(c)131か
らの定期的な管理情報の更新またはハートビートが途絶
えることにより、サーバ監視カード(c)131がダウ
ンしたことを知る。
【0054】そして、図14に示すようにサーバ監視カ
ード(a,b)111,121は管理情報C1およびC
2を保持したまま、2台で管理情報のバックアップシス
テムを構築する。この状態で再びサーバ監視カード
(c)131がネットワークに復帰すると次に示す手順
により、管理情報Cxの復元が行われる。
【0055】1.サーバ監視カード(c)131は、ネ
ットワークに復帰すると自分のIPアドレスまたはMA
Cアドレスをブロードキャストする。 2.サーバ監視カード(a)111およびサーバ監視カ
ード(b)121は、この情報を受信すると(図15の
ステップS141)、IDリストを参照して、故障から
復帰したサーバ監視カード(c)131からのアドレス
であるか否かを確認する(図15のステップS14
2)。
【0056】3.サーバ監視カード(c)131からの
アドレスであれば、サーバ監視カード(a)111およ
びサーバ監視カード(b)121は、IDリストをサー
バ監視カード(c)131に送信する(図15のステッ
プS143)。
【0057】4.サーバ監視カード(c)131はこの
IDリストにより自分がこのネットワーク内で3番目の
サーバ監視カードであることを認識する。 5.図15のステップS143ではサーバ監視カード
(a)111およびサーバ監視カード(b)121から
サーバ監視カード(c)131についての管理情報も送
信され、サーバ監視カード(c)131は、管理情報C
1、C2を取得して管理情報Cxを復元する。
【0058】6.そして、各サーバ監視カードは、再び
式1と自装置の順番とに基づいて、管理情報バックアッ
プのために管理情報の受け渡し、つまりバックアップ先
への管理情報の送信と、バックアップ対象のサーバ監視
カードから送信される管理情報の受信および保存を開始
する。
【0059】次に新規にサーバ監視カードが追加された
場合について述べる。図16に示すように、サーバ監視
カード(d)141を内蔵するコンピュータ(D)14
がネットワークに追加されると、第1実施形態と同様
に、サーバ監視カード(d)141は、自分のIPアド
レスまたはMACアドレスをネットワークにブロードキ
ャストする。
【0060】そして、これを受信したサーバ監視カード
(a、b、c)111,121,131は、IDリスト
の情報と照合して、このサーバ監視カード(d)141
は新規追加であることを認識し、IDリストに追加し、
自装置のIPアドレスまたはMACアドレスをネットワ
ークにブロードキャストする。
【0061】サーバ監視カード(d)141は、自身の
IPアドレスまたはMACアドレスをブロードキャスト
した後、他のサーバ監視カードからの応答待ちとなり、
所定の応答待ち時間内にIPアドレスまたはMACアド
レスを受信すると、それを順番に登録することによって
IDリストを作成する。これにより、サーバ監視カード
(a、b、c)111,121,131の順にIPアド
レスまたはMACアドレスが登録されたIDリストが作
成されることになる。そして、タイムアウトになると、
サーバ監視カード(d)141は、自身のIPアドレス
またはMACアドレスをIDリストの最後に追加する。
これにより、自分が4番目のサーバ監視カードであるこ
とを知る。
【0062】そして、式(1)に従い、4台のサーバ監
視カード(a、b、c、d)111,121,131,
141がそれぞれ分割管理情報の受け渡しを開始する。
この場合、サーバ監視カード(d)141の追加前に比
べて、分割管理情報B2、C1、C2、D1およびD2
についての管理情報の保存先が変更されることになる。
例えば、n台のサーバ監視カードが接続されたネットワ
ークに、n+1台目を追加した場合には、(n−1)
2 、n1 、n2 、(n+1)1 および(n+1)2 を含
む管理情報が変更されることになる。
【0063】(第3実施形態)次に、本発明の第3実施
形態について説明する。ここでは、第2実施形態との相
違点を中心に説明する。
【0064】本第3実施形態で用いられるバックアップ
データの分散方法を以下に示す。サーバ監視カードの個
数が、I=1、2、…、n(Iは2以上)である時に、
サーバ監視カードIがローカルに取得する管理情報をI
i とすると、保持する管理情報リストには以下の管理情
報が保存される。
【0065】 I=1の場合、 Ii +In Iが2以上の場合、Ii +Ii-1 ……(2) すなわち、I=1つまり先頭のサーバ監視カードについ
ては、自身のコンピュータの管理情報(Ii )と、最終
番目(n番目)のサーバ監視カードの管理情報(In
を保存する。
【0066】I=2つまり2番目以降のサーバ監視カー
ドについては、自身のコンピュータの管理情報(Ii
と、一つ前のサーバ監視カードの管理情報(Ii-1 )を
保存する。
【0067】サーバ監視のためのハードウェアが3台接
続されているネットワークで、上記の規則に従うと、図
17に示すように、サーバ監視カード(a)111はA
xおよびCxを管理情報リスト21に記載し、サーバ監
視カード(b)121はBxおよびAxを管理情報リス
ト22に記載し、サーバ監視カード(c)131はCx
およびBxを管理情報リスト33に記載する。一つのサ
ーバ監視のためのハードウェアが保持する管理情報リス
トのサイズは、第2実施例と同様に2台分となる。
【0068】一つのサーバ監視カードが故障によりネッ
トワークから切断された場合は、そのバックアップ情報
を保持している一台のサーバ監視カードから情報を復元
できる。
【0069】また、図18に示すように、サーバ監視カ
ード(d)141を内蔵するコンピュータ(D)14が
ネットワークに追加された場合は、式2に従い管理情報
リストの内容を変更する。変更する必要がある管理情報
リストは、管理情報DxおよびCxを含むものとなる。
例えば、n台のサーバ監視カードが接続されたネットワ
ークに、n+1台目を追加した場合には、nxおよび
(n+1)xを含む管理情報リストだけを変更するだけ
でよい。
【0070】ネットワークにサーバ監視カードを追加し
た場合の番号付けの手順については、第2実施形態と同
様である。なお、第3実施形態は、第1実施形態におい
て自装置の管理情報をバックアップ先となる特定の他の
一台のサーバ監視カードのみに保存し、且つバックアッ
プ対象の他の特定の一台のサーバ監視カードの管理情報
を自装置の管理情報リストに保存した場合と同じであ
る。
【0071】
【発明の効果】以上説明したように、本発明によれば、
サーバ監視のためのハードウェアがダウンしていても、
同一ネットワーク上の他のサーバ監視のためのハードウ
ェアからそのコンピュータの管理情報を取得したり、あ
るいはネットワーク内の一つのサーバ監視のためのハー
ドウェアに管理端末をネットワーク接続するだけで、同
一ネットワーク内の他のコンピュータの管理情報をもそ
のハードウェアから取得して表示できるようになり、信
頼性が高く、且つ効率よく複数のコンピュータの監視を
行うことが可能となる。
【図面の簡単な説明】
【図1】本発明の第1実施形態に係るコンピュータ監視
システムの構成を示すブロック図。
【図2】同第1実施形態に係るコンピュータ監視システ
ムの各サーバ監視カードで使用されるIDリストの構成
を示す図。
【図3】同第1実施形態に係るコンピュータ監視システ
ムにおける管理情報の受け渡し動作を説明するための
図。
【図4】同第1実施形態に係るコンピュータ監視システ
ムにおけるサーバ監視カード追加時の動作を説明するた
めの図。
【図5】同第1実施形態に係るコンピュータ監視システ
ムにおいて新たに追加されたサーバ監視カードによって
実行される処理の流れを説明するフローチャート。
【図6】同第1実施形態に係るコンピュータ監視システ
ムにおいて新たに追加されたサーバ監視カードからのア
ドレスブロードキャストに対する他のサーバ監視カード
の応答処理の流れを説明するフローチャート。
【図7】同第1実施形態に係るコンピュータ監視システ
ムに設けられた各サーバ監視カードによる管理情報送信
処理の流れを説明するフローチャート。
【図8】同第1実施形態に係るコンピュータ監視システ
ムにおいて新たに追加されたサーバ監視カードとの間の
管理情報受け渡し動作を説明するための図。
【図9】同第1実施形態に係るコンピュータ監視システ
ムにおいてあるサーバ監視カードが故障から復帰した場
合に他のサーバ監視カードによって実行される処理の流
れを示すフローチャート。
【図10】本発明の第2実施形態に係るコンピュータ監
視システムで用いられる管理情報分割処理の様子を示す
図。
【図11】同第2実施形態に係るコンピュータ監視シス
テムに設けられた各サーバ監視カードによる管理情報送
信処理の流れを説明するフローチャート。
【図12】同第2実施形態に係るコンピュータ監視シス
テムで行われる管理情報の分散バックアップの様子を示
す図。
【図13】同第2実施形態に係るコンピュータ監視シス
テムで行われる管理情報の分散バックアップの様子を示
す図。
【図14】同第2実施形態に係るコンピュータ監視シス
テムにおいてあるサーバ監視カードに障害が発生した場
合に行われる処理の様子を示す図。
【図15】同第2実施形態に係るコンピュータ監視シス
テムにおいてあるサーバ監視カードが故障から復帰した
場合に他のサーバ監視カードによって実行される処理の
流れを示すフローチャート。
【図16】同第2実施形態に係るコンピュータ監視シス
テムにおけるサーバ監視カード追加時の動作を説明する
ための図。
【図17】本発明の第2実施形態に係るコンピュータ監
視システムで行われる管理情報受け渡し動作を説明する
ための図。
【図18】同第3実施形態に係るコンピュータ監視シス
テムにおけるサーバ監視カード追加時の動作を説明する
ための図。
【符号の説明】
11…コンピュータ(A) 12…コンピュータ(B) 13…コンピュータ(C) 14…コンピュータ(D) 21…管理情報リスト 22…管理情報リスト 23…管理情報リスト 24…管理情報リスト 31…IDリスト 32…IDリスト 33…IDリスト 34…IDリスト 111…サーバ監視カード(a) 121…サーバ監視カード(b) 131…サーバ監視カード(c) 141…サーバ監視カード(d)

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 コンピュータの動作状態を監視するコン
    ピュータ監視装置において、 監視対象のコンピュータに設けられ、そのコンピュータ
    の各種状態情報を取得する手段と、 前記状態情報をバックアップするために、他のコンピュ
    ータに設けられたコンピュータ監視装置との間でネット
    ワークを介して前記状態情報を授受する状態情報通信手
    段とを具備することを特徴とするコンピュータ監視装
    置。
  2. 【請求項2】 前記状態情報通信手段は、前記監視対象
    のコンピュータの動作とは独立に相手側のコンピュータ
    監視装置と通信することを特徴とする請求項1記載のコ
    ンピュータ監視装置。
  3. 【請求項3】 前記状態情報通信手段は、各コンピュー
    タ監視装置に同一ネットワーク内の他の全てのコンピュ
    ータ監視装置の状態情報がバックアップされるように、
    前記他の全てのコンピュータ監視装置との間で状態情報
    を授受することを特徴とする請求項1記載のコンピュー
    タ監視装置。
  4. 【請求項4】 前記状態情報通信手段は、各コンピュー
    タ監視装置の状態情報が同一ネットワーク内の他の複数
    のコンピュータ監視装置に分散してバックアップされる
    ように、前記監視対象コンピュータの状態情報を複数に
    分割し、それら複数の分割状態情報をバックアップ先と
    なる複数のコンピュータ監視装置にそれぞれ送信し、且
    つバックアップ対象のコンピュータ監視装置から送信さ
    れた分割状態情報を受信して保存することを特徴とする
    請求項1記載のコンピュータ監視装置。
  5. 【請求項5】 前記状態情報通信手段は、各コンピュー
    タ監視装置の状態情報が同一ネットワーク内の他の一台
    のコンピュータ監視装置によってバックアップされるよ
    うに、前記監視対象コンピュータの状態情報をバックア
    ップ先のコンピュータ監視装置に送信し、且つバックア
    ップ対象のコンピュータ監視装置から送信された状態情
    報を受信して保存することを特徴とする請求項1記載の
    コンピュータ監視装置。
  6. 【請求項6】 複数のコンピュータそれぞれに設けられ
    た複数のコンピュータ監視装置を使用することにより、
    前記複数のコンピュータの動作を監視するコンピュータ
    監視システムにおいて、 前記各コンピュータ監視装置は、 それが設けられた監視対象コンピュータの各種状態情報
    を取得する手段と、 前記状態情報をバックアップするために、他のコンピュ
    ータに設けられたコンピュータ監視装置との間でネット
    ワークを介して前記状態情報を授受する状態情報通信手
    段とを具備し、 前記各コンピュータ監視装置の状態情報を他のコンピュ
    ータ監視装置に保存してバックアップすることを特徴と
    するコンピュータ監視システム。
  7. 【請求項7】 コンピュータの動作状態を監視する監視
    方法であって、 監視対象のコンピュータそれぞれに設けられたコンピュ
    ータ監視装置間で、互いのコンピュータから採取した状
    態情報をネットワークを介して交換し、 各コンピュータ監視装置で採取されたコンピュータの状
    態情報を他のコンピュータ監視装置に保存してバックア
    ップすることを特徴とする監視方法。
  8. 【請求項8】 各コンピュータ監視装置に同一ネットワ
    ーク内の他の全ての監視装置の状態情報がバックアップ
    されるように、前記各コンピュータ監視装置毎に、前記
    他の全てのコンピュータ監視装置との間で状態情報を交
    換することを特徴とする請求項7記載の監視方法。
  9. 【請求項9】 各コンピュータ監視装置の状態情報が同
    一ネットワーク内の他の複数のコンピュータ監視装置に
    分散してバックアップされるように、前記各コンピュー
    タ監視装置毎にバックアップ先の複数のコンピュータ監
    視装置とバックアップ対象のコンピュータ監視装置を決
    定し、それらコンピュータ監視装置間で、前記各コンピ
    ュータ監視装置で採取された監視対象コンピュータの状
    態情報を複数に分割することによって得られた分割状態
    情報を、授受させることを特徴とする請求項7記載の監
    視方法。
  10. 【請求項10】 各コンピュータ監視装置の状態情報が
    同一ネットワーク内の他の一台のコンピュータ監視装置
    によってバックアップされるように、前記各コンピュー
    タ監視装置毎にバックアップ先のコンピュータ監視装置
    とバックアップ対象のコンピュータ監視装置とを決定
    し、それらコンピュータ監視装置間で状態情報を授受さ
    せることを特徴とする請求項7記載の監視方法。
JP10168793A 1998-06-16 1998-06-16 コンピュータ監視装置および同装置を用いたコンピュータ監視システムおよび監視方法 Pending JP2000003344A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10168793A JP2000003344A (ja) 1998-06-16 1998-06-16 コンピュータ監視装置および同装置を用いたコンピュータ監視システムおよび監視方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10168793A JP2000003344A (ja) 1998-06-16 1998-06-16 コンピュータ監視装置および同装置を用いたコンピュータ監視システムおよび監視方法

Publications (1)

Publication Number Publication Date
JP2000003344A true JP2000003344A (ja) 2000-01-07

Family

ID=15874586

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10168793A Pending JP2000003344A (ja) 1998-06-16 1998-06-16 コンピュータ監視装置および同装置を用いたコンピュータ監視システムおよび監視方法

Country Status (1)

Country Link
JP (1) JP2000003344A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058549A (ja) * 2005-08-24 2007-03-08 Nec Corp マルチコンピュータモジュールシステム、マルチコンピュータモジュール方法、および、プログラム
JP2008071157A (ja) * 2006-09-14 2008-03-27 Hitachi Ltd 最新データ及び履歴データを管理するセンサネットワークシステム
JP2017041110A (ja) * 2015-08-20 2017-02-23 富士通株式会社 マルチコンピュータシステム,管理装置および管理プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058549A (ja) * 2005-08-24 2007-03-08 Nec Corp マルチコンピュータモジュールシステム、マルチコンピュータモジュール方法、および、プログラム
JP2008071157A (ja) * 2006-09-14 2008-03-27 Hitachi Ltd 最新データ及び履歴データを管理するセンサネットワークシステム
US8224616B2 (en) 2006-09-14 2012-07-17 Hitachi, Ltd. Sensor network system for managing the latest data and history data
JP2017041110A (ja) * 2015-08-20 2017-02-23 富士通株式会社 マルチコンピュータシステム,管理装置および管理プログラム

Similar Documents

Publication Publication Date Title
JP4562196B2 (ja) 高可用性ブレード・ベース分散コンピューティング・システム
JP4946302B2 (ja) ネットワークに接続されたデバイスの監視装置および監視方法
US7353259B1 (en) Method and apparatus for exchanging configuration information between nodes operating in a master-slave configuration
JP4663497B2 (ja) 情報処理システムおよび情報処理装置の割当管理方法
US20070266120A1 (en) System and method for handling instructions in a pre-boot execution environment
JP3850859B2 (ja) ホール管理システム
JP4741022B2 (ja) マルチキャスト配信システム及び方法
CN102377817A (zh) 连接管理系统以及用于链接连接管理服务器的方法
KR20190113366A (ko) 분산 클러스터 관리 시스템 및 그 방법
US7251813B2 (en) Server apparatus having function of changing over from old to new module
US7552355B2 (en) System for providing an alternative communication path in a SAS cluster
JP5216531B2 (ja) 情報処理システム、情報処理装置、情報処理方法、及びコンピュータプログラム
WO2013105269A1 (ja) サーバ装置、情報処理システム、サーバ装置のアドレス管理方法、及びサーバ装置のアドレス管理プログラム
JP2000003344A (ja) コンピュータ監視装置および同装置を用いたコンピュータ監視システムおよび監視方法
JP2009087008A (ja) 情報処理システムおよび制御方法
JP4757670B2 (ja) システム切替方法、その計算機システム及びプログラム
US7702793B2 (en) Method and apparatus for setting network using DHCP server or client function
JP2008288771A (ja) インターネットプロトコルアドレス設定システム及びそのアドレス設定方法
JP4982454B2 (ja) 情報処理方法および情報処理システム
JP2007043390A (ja) 映像配信システム及びその方法
JP2007133665A (ja) 計算機システム、分散処理方法、計算機及び分散処理プログラム
JP2005261094A (ja) 無停電電源装置管理システム
JP4723686B2 (ja) 情報処理システムおよび情報処理装置の割当管理方法
JP2000183905A (ja) Nicのフェイル・オーバ装置
EP3164983B1 (en) Methods and systems for facilitating communication in a work tools network environment