JP2000010823A - 計算機及び計算機システム並びにプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

計算機及び計算機システム並びにプログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2000010823A
JP2000010823A JP10172989A JP17298998A JP2000010823A JP 2000010823 A JP2000010823 A JP 2000010823A JP 10172989 A JP10172989 A JP 10172989A JP 17298998 A JP17298998 A JP 17298998A JP 2000010823 A JP2000010823 A JP 2000010823A
Authority
JP
Japan
Prior art keywords
computer
failure
monitoring
monitored
computers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10172989A
Other languages
English (en)
Inventor
Katsufumi Fujimoto
克文 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10172989A priority Critical patent/JP2000010823A/ja
Publication of JP2000010823A publication Critical patent/JP2000010823A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】障害監視に伴う通信量の削減、及び信頼性の向
上を図る。 【解決手段】ネットワーク5に接続され、同ネットワー
ク5に接続された他の計算機を定期的に障害監視する機
能を有する計算機1において、監視対象となっている計
算機毎に設定される監視周期を保持する記憶手段4と、
記憶手段4に設定されている監視周期にしたがって、各
監視対象の計算機に対する障害監視を実行する障害監視
手段3とを具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、計算機システムに
接続されている計算機の障害を監視する計算機、及び計
算機の障害を監視する計算機システム、並びに計算機シ
ステムに接続される計算機の障害を監視するプログラム
を記録したコンピュータ読み取り可能な記録媒体に関す
る。
【0002】
【従来の技術】計算機システム(例えば疎結合計算機シ
ステム)では、複数の計算機がネットワークを介して接
続される。この計算機システムの信頼性向上を図るため
に、各計算機間では相互に障害の監視が行われる場合が
ある。
【0003】この場合、計算機システムに設置されてい
る各計算機は、計算機システムに設置されている自己以
外の計算機と相互に通信を行い、互いに障害を監視す
る。したがって、計算機システムに設置される計算機の
台数を多くすることにより、各計算機への障害の監視回
数も多くなり、信頼性の向上が図られる。また、障害の
監視は周期的に行われるが、この周期を短縮することに
よって監視間隔が短縮され、これにより信頼性の向上を
図る場合もある。
【0004】
【発明が解決しようとする課題】しかしながら、上記の
ように信頼性向上のために計算機システムに計算機を増
設した場合には、各計算機間の通信量が増加する。同様
に、各計算機の監視周期を短縮した場合にも、各計算機
間の通信量が増加する。
【0005】したがって、従来の計算機システムにおい
ては、この通信量の増加により計算機の通信処理の負荷
及び計算機システムのネットワークの負荷が増加すると
いう問題がある。
【0006】また、通信量の増加が引き起こされるた
め、計算機の設置台数を増加して計算機システムの拡張
を図るのが困難である。さらに、従来の計算機システム
において、ネットワークの一部分の帯域が他の部分の帯
域よりも狭い場合には、この狭い帯域においても通信が
可能な障害監視周期を決定する必要がある。
【0007】ゆえに、障害監視の周期がこの狭い帯域に
よって制限されてしまい、十分な信頼性が得られる周期
を設定できない場合もある。本発明は、以上のような実
状に鑑みてなされたもので、障害監視のための通信量の
増加を防止する計算機及び計算機システム並びにプログ
ラムを記録したコンピュータ読み取り可能な記録媒体を
提供し、これにより計算機及び計算機システムの信頼性
の向上を図ることを目的とする。
【0008】
【課題を解決するための手段】本発明は、上記目的を達
成するために以下のような手段を講じた。請求項1の発
明は、ネットワークに接続され、同ネットワークに接続
された他の計算機を定期的に障害監視する機能を有する
計算機であり、監視対象となっている計算機毎に設定さ
れる監視周期を保持する記憶手段と、記憶手段に設定さ
れている監視周期にしたがって各監視対象の計算機に対
する障害監視を実行する障害監視手段とを具備するもの
である。
【0009】したがって、本発明の計算機においては、
各計算機の重要度を考慮し、重要度の低い計算機に対す
る監視周期を長くし、重要性の高い計算機に対する障害
検出周期を短くすることができる。
【0010】また、帯域の幅などのようなネットワーク
の特性を考慮し、帯域の狭い部分を介して接続されてい
る計算機の監視周期を長くすることができる。このよう
に、計算機毎に個別に監視周期を設定することで障害監
視に伴う通信量の増加を防止することができる。
【0011】また、各計算機毎に適切な周期で障害を監
視することができるため、計算機及び当該計算機の接続
される計算機システムの信頼性を向上させることができ
る。請求項2の発明は、請求項1記載の計算機である
が、記憶手段は、監視対象となっている計算機毎の稼働
状況をさらに保持し、障害監視手段は、記憶手段に稼働
と設定されている計算機に対してのみ障害監視を実行す
る。
【0012】したがって、稼働中の計算機のみが、それ
ぞれの監視周期にしたがって監視される。ゆえに、障害
監視に伴う通信量の増加を一層防止することができ、計
算機及び計算機システムの信頼性を向上させることがで
きる。
【0013】請求項3の発明は、請求項1記載の計算機
であるが、障害監視手段は、監視対象となっている計算
機毎に設定される監視周期にしたがって各監視対象の計
算機に対する障害監視を実行し、また各監視対象の計算
機のいずれかの障害を検出した場合に、この障害の検出
された計算機の状態を、障害の検出されていない計算機
に問い合わせる。
【0014】この計算機は、障害を検出した際に、さら
に他の計算機に障害が発生しているか否かを問い合わせ
るため、一層高精度な障害監視を実行することができ
る。請求項4の計算機システムは、ネットワークに接続
された計算機を定期的に障害監視する監視計算機を有す
る計算機システムであり、監視計算機は、監視対象とな
っている計算機毎に設定される監視周期を保持する記憶
手段と、記憶手段に設定されている監視周期にしたがっ
て各監視対象の計算機に対する障害監視を実行する障害
監視手段とを具備している。
【0015】この計算機システムは、監視計算機の働き
により、請求項1と同様の効果を得ることができる。請
求項5の記録媒体は、まず記憶されている監視対象の計
算機毎の監視周期を読み出し、次に読み出された監視周
期にしたがって各監視対象の計算機に対する障害監視を
行うプログラムを記録したコンピュータ読み取り可能な
記録媒体である。
【0016】このようなプログラムを記録した記録媒体
を用いることによって、上述した処理を実行しない装置
の場合においても、簡単に上述した処理を実行させるこ
とができる。なお、請求項2、請求項3の計算機の有す
る機能も、上記と同様にプログラムとして記録媒体に記
録して利用することが可能である。
【0017】
【発明の実施の形態】以下、図面を参照しながら本発明
の実施の形態について説明する。 (第1の実施の形態)本実施の形態においては、計算機
システムに設置されている各計算機毎に監視周期を記憶
しており、この各監視周期にしたがって監視対象の計算
機の障害を監視する計算機について説明する。
【0018】図1は、本実施の形態に係る計算機の構成
を示すブロック図である。この計算機1には送受信部2
と記憶部4が設けられており、障害監視プログラム3が
実行される。
【0019】送受信部1は、障害監視プログラム3から
ネットワーク5へのデータの送信を管理し、またネット
ワーク5から障害監視プログラム3へのデータの受信を
管理する。
【0020】記憶部4には、当該計算機1の接続される
計算機システムに接続されている複数の計算機の各アド
レス、この複数の計算機の稼働状態(停止中、稼働中、
障害発生)、障害を監視する対象の計算機の指定が記憶
されている。
【0021】また、各計算機毎に設定されている監視周
期、監視対象の計算機に対する障害監視の頻度等も記憶
されている。なお、監視周期は、各計算機の重要度、ネ
ットワーク5の伝送許容範囲、各計算機の通信性能、計
算機システムにおける計算機の設置台数に基づいて設定
されている。
【0022】例えば、重要度の高い計算機には、その重
要度に応じて監視周期を短く設定する。また、ネットワ
ーク5の伝送許容範囲と当該ネットワーク5への計算機
の設置台数を考慮し、通信が可能な状態を求めて監視周
期を設定する。
【0023】障害監視プログラム3は、記憶部4に記憶
されている各計算機のアドレス及び監視対象の計算機の
指定を読み出し、監視対象の計算機のアドレスを求め
る。また、記憶部4から各計算機毎に設定されている監
視周期を読み出し、この監視周期にしたがって自己及び
監視対象の計算機の障害の検出を行う。
【0024】ここで、障害監視プログラム3による障害
の検出方法について説明する。障害監視プログラム3
は、検査用データからなる検査情報に送信元アドレス及
び受信先アドレスを付加し、送受信部2及びネットワー
ク5を介して、この検査情報を監視周期が経過した監視
対象の計算機に送信する。
【0025】検査情報を受信した監視対象の計算機は、
この検査情報に関する所定の処理を実行する。また、検
査情報に含まれている送信元アドレスを受信先のアドレ
スとして所定の処理の結果に付加し、同様に自らのアド
レスを送信元アドレスとして所定の処理結果に付加す
る。
【0026】そして、検査情報を受信した監視対象の計
算機は、この処理結果をネットワーク5及び送受信部2
を介して、障害監視プログラム3に送信する。処理結果
を受信した障害監視プログラム3は、この処理結果に基
づいて監視周期が経過した監視対象の計算機の障害の検
出を行う。
【0027】この際に、障害監視プログラム3は記憶部
4に記憶されている障害監視の頻度を更新し、監視対象
の計算機の状態が変化している場合にその旨を更新す
る。図2は、本実施の形態に係る計算機1の処理を示す
フローチャートである。
【0028】この計算機1においては、まず障害監視プ
ログラム3が実行され、この障害監視プログラム3によ
って記憶装置4の内容が参照される(s1)。障害監視
プログラム3では、各監視対象の計算機毎に監視周期が
経過したか否かが判定される(s2)。
【0029】ここで、監視対象の計算機のうちで監視周
期を経過した計算機があれば、障害監視プログラム3に
よってこの計算機に対する障害の検出が上記の障害検出
方法によってなされる(s3)。
【0030】障害の検出後には、障害監視プログラム3
によって記憶部4の内容が更新される(s4)。そし
て、障害監視プログラム3を終了させるか否かが判定さ
れ、終了させない場合には、再び監視周期を経過した計
算機の有無が判定され、同様の処理が繰り返される(s
5)。
【0031】以上説明したように、本実施の形態に係る
計算機においては、計算機間を接続するネットワーク5
の伝送許容範囲や、各計算機の通信性能、各計算機の重
要性を考慮して各計算機の監視周期を設定することがで
きる。
【0032】これにより、障害監視のための不要な通信
を削減することが可能であるため、通信量の増加を防止
することができる。また、通信量の抑制が可能であるた
め、計算機の増設による計算機システムの拡張も可能で
ある。
【0033】さらに、障害監視の実行間隔や実行頻度
を、各計算機毎に適切に設定することができるため、シ
ステムの信頼性の向上を図ることができる。なお、計算
機システムに本実施の形態に係る計算機を複数台設置す
ることにより、相互に障害を監視することができ、信頼
性を一層向上させることができる。
【0034】(第2の実施の形態)本実施の形態におい
ては、それぞれの監視周期にしたがって各監視対象の計
算機の障害の検出を行い、障害が検出された計算機の状
態の確認を他の計算機に依頼し、この他の計算機の確認
結果によって障害の有無を確定する計算機について説明
する。
【0035】図3は、本実施の形態に係る計算機の構成
を示すブロック図であり、図1と同一の部分については
同一の符号を付してその説明を省略し、ここでは異なる
部分についてのみ詳しく説明する。
【0036】この計算機6の障害監視プログラム7は、
主に障害検出機能7a、及び障害確定機能7bとからな
る。障害検出機能7aは、先の第1の実施の形態におい
て説明した障害の検出方法により、それぞれの監視周期
にしたがって各計算機の障害の検出を行う。
【0037】これに加え、この障害検出機能7aは、監
視対象の計算機の障害を検出した場合に、この障害の検
出された計算機の状態確認を依頼する旨の問い合わせ信
号を作成し、送受信部2及びネットワーク5を介して、
確認を依頼する対象の計算機に送信する。
【0038】ここで、作成された問い合わせ信号には、
障害の検出された計算機のアドレスが含まれている。ま
た、確認依頼対象の計算機のアドレスが受信先のアドレ
スとして付加されており、当該障害監視を行っている計
算機6のアドレスが送信元のアドレスとして付加されて
いる。
【0039】また、確認依頼対象の計算機は1台以上で
あれば何台でもよく、確認依頼対象の計算機を複数台と
した場合にはそれぞれに対応する問い合わせ信号が作成
される。
【0040】さらに、この障害検出機能7aは、監視対
象の計算機の障害を検出した場合には、障害が検出され
た旨を障害確定機能7bに通知し、障害を検出しなかっ
た場合には、記憶部4の内容を更新する。
【0041】障害確定機能7bは、問い合わせ信号に関
する応答を、障害の確認を依頼した計算機からネットワ
ーク5、送受信部2を介して受信する。障害の確認を依
頼した計算機からの応答のうち、全てが障害を検出した
旨を示している場合には、この障害確定機能7bは、障
害検出機能7aで検出された計算機の障害を確定する。
【0042】一方、いずれかの応答が障害を検出してい
ない旨を示している場合には、障害検出機能7aによる
障害検出を誤りと認定する。また、この障害確定機能7
bは、認定結果に基づいて、記憶部4の内容を更新す
る。
【0043】図4は、本実施の形態に係る計算機6の処
理を示すフローチャートである。この計算機6では障害
監視プログラム7が実行され(t1)、それぞれの監視
周期が経過するたびに(t2)、障害の検出が行われる
(t3)。
【0044】ここで、監視対象の計算機のいずれかの障
害が障害検出機能7aによって検出された場合には(t
4)、障害検出機能7aから障害確定機能7bにその旨
が通知される(t5)。
【0045】また、この障害検出機能7aによって障害
が検出されていない計算機が確認依頼対象の計算機とさ
れ、障害検出機能7aから確認依頼対象の計算機に対し
て問い合わせ信号が送信される(t6)。
【0046】確認依頼対象の計算機が問い合わせ信号を
受信すると、当該監視対象の計算機によって障害の検出
された計算機の状態が確認され、この結果が問い合わせ
信号の応答として送信される。
【0047】送信された応答は、ネットワーク5及び計
算機6を介して障害確定機能7bに受信される(t
7)。障害確定機能7bでは、受信した全ての応答の内
容が障害を検出した旨を示す場合に(t8)、障害が確
定される(t9)。
【0048】これに対し、受信した応答の内容のいずれ
かが障害を検出していない旨を示す場合には(t8)、
障害検出機能7aで検出された障害が誤認であるとの認
定がなされる(t10)。
【0049】以上説明したように、本実施の形態に係る
計算機においては、監視周期にしたがって監視対象の計
算機の障害が監視されるため、第1の実施の形態に係る
計算機と同様の作用により同様の効果を得ることができ
る。
【0050】また、障害が検出された場合にのみ他の計
算機と連携を行い、他の計算機に対して監視を依頼する
ため、通信量の増加を一層防止することができる。さら
に、複数の計算機の障害監視結果により障害を確定する
ため、信頼性を一層向上させることができる。
【0051】なお、本実施の形態に係る計算機も、第1
の実施の形態に係る計算機と同様に、計算機システムに
複数台設置することで相互監視が可能である。また、確
認依頼対象の計算機の台数は1台以上であれば自由に設
定可能であるが、この台数を多くすることにより障害を
確定する際の信頼性を一層向上させることができる。
【0052】(第3の実施の形態)本実施の形態におい
ては、上記第2の実施の形態に係る計算機6が設置され
ている計算機システムについて説明する。
【0053】図5は、本実施の形態に係る計算機システ
ムの構成を示すブロック図である。この計算機システム
8は、計算機9〜12がネットワーク5に接続されて構
成される。
【0054】計算機9は、第2の実施の形態に係る計算
機6と同じ機能を有しており、この計算機システム8に
設置されている計算機(自らも含む)9〜12の障害監
視を行う。
【0055】計算機10〜12は、計算機9からの問い
合わせ信号を受信した場合に、計算機9によって障害が
あるとされた計算機の状態を確認する機能を有する。こ
こで、計算機10は、この計算機システム8におけるオ
ンライン業務の実行機能を有しており、計算機11、1
2よりも重要度が高いとする。
【0056】このような場合に、計算機9においては、
計算機10の監視周期の方が、計算機11、12の監視
周期よりも短く設定されている。以上のように構成され
た計算機システム8の動作について、計算機9によって
計算機10の障害が検出された場合を例として説明す
る。
【0057】計算機9は、各計算機9〜12の監視周期
にしたがって障害の検出を行っている。ここで、例えば
計算機10の障害を計算機9が検出したとすると、この
計算機9は、障害の検出されていない計算機11、12
を確認依頼対象の計算機とし、障害の検出された計算機
10の状態を問い合わせる。
【0058】計算機9からの問い合わせを受けた確認依
頼対象の計算機11、12は、計算機10の状態を確認
し、問い合わせに対する応答を計算機9に送信する。計
算機9は、自らの障害検出結果及び確認依頼対象の計算
機11、12の障害検出結果の全てが計算機10に障害
が発生している旨を示している場合には、この計算機1
0に障害が発生していると確定する。
【0059】一方、計算機11、12の障害検出結果の
いずれかが計算機10に障害が発生していない旨を示す
場合には、計算機9の障害検出を誤検出であると確定す
る。以上説明したように、本実施の形態に係る計算機シ
ステム8においては、計算機毎に監視周期を設定するこ
とが可能であるため、通信量の増加を防止することがで
きる。
【0060】また、通信量の増加を防止することが可能
であるために、計算機の増設が可能であり、計算機シス
テムの拡張性を向上させることができる。さらに、複数
の計算機による結果に基づいて障害が確定されるため、
信頼性を向上させることができる。
【0061】(第4の実施の形態)本実施の形態におい
ては、ネットワークの帯域が一定でない計算機システム
について説明する。
【0062】図6は、本実施の形態に係る計算機システ
ムの構成を示すブロック図である。この計算機システム
13は、LAN14とLAN15とがネットワーク16
によって接続されて構成されたWANである。
【0063】LAN14は、広帯域のネットワーク17
に計算機18〜20が接続されて構成される。計算機1
8〜20は第2の実施の形態に係る計算機6と同じ機能
を有している。なお、計算機18、19はオンライン業
務の実行機能を有しており、計算機20よりも重要度が
高い。
【0064】LAN15も、広帯域のネットワーク21
に計算機22〜24が接続されて構成される。計算機1
8〜20は第2の実施の形態に係る計算機6と同じ機能
を有している。なお、LAN15の計算機22は、オン
ライン業務の実行機能を有しており、計算機23、24
よりも重要度が高い。
【0065】LAN14、15の間を接続するネットワ
ーク16は、LAN14、15のネットワーク17、2
1よりも帯域が狭く低速の通信しか行えない。本実施の
形態に係る計算機システム13において、計算機18、
19、22は重要度が高いため、短い監視周期が設定さ
れている。
【0066】また、この計算機システム13において、
低帯域のネットワーク16を介して障害検出を行わなけ
ればならない場合には、このネットワーク16の伝送許
容範囲を考慮し、監視周期が長く設定されている。
【0067】すなわち、各計算機18〜20、22〜2
4において、自身と同一のLAN内で設置されている計
算機には短い監視周期で障害検出を試みるが、異なるL
ANに設置されている計算機には長い監視周期で障害検
出を試みる。
【0068】ここで、以上のように構成された計算機シ
ステム13の動作について、例えば計算機20によって
計算機18の障害が検出された場合について説明する。
計算機20においては、計算機18、19の監視周期が
最も短く設定されている。これに対し、計算機22〜2
4の監視周期は長く設定されているが、このうち計算機
22の監視周期は障害監視周期23、24よりも短く設
定されている。なお、計算機20は自らに対する監視周
期も保持している。
【0069】計算機20は、各監視周期に基づいてそれ
ぞれの計算機18、19、22〜24の障害の検出を行
う。ここで、計算機20において計算機18の障害が検
出された場合には、計算機20は計算機19、22〜2
4に確認を依頼し、この確認依頼対象の計算機19、2
2〜24から応答を受け取る。
【0070】そして、計算機20は、この応答に基づい
て障害の確定又は検出した障害の取り消しを行う。以上
説明したように、本実施の形態に係る計算機システムに
おいては、上記第3の実施の形態と同様の作用により同
様の効果を得ることができる。
【0071】また、ネットワークの帯域の変化に柔軟に
対処し、通信量を調整することができる。 (第5の実施の形態)本実施の形態においては、上記第
1乃至第4の実施の形態の変形例について説明する。
【0072】第1及び第2の実施の形態に係る計算機
1、6の変形として、障害監視プログラム3、7に、計
算機システムの状態制御を行う機能を付加する。例え
ば、障害を検出、確定した場合に、この状態制御機能を
用いて、障害の検出された計算機をシャットダウンさせ
るとすることにより、一層の信頼性を向上させることが
できる。
【0073】また、第1乃至第4の実施の形態におい
て、記憶部4の記憶内容には監視対象となっている各計
算機の稼働状態も含まれている。したがって、障害監視
プログラム3、7は、記憶部4からこの稼働状況を読み
出して稼働中の計算機をチェックし、この稼働中の計算
機に対してのみ障害監視を行うとしてもよい。これによ
り、一層通信量の増加を防止することができる。
【0074】なお、上記各実施の形態に係る計算機(コ
ンピュータ)又は計算機システムの各機能は、コンピュ
ータに実行させることのできるプログラムとして、例え
ば磁気ディスク(フロッピーディスク、ハードディスク
等)、光ディスク(CD−ROM、DVD等)、半導体
メモリなどの記録媒体に書き込んで適用したり、通信媒
体により伝送して適用することも可能である。本機能を
実現するコンピュータは、記録媒体に記録されたプログ
ラムを読み込み、プログラムによって動作が制御される
ことにより、上述した処理を実行する。
【0075】
【発明の効果】以上詳記したように本発明では、監視対
象の計算機毎に設定されている監視周期にしたがって、
この監視対象の計算機の障害監視を個別に行う。したが
って、ネットワークの帯域の特性や、計算機の重要度を
考慮して各計算機の監視周期を設定して通信量の増加を
防止することができる。
【0076】また、通信量の増加を防ぐことにより、計
算機の増設が可能になるため、計算機システムの拡張性
を向上させることができる。さらに、各計算機に応じて
適切な監視周期を設定することにより、信頼性を向上さ
せることができる。
【0077】また、本発明では、障害を検出した場合
に、障害の検出されていない他の計算機に対して、障害
の検出された計算機の状態を問い合わせるため、この問
い合わせに対する応答に基づいて障害の確定を行うこと
ができる。
【0078】したがって、複数の計算機の障害検出結果
に基づいて障害の有無を決定するため、障害の誤検出を
防止し、信頼性を向上させることができる。また、障害
が検出された場合にのみ他の計算機が障害検出を行うた
め、通信量の増加を防止することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る計算機の構成
を示すブロック図。
【図2】同実施の形態に係る計算機の処理を示すフロー
チャート。
【図3】本発明の第2の実施の形態に係る計算機の構成
を示すブロック図。
【図4】同実施の形態に係る計算機の処理を示すフロー
チャート。
【図5】本発明の第3の実施の形態に係る計算機システ
ムの構成を示すブロック図。
【図6】本発明の第4の実施の形態に係る計算機システ
ムの構成を示すブロック図。
【符号の説明】
1、6、9〜12、18〜20、22〜24…計算機 2…送受信部 3、7…障害監視プログラム 7a…障害検出機能 7b…障害確定機能 4…記憶部 5、16、17、21…ネットワーク 8、13…計算機システム 14、15…LAN

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 ネットワークに接続され、同ネットワー
    クに接続された他の計算機を定期的に障害監視する機能
    を有する計算機において、 監視対象となっている計算機毎に設定される監視周期を
    保持する記憶手段と、 前記記憶手段に設定されている監視周期にしたがって、
    各監視対象の計算機に対する障害監視を実行する障害監
    視手段とを具備したことを特徴とする計算機。
  2. 【請求項2】 請求項1記載の計算機において、 前記記憶手段は、監視対象となっている計算機毎の稼働
    状況をさらに保持し、 前記障害監視手段は、前記記憶手段に稼働と設定されて
    いる計算機に対してのみ障害監視を実行することを特徴
    とする計算機。
  3. 【請求項3】 請求項1記載の計算機において、 前記障害監視手段は、監視対象となっている計算機毎に
    設定される監視周期にしたがって各監視対象の計算機に
    対する障害監視を実行し、前記各監視対象の計算機のい
    ずれかの障害を検出した場合に、当該障害の検出された
    計算機の状態を、当該障害の検出されていない計算機に
    問い合わせることを特徴とする計算機。
  4. 【請求項4】 ネットワークに接続された計算機を定期
    的に障害監視する監視計算機を有する計算機システムに
    おいて、 前記監視計算機は、 監視対象となっている計算機毎に設定される監視周期を
    保持する記憶手段と、 前記記憶手段に設定されている監視周期にしたがって、
    各監視対象の計算機に対する障害監視を実行する障害監
    視手段とを具備することを特徴とする計算機システム。
  5. 【請求項5】 記憶されている監視対象の計算機毎の監
    視周期を読み出し、 当該読み出された監視周期にしたがって、各監視対象の
    計算機に対する障害監視を行うことを特徴とするプログ
    ラムを記録したコンピュータ読み取り可能な記録媒体。
JP10172989A 1998-06-19 1998-06-19 計算機及び計算機システム並びにプログラムを記録したコンピュータ読み取り可能な記録媒体 Pending JP2000010823A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10172989A JP2000010823A (ja) 1998-06-19 1998-06-19 計算機及び計算機システム並びにプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10172989A JP2000010823A (ja) 1998-06-19 1998-06-19 計算機及び計算機システム並びにプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2000010823A true JP2000010823A (ja) 2000-01-14

Family

ID=15952123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10172989A Pending JP2000010823A (ja) 1998-06-19 1998-06-19 計算機及び計算機システム並びにプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2000010823A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017167574A (ja) * 2016-03-14 2017-09-21 富士通株式会社 情報処理装置、通知監視プログラム、及び、通知監視方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017167574A (ja) * 2016-03-14 2017-09-21 富士通株式会社 情報処理装置、通知監視プログラム、及び、通知監視方法
US10649934B2 (en) 2016-03-14 2020-05-12 Fujitsu Limited Image processing apparatus, notification monitoring program, and notification monitoring method

Similar Documents

Publication Publication Date Title
US8214823B2 (en) Cluster system, process for updating software, service provision node, and computer-readable medium storing service provision program
US20130124912A1 (en) Synchronizing a distributed communication system using diagnostic heartbeating
JP4866429B2 (ja) システム障害を精度良く検出する技術
JP4695705B2 (ja) クラスタシステムおよびノード切り替え方法
US20080288812A1 (en) Cluster system and an error recovery method thereof
JP6183931B2 (ja) クラスタシステム、サーバ装置、クラスタシステムの管理方法、及びプログラム。
US20150256622A1 (en) Connection management device, communication system, connection management method, and computer program product
US7032128B2 (en) Method for managing computer, apparatus for managing computer, and computer readable medium storing program for managing computer
CN111342986B (zh) 分布式节点管理方法及装置、分布式系统、存储介质
CN112737945B (zh) 服务器连接控制方法及装置
JP6551111B2 (ja) 情報処理装置、ダウン判定方法、クラスタシステム、及びプログラム
JP2011203941A (ja) 情報処理装置、監視方法、および監視プログラム
JP2000010823A (ja) 計算機及び計算機システム並びにプログラムを記録したコンピュータ読み取り可能な記録媒体
JP6134720B2 (ja) 接続方法
WO2009101908A1 (ja) 監視マネージャ、統括マネージャおよびノード監視システム
US20070030813A1 (en) Monitoring a problem condition in a communications protocol implementation
KR102592204B1 (ko) 차량 및 그의 통신 제어 방법
CN113553243A (zh) 远端侦错方法
JP4863984B2 (ja) 監視処理プログラム、方法及び装置
JPH05225161A (ja) ネットワーク監視方式
JP7298412B2 (ja) 異常判定装置、異常判定方法およびプログラム
JP2011253285A (ja) 診断システム、診断装置及び診断プログラム
US7808893B1 (en) Systems and methods for providing redundancy in communications networks
WO2023238438A1 (ja) 監視装置および監視方法
JPH11327937A (ja) 資源排他制御システム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees