JP2002141920A - ノード監視方法、ノード監視システム、および記録媒体 - Google Patents
ノード監視方法、ノード監視システム、および記録媒体Info
- Publication number
- JP2002141920A JP2002141920A JP2000333472A JP2000333472A JP2002141920A JP 2002141920 A JP2002141920 A JP 2002141920A JP 2000333472 A JP2000333472 A JP 2000333472A JP 2000333472 A JP2000333472 A JP 2000333472A JP 2002141920 A JP2002141920 A JP 2002141920A
- Authority
- JP
- Japan
- Prior art keywords
- time
- node
- polling
- response
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Small-Scale Networks (AREA)
- Debugging And Monitoring (AREA)
Abstract
グ回数を削減してシステムおよびネットワークの負荷を
軽減する。 【解決手段】 ポーリングタイムアウトの時間t、最
大時間T、係数k、およびリトライ回数nを読み込むス
テップと、ネットワークに接続されたノードに向けてポ
ーリングし上記時間tを経過しても応答のないノードを
検出するステップと、応答のないノードを検出したとき
に、上記最大時間Tを超えない範囲で前回の時間tに上
記係数kを演算して新たな時間tを算出して当該算出し
た時間tを経過したときに当該応答のないノードに向け
てポーリングすることを繰り返し、上記リトライ回数繰
り返しても応答がないときに異常と判定するステップと
を有する。
Description
続された複数のノードをポーリングして監視するノード
監視方法、ノード監視システムおよび記録媒体に関する
ものである。
されたノード(ルータやハブなど)の正常あるいは異常
を監視する場合、図4に示すように、一定時間(例えば
1秒間隔)でポーリングしてノードから応答がない場合
に、一定のリトライ回数(例えば3回リトライ)しても
応答がなかったときに当該ノードを異常と検出するよう
にしていた。
で、管理サーバはネットワークに接続され当該ネットワ
ーク接続された多数のノード(ルータ、ハブ、サーバな
ど)の異常発生を監視するものである。図では、管理サ
ーバが監視ノード(ネットワークに接続された監視対象
のノード)にポーリングで要求を行い、監視ノードから
の応答を待機するが一定時間(例えば1秒)待っても応
答がないので2回目のポーリングで要求を行うことを繰
り返し、図では3回目のポーリングを行って応答がなか
ったのでノードの異常と判定している。
述した図4に示すように一定間隔でポーリングしてノー
ドから応答がないことが所定回数(例えば3回)続いた
場合に当該ノードを異常と判定していたため、異常と判
定するまでに多くのポーリングを行う必要があると共
に、監視対象のノード数が数千にもなるとシステムの負
荷およびネットワークの負荷が増大してしまうという問
題があった。
ポーリングしてノードから無応答を検出したときに最大
ポーリング間隔を越えない範囲で順次ポーリング間隔を
長くしてポーリングし異状と判定、あるいは所定回数と
なったときにノード異常と判定したりし、迅速にノード
異常を検出すると共にシステムおよびネットワークの負
荷を軽減することを目的としている。
決するための手段を説明する。図1において、管理サー
バ1は、ネットワーク3に接続されたノードを管理する
ものであって、ここでは、監視手段2などから構成され
るものである。
接続された複数のノード4をポーリングして監視するも
のである。次に,動作を説明する。管理サーバ1を構成
する監視手段2がポーリングタイムアウトの時間t、最
大時間T、係数k、およびリトライ回数nを読み込み、
ネットワーク3,5に接続されたノード4に向けてポー
リングし時間tを経過しても応答のないノード4を検出
し、応答のないノード4を検出したときに最大時間Tを
超えない範囲で前回の時間tに係数kを演算して新たな
時間tを算出して当該算出した時間tを経過したときに
応答のないノード4に向けてポーリングすることを繰り
返して応答がないときに異状と判定したり、あるいはリ
トライ回数繰り返しても応答がないときに異常と判定し
たりするようにしている。
を当該最大時間Tと設定するようにしている。従って、
ポーリングしてノード4から無応答を検出したときに最
大ポーリング間隔を越えない範囲で順次ポーリング間隔
を長くしてポーリングして異状と判定したり、所定回数
となったときにノード4の異常と判定したりすることに
より、迅速にノード4の異常を検出すると共にシステム
およびネットワークの負荷を軽減することが可能とな
る。
明の実施の形態および動作を順次詳細に説明する。図1
は、本発明のシステム構成図を示す。
ークに接続された複数のノード(ノード、ルータ、ハ
ブ、サーバなど)を監視するものであって、監視手段2
などから成されるものである。監視手段2は、ネットワ
ークに接続されたノードを監視するものであって、ポー
リングしてノード4から無応答を検出したときに最大ポ
ーリング間隔を越えない範囲で順次ポーリング間隔を長
くしてポーリングし所定回数となったときにノード4の
異常と判定したりなどするものである(図2、図3を用
いて後述する)。
ードを接続して相互にデータの送受信を行うためのもの
である。ノード4は、ルータ,ハブ,サーバなどのデータ
の送受信を行う監視対象の装置である。
図1の構成の動作を詳細に説明する。図2は,本発明の
動作説明フローチャートを示す。図2において、S1
は、指定された以下の値を読み込む。
は、監視対象ノードがまだ残っているか判別する。YE
Sの場合には、S3に進む。NOの場合には、全ての監
視対象のノードについて、監視を終了したので今回の一
連の監視は終了する。
これは、S1で読み込んだポーリング回数n以上を繰り
返したか判別する。YESの場合には、S12で異常ノ
ードと判断し、ポーリング回数、タイムアウトをリセッ
トし(初期値に戻し)、に戻り、次のノードについて
繰り返す。
視対象のノードに向けてポーリングでデータを送信して
監視対象のノードから応答を要求する。S5は、ポーリ
ング回数のインクリメントする。S6は、応答受信を待
機する。これは、S4でポーリングでデータを送信した
ことに対応して、該当するノードからのデータの受信
(応答受信)を待機する。
する。これは、初回はS1のポーリングタイムアウト時
間tを、ポーリング送信してからオーバーしたか判別す
る。YESの場合には、S7’に進む。NOの場合に
は、S8でタイムアウト(ポーリングタイムアウト時間
t)をリセット(初期値に戻し)、S2以降を繰り返
す。
ウト時間(最大値)か判別する。YESの場合には、S
12で異常ノードと判断し、ポーリング回数、タイムア
ウトをリセットし(初期値に戻し)、に戻り、次のノ
ードについて繰り返す。一方、NOの場合には、S9に
進む。
ト係数k=タイムアウト時間tを行い、更新する。例え
ば右側に記載したように、例えば ・1秒でタイムアウトだった場合、1×2=2秒をタイ
ムアウト時間tと設定する。
ウト時間T(最大値)か判別する。YESの場合には、
S11でタイムアウト時間t=タイムアウト時間T(最
大値)と設定し、S3に戻り繰り返す。これにより、タ
イムアウト時間tは、最大がタイムアウト時間(最大
値)Tに制限されることとなる。右側に記載したよう
に、例えば ・タイムアウト時間t=2秒<3秒(=T)のため,2
秒でポーリングを実行する。さらにタイムアウトの場
合、2×2=4秒>3秒(=T)のためタイムアウト時
間tを3秒に設定して3回目のポーリングを実行する。
り繰り返す。以上のように、指定されたポーリングタイ
ムアウト時間t,ポーリングタイムアウト時間(最大)
T、ポーリングタイムアウト係数k,およびポーリング
回数nをもとに、ポーリングして異常ノードを検出した
ときにタイムアウト時間tを係数k倍してタイムアウト
時間tを徐々にに大きくして最大をタイムアウト時間T
に制限してポーリングし、ポーリング回数nを越えたと
きに異常ノードと判定することにより、迅速にノード4
の異常を検出すると共にシステムおよびネットワークの
負荷を軽減することが可能となる。
(a)は、タイムアウト時間(最大)T=4秒の例を示
す。この例の場合には、ポーリング回数n=3とし、 (1) 左側は、1回目はタイムアウト(タイムアウト
時間t=1秒のタイムアウト)となったので、2回目は
タイムアウト時間t=1×2(係数k)=2で待機した
が、1.5秒でノードから応答があったので、正常と判
定したものである。ここで、通常は50ms前後で応答
があるシステム(ノード)と、1.5秒前後で応答があ
るシステム(ノード)とが混在した場合に、1回目のタ
イムアウト時間t=1秒ではタイムアウトとなるが、2
回目のタイムアウト時間t=2秒のときは1.5秒でノ
ードから応答があり正常と判定されたものである。
(タイムアウト時間t=1秒のタイムアウト)となり、
2回目もタイムアウト時間t=1×2=2秒で待機した
がタイムアウトとなり、更に、3回目でタイムアウト時
間t=2×2=4秒で待機してタイムアウトとなり、ノ
ード異常と判定する。ノード異常と判定するのに要した
時間は、1+2+4=7秒である。
大)T=3秒の例を示す。この例の場合には、ポーリン
グ回数n=3とし、 (1) 左側は、1回目はタイムアウト(タイムアウト
時間t=1秒のタイムアウト)となったので、2回目は
タイムアウト時間t=1×2(係数k)=2で待機した
が、1.5秒でノードから応答があったので、正常と判
定したものである。
(タイムアウト時間t=1秒のタイムアウト)となり、
2回目もタイムアウト時間t=1×2=2秒で待機した
がタイムアウトとなり、更に、3回目でタイムアウト時
間t=2×2=4秒であるが、タイムアウト時間T(最
大)=3秒を越えるのでt=3秒と設定し、ポーリング
送信してから3秒待機してタイムアウトとなり,ノード
異常と判定する。ノード異常と判定するのに要した時間
は、1+2+3=6秒であり、図3の(a)に比して短
縮できる。
ポーリングしてノードから無応答を検出したときに最大
ポーリング間隔を越えない範囲で順次ポーリング間隔を
長くしてポーリングして異状と判定したり、あるいは所
定回数となったときにノードの異常と判定したりする構
成を採用しているため、迅速にノード4の異常を検出す
ると共にシステムおよびネットワークの負荷を軽減する
ことが可能となる。
Claims (5)
- 【請求項1】ネットワークに接続された複数のノードを
ポーリングして監視するノード監視方法において、 ポーリングタイムアウトの時間t、最大時間T、係数
k、およびリトライ回数nを読み込むステップと、 ネットワークに接続されたノードに向けてポーリングし
上記時間tを経過しても応答のないノードを検出するス
テップと、 上記応答のないノードを検出したときに、上記最大時間
Tを超えない範囲で前回の時間tに上記係数kを演算し
て新たな時間tを算出して当該算出した時間tを経過し
たときに当該応答のないノードに向けてポーリングする
ことを繰り返して異状と判定、あるいは上記リトライ回
数繰り返しても応答がないときに異常と判定するステッ
プとを有するノード監視方法。 - 【請求項2】上記最大時間Tを超えたときに時間tを当
該最大時間Tと設定することを特徴とする請求項1記載
のノード監視方法。 - 【請求項3】ネットワークに接続された複数のノードを
ポーリングして監視するノード監視装置において、 ポーリングタイムアウトの時間t、最大時間T、係数
k、およびリトライ回数nを読み込む手段と、 ネットワークに接続されたノードに向けてポーリングし
上記時間tを経過しても応答のないノードを検出する手
段と、 上記応答のないノードを検出したときに、上記最大時間
Tを超えない範囲で前回の時間tに上記係数kを演算し
て新たな時間tを算出して当該算出した時間tを経過し
たときに当該応答のないノードに向けてポーリングする
ことを繰り返して異状と判定、あるいは上記リトライ回
数繰り返しても応答がないときに異常と判定する手段と
を有するノード監視システム。 - 【請求項4】上記最大時間Tを超えたときに時間tを当
該最大時間Tと設定することを特徴とする請求項3記載
のノード監視システム。 - 【請求項5】ポーリングタイムアウトの時間t、最大時
間T、係数k、およびリトライ回数nを読み込む手段
と、 ネットワークに接続されたノードに向けてポーリングし
上記時間tを経過しても応答のないノードを検出する手
段と、 上記応答のないノードを検出したときに、上記最大時間
Tを超えない範囲で前回の時間tに上記係数kを演算し
て新たな時間tを算出して当該算出した時間tを経過し
たときに当該応答のないノードに向けてポーリングする
ことを繰り返して異状と判定、あるいは上記リトライ回
数繰り返しても応答がないときに異常と判定する手段と
して機能させるプログラムを記録したコンピュータ読取
可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000333472A JP3796401B2 (ja) | 2000-10-31 | 2000-10-31 | ノード監視方法、ノード監視システム、および記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000333472A JP3796401B2 (ja) | 2000-10-31 | 2000-10-31 | ノード監視方法、ノード監視システム、および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002141920A true JP2002141920A (ja) | 2002-05-17 |
JP3796401B2 JP3796401B2 (ja) | 2006-07-12 |
Family
ID=18809552
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000333472A Expired - Lifetime JP3796401B2 (ja) | 2000-10-31 | 2000-10-31 | ノード監視方法、ノード監視システム、および記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3796401B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005346708A (ja) * | 2004-05-26 | 2005-12-15 | Arm Ltd | データ処理装置およびそのポーリング・ループ管理方法 |
US7805550B2 (en) | 2004-05-26 | 2010-09-28 | Arm Limited | Management of polling loops in a data processing apparatus |
JP2012129907A (ja) * | 2010-12-17 | 2012-07-05 | Hitachi Kokusai Electric Inc | 列車監視システム |
JP2014219719A (ja) * | 2013-05-01 | 2014-11-20 | 株式会社日立システムズ | 監視装置、プログラムおよび監視方法 |
US20200186455A1 (en) * | 2018-12-05 | 2020-06-11 | Vmware, Inc. | Dynamic Timeout-Based Fault Detection |
JP2020150455A (ja) * | 2019-03-14 | 2020-09-17 | アラクサラネットワークス株式会社 | ネットワーク統計情報の収集装置、通信システム、及び統計情報の収集方法 |
-
2000
- 2000-10-31 JP JP2000333472A patent/JP3796401B2/ja not_active Expired - Lifetime
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005346708A (ja) * | 2004-05-26 | 2005-12-15 | Arm Ltd | データ処理装置およびそのポーリング・ループ管理方法 |
US7805550B2 (en) | 2004-05-26 | 2010-09-28 | Arm Limited | Management of polling loops in a data processing apparatus |
JP4738891B2 (ja) * | 2004-05-26 | 2011-08-03 | エイアールエム リミテッド | データ処理装置およびそのポーリング・ループ管理方法 |
JP2012129907A (ja) * | 2010-12-17 | 2012-07-05 | Hitachi Kokusai Electric Inc | 列車監視システム |
JP2014219719A (ja) * | 2013-05-01 | 2014-11-20 | 株式会社日立システムズ | 監視装置、プログラムおよび監視方法 |
US20200186455A1 (en) * | 2018-12-05 | 2020-06-11 | Vmware, Inc. | Dynamic Timeout-Based Fault Detection |
US10819611B2 (en) * | 2018-12-05 | 2020-10-27 | Vmware, Inc. | Dynamic timeout-based fault detection |
JP2020150455A (ja) * | 2019-03-14 | 2020-09-17 | アラクサラネットワークス株式会社 | ネットワーク統計情報の収集装置、通信システム、及び統計情報の収集方法 |
JP7139268B2 (ja) | 2019-03-14 | 2022-09-20 | アラクサラネットワークス株式会社 | ネットワーク統計情報の収集装置、通信システム、及び統計情報の収集方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3796401B2 (ja) | 2006-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210006484A1 (en) | Fault detection method, apparatus, and system | |
US7016955B2 (en) | Network management apparatus and method for processing events associated with device reboot | |
EP3420463B1 (en) | Lease-based heartbeat protocol method and apparatus | |
US7281172B2 (en) | Fault information collection program and apparatus | |
US5383178A (en) | Network commentator | |
US20060200373A1 (en) | Facilitating Root Cause Analysis for Abnormal Behavior of Systems in a Networked Environment | |
CN110377469B (zh) | 一种pcie设备的检测系统以及方法 | |
CN108418710B (zh) | 一种分布式监控系统、方法及装置 | |
WO2016177144A1 (zh) | 网元监测方法和装置 | |
CN111669308A (zh) | 基于轮询优化策略的Modbus通讯方法方法、装置、终端及介质 | |
US5363493A (en) | Token ring network test device using finite state machine | |
JP2002141920A (ja) | ノード監視方法、ノード監視システム、および記録媒体 | |
US20100329127A1 (en) | Network entity self-governing communication timeout management | |
CN110971459A (zh) | 会话故障检测方法、装置、终端设备及可读存储介质 | |
JP2004206634A (ja) | 監視方法、稼動監視装置、監視システム及びコンピュータプログラム | |
WO2007059667A1 (fr) | Procede d'obtention de donnees d'alarme des elements de reseau | |
CN113810238A (zh) | 网络监测方法、电子设备及存储介质 | |
JP3971353B2 (ja) | ウィルス隔離システム | |
US8458529B2 (en) | Logical entity fault isolation in network systems management | |
WO2014169547A1 (zh) | 对终端外设的操作的处理方法及装置 | |
JP2002140297A (ja) | 稼働率算出方法、稼働率算出システム、および記録媒体 | |
JP3945288B2 (ja) | Lanパラメータ整合プログラム、lanパラメータ整合方法およびlanパラメータ整合システム | |
JP4863984B2 (ja) | 監視処理プログラム、方法及び装置 | |
JP2002141921A (ja) | ノード監視方法、ノード監視システム、および記録媒体 | |
JP2002026932A (ja) | 監視制御システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051213 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060417 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3796401 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120421 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120421 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130421 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130421 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140421 Year of fee payment: 8 |
|
EXPY | Cancellation because of completion of term |