JP2002141920A - ノード監視方法、ノード監視システム、および記録媒体 - Google Patents

ノード監視方法、ノード監視システム、および記録媒体

Info

Publication number
JP2002141920A
JP2002141920A JP2000333472A JP2000333472A JP2002141920A JP 2002141920 A JP2002141920 A JP 2002141920A JP 2000333472 A JP2000333472 A JP 2000333472A JP 2000333472 A JP2000333472 A JP 2000333472A JP 2002141920 A JP2002141920 A JP 2002141920A
Authority
JP
Japan
Prior art keywords
time
node
polling
response
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000333472A
Other languages
English (en)
Other versions
JP3796401B2 (ja
Inventor
Hiroaki Imafuku
宏壮 今福
Koji Daiyoku
孝治 大浴
Hisakatsu Ito
寿勝 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP2000333472A priority Critical patent/JP3796401B2/ja
Publication of JP2002141920A publication Critical patent/JP2002141920A/ja
Application granted granted Critical
Publication of JP3796401B2 publication Critical patent/JP3796401B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 迅速にノード異常を検出すると共にポーリン
グ回数を削減してシステムおよびネットワークの負荷を
軽減する。 【解決手段】 ポーリングタイムアウトの時間t、最
大時間T、係数k、およびリトライ回数nを読み込むス
テップと、ネットワークに接続されたノードに向けてポ
ーリングし上記時間tを経過しても応答のないノードを
検出するステップと、応答のないノードを検出したとき
に、上記最大時間Tを超えない範囲で前回の時間tに上
記係数kを演算して新たな時間tを算出して当該算出し
た時間tを経過したときに当該応答のないノードに向け
てポーリングすることを繰り返し、上記リトライ回数繰
り返しても応答がないときに異常と判定するステップと
を有する。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は、ネットワークに接
続された複数のノードをポーリングして監視するノード
監視方法、ノード監視システムおよび記録媒体に関する
ものである。
【0002】
【従来の技術】従来、管理サーバがネットワークに接続
されたノード(ルータやハブなど)の正常あるいは異常
を監視する場合、図4に示すように、一定時間(例えば
1秒間隔)でポーリングしてノードから応答がない場合
に、一定のリトライ回数(例えば3回リトライ)しても
応答がなかったときに当該ノードを異常と検出するよう
にしていた。
【0003】図4は、従来技術の説明図を示す。ここ
で、管理サーバはネットワークに接続され当該ネットワ
ーク接続された多数のノード(ルータ、ハブ、サーバな
ど)の異常発生を監視するものである。図では、管理サ
ーバが監視ノード(ネットワークに接続された監視対象
のノード)にポーリングで要求を行い、監視ノードから
の応答を待機するが一定時間(例えば1秒)待っても応
答がないので2回目のポーリングで要求を行うことを繰
り返し、図では3回目のポーリングを行って応答がなか
ったのでノードの異常と判定している。
【0004】
【発明が解決しようとする課題】従来の異常検出は、上
述した図4に示すように一定間隔でポーリングしてノー
ドから応答がないことが所定回数(例えば3回)続いた
場合に当該ノードを異常と判定していたため、異常と判
定するまでに多くのポーリングを行う必要があると共
に、監視対象のノード数が数千にもなるとシステムの負
荷およびネットワークの負荷が増大してしまうという問
題があった。
【0005】本発明は、これらの問題を解決するため、
ポーリングしてノードから無応答を検出したときに最大
ポーリング間隔を越えない範囲で順次ポーリング間隔を
長くしてポーリングし異状と判定、あるいは所定回数と
なったときにノード異常と判定したりし、迅速にノード
異常を検出すると共にシステムおよびネットワークの負
荷を軽減することを目的としている。
【0006】
【課題を解決するための手段】図1を参照して課題を解
決するための手段を説明する。図1において、管理サー
バ1は、ネットワーク3に接続されたノードを管理する
ものであって、ここでは、監視手段2などから構成され
るものである。
【0007】監視手段2は、ネットワーク3、5などに
接続された複数のノード4をポーリングして監視するも
のである。次に,動作を説明する。管理サーバ1を構成
する監視手段2がポーリングタイムアウトの時間t、最
大時間T、係数k、およびリトライ回数nを読み込み、
ネットワーク3,5に接続されたノード4に向けてポー
リングし時間tを経過しても応答のないノード4を検出
し、応答のないノード4を検出したときに最大時間Tを
超えない範囲で前回の時間tに係数kを演算して新たな
時間tを算出して当該算出した時間tを経過したときに
応答のないノード4に向けてポーリングすることを繰り
返して応答がないときに異状と判定したり、あるいはリ
トライ回数繰り返しても応答がないときに異常と判定し
たりするようにしている。
【0008】この際、最大時間Tを超えたときに時間t
を当該最大時間Tと設定するようにしている。従って、
ポーリングしてノード4から無応答を検出したときに最
大ポーリング間隔を越えない範囲で順次ポーリング間隔
を長くしてポーリングして異状と判定したり、所定回数
となったときにノード4の異常と判定したりすることに
より、迅速にノード4の異常を検出すると共にシステム
およびネットワークの負荷を軽減することが可能とな
る。
【0009】
【発明の実施の形態】次に、図1から図3を用いて本発
明の実施の形態および動作を順次詳細に説明する。図1
は、本発明のシステム構成図を示す。
【0010】図1において、管理サーバ1は、ネットワ
ークに接続された複数のノード(ノード、ルータ、ハ
ブ、サーバなど)を監視するものであって、監視手段2
などから成されるものである。監視手段2は、ネットワ
ークに接続されたノードを監視するものであって、ポー
リングしてノード4から無応答を検出したときに最大ポ
ーリング間隔を越えない範囲で順次ポーリング間隔を長
くしてポーリングし所定回数となったときにノード4の
異常と判定したりなどするものである(図2、図3を用
いて後述する)。
【0011】ネットワーク3,5は、管理サーバ1,ノ
ードを接続して相互にデータの送受信を行うためのもの
である。ノード4は、ルータ,ハブ,サーバなどのデータ
の送受信を行う監視対象の装置である。
【0012】次に、図2のフローチャートの順番に従い
図1の構成の動作を詳細に説明する。図2は,本発明の
動作説明フローチャートを示す。図2において、S1
は、指定された以下の値を読み込む。
【0013】・ポーリングタイムアウト時間:t=1秒 ・ポーリングタイムアウト時間(最大値):T=3秒 ・ポーリングタイムアウト係数:k=2倍 ・ポーリング回数:n=3回 S2は、監視対象ノードが存在するか判別する。これ
は、監視対象ノードがまだ残っているか判別する。YE
Sの場合には、S3に進む。NOの場合には、全ての監
視対象のノードについて、監視を終了したので今回の一
連の監視は終了する。
【0014】S3は、ポーリング回数以上か判別する。
これは、S1で読み込んだポーリング回数n以上を繰り
返したか判別する。YESの場合には、S12で異常ノ
ードと判断し、ポーリング回数、タイムアウトをリセッ
トし(初期値に戻し)、に戻り、次のノードについて
繰り返す。
【0015】S4は、ポーリング送信する。これは、監
視対象のノードに向けてポーリングでデータを送信して
監視対象のノードから応答を要求する。S5は、ポーリ
ング回数のインクリメントする。S6は、応答受信を待
機する。これは、S4でポーリングでデータを送信した
ことに対応して、該当するノードからのデータの受信
(応答受信)を待機する。
【0016】S7は、タイムアウト時間オーバーか判別
する。これは、初回はS1のポーリングタイムアウト時
間tを、ポーリング送信してからオーバーしたか判別す
る。YESの場合には、S7’に進む。NOの場合に
は、S8でタイムアウト(ポーリングタイムアウト時間
t)をリセット(初期値に戻し)、S2以降を繰り返
す。
【0017】S7’は、タイムアウト時間>=タイムア
ウト時間(最大値)か判別する。YESの場合には、S
12で異常ノードと判断し、ポーリング回数、タイムア
ウトをリセットし(初期値に戻し)、に戻り、次のノ
ードについて繰り返す。一方、NOの場合には、S9に
進む。
【0018】S9は、タイムアウト時間t×タイムアウ
ト係数k=タイムアウト時間tを行い、更新する。例え
ば右側に記載したように、例えば ・1秒でタイムアウトだった場合、1×2=2秒をタイ
ムアウト時間tと設定する。
【0019】S10は、タイムアウト時間t>タイムア
ウト時間T(最大値)か判別する。YESの場合には、
S11でタイムアウト時間t=タイムアウト時間T(最
大値)と設定し、S3に戻り繰り返す。これにより、タ
イムアウト時間tは、最大がタイムアウト時間(最大
値)Tに制限されることとなる。右側に記載したよう
に、例えば ・タイムアウト時間t=2秒<3秒(=T)のため,2
秒でポーリングを実行する。さらにタイムアウトの場
合、2×2=4秒>3秒(=T)のためタイムアウト時
間tを3秒に設定して3回目のポーリングを実行する。
【0020】一方、S10のNOの場合には、S3に戻
り繰り返す。以上のように、指定されたポーリングタイ
ムアウト時間t,ポーリングタイムアウト時間(最大)
T、ポーリングタイムアウト係数k,およびポーリング
回数nをもとに、ポーリングして異常ノードを検出した
ときにタイムアウト時間tを係数k倍してタイムアウト
時間tを徐々にに大きくして最大をタイムアウト時間T
に制限してポーリングし、ポーリング回数nを越えたと
きに異常ノードと判定することにより、迅速にノード4
の異常を検出すると共にシステムおよびネットワークの
負荷を軽減することが可能となる。
【0021】図3は、本発明の説明図を示す。図3の
(a)は、タイムアウト時間(最大)T=4秒の例を示
す。この例の場合には、ポーリング回数n=3とし、 (1) 左側は、1回目はタイムアウト(タイムアウト
時間t=1秒のタイムアウト)となったので、2回目は
タイムアウト時間t=1×2(係数k)=2で待機した
が、1.5秒でノードから応答があったので、正常と判
定したものである。ここで、通常は50ms前後で応答
があるシステム(ノード)と、1.5秒前後で応答があ
るシステム(ノード)とが混在した場合に、1回目のタ
イムアウト時間t=1秒ではタイムアウトとなるが、2
回目のタイムアウト時間t=2秒のときは1.5秒でノ
ードから応答があり正常と判定されたものである。
【0022】(2) 右側は、1回目はタイムアウト
(タイムアウト時間t=1秒のタイムアウト)となり、
2回目もタイムアウト時間t=1×2=2秒で待機した
がタイムアウトとなり、更に、3回目でタイムアウト時
間t=2×2=4秒で待機してタイムアウトとなり、ノ
ード異常と判定する。ノード異常と判定するのに要した
時間は、1+2+4=7秒である。
【0023】図3の(b)は、タイムアウト時間(最
大)T=3秒の例を示す。この例の場合には、ポーリン
グ回数n=3とし、 (1) 左側は、1回目はタイムアウト(タイムアウト
時間t=1秒のタイムアウト)となったので、2回目は
タイムアウト時間t=1×2(係数k)=2で待機した
が、1.5秒でノードから応答があったので、正常と判
定したものである。
【0024】(2) 右側は、1回目はタイムアウト
(タイムアウト時間t=1秒のタイムアウト)となり、
2回目もタイムアウト時間t=1×2=2秒で待機した
がタイムアウトとなり、更に、3回目でタイムアウト時
間t=2×2=4秒であるが、タイムアウト時間T(最
大)=3秒を越えるのでt=3秒と設定し、ポーリング
送信してから3秒待機してタイムアウトとなり,ノード
異常と判定する。ノード異常と判定するのに要した時間
は、1+2+3=6秒であり、図3の(a)に比して短
縮できる。
【0025】
【発明の効果】以上説明したように、本発明によれば、
ポーリングしてノードから無応答を検出したときに最大
ポーリング間隔を越えない範囲で順次ポーリング間隔を
長くしてポーリングして異状と判定したり、あるいは所
定回数となったときにノードの異常と判定したりする構
成を採用しているため、迅速にノード4の異常を検出す
ると共にシステムおよびネットワークの負荷を軽減する
ことが可能となる。
【図面の簡単な説明】
【図1】本発明のシステム構成図である。
【図2】本発明の動作説明フローチャートである。
【図3】本発明の説明図である。
【図4】従来技術の説明図である。
【符号の説明】
1:管理サーバ 2:監視手段 3、5:ネットワーク 4:ノード
フロントページの続き (72)発明者 伊藤 寿勝 石川県河北郡宇ノ気町字宇野気ヌ98番地の 2 株式会社ピーエフユー内 Fターム(参考) 5B042 GA39 JJ23 JJ31 KK05 5K030 HD07 JA10 LA19 LE03 MA01 MA03 MB01 5K032 BA08 CA01 CC03 DA01 DA06 DB28 EA04

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】ネットワークに接続された複数のノードを
    ポーリングして監視するノード監視方法において、 ポーリングタイムアウトの時間t、最大時間T、係数
    k、およびリトライ回数nを読み込むステップと、 ネットワークに接続されたノードに向けてポーリングし
    上記時間tを経過しても応答のないノードを検出するス
    テップと、 上記応答のないノードを検出したときに、上記最大時間
    Tを超えない範囲で前回の時間tに上記係数kを演算し
    て新たな時間tを算出して当該算出した時間tを経過し
    たときに当該応答のないノードに向けてポーリングする
    ことを繰り返して異状と判定、あるいは上記リトライ回
    数繰り返しても応答がないときに異常と判定するステッ
    プとを有するノード監視方法。
  2. 【請求項2】上記最大時間Tを超えたときに時間tを当
    該最大時間Tと設定することを特徴とする請求項1記載
    のノード監視方法。
  3. 【請求項3】ネットワークに接続された複数のノードを
    ポーリングして監視するノード監視装置において、 ポーリングタイムアウトの時間t、最大時間T、係数
    k、およびリトライ回数nを読み込む手段と、 ネットワークに接続されたノードに向けてポーリングし
    上記時間tを経過しても応答のないノードを検出する手
    段と、 上記応答のないノードを検出したときに、上記最大時間
    Tを超えない範囲で前回の時間tに上記係数kを演算し
    て新たな時間tを算出して当該算出した時間tを経過し
    たときに当該応答のないノードに向けてポーリングする
    ことを繰り返して異状と判定、あるいは上記リトライ回
    数繰り返しても応答がないときに異常と判定する手段と
    を有するノード監視システム。
  4. 【請求項4】上記最大時間Tを超えたときに時間tを当
    該最大時間Tと設定することを特徴とする請求項3記載
    のノード監視システム。
  5. 【請求項5】ポーリングタイムアウトの時間t、最大時
    間T、係数k、およびリトライ回数nを読み込む手段
    と、 ネットワークに接続されたノードに向けてポーリングし
    上記時間tを経過しても応答のないノードを検出する手
    段と、 上記応答のないノードを検出したときに、上記最大時間
    Tを超えない範囲で前回の時間tに上記係数kを演算し
    て新たな時間tを算出して当該算出した時間tを経過し
    たときに当該応答のないノードに向けてポーリングする
    ことを繰り返して異状と判定、あるいは上記リトライ回
    数繰り返しても応答がないときに異常と判定する手段と
    して機能させるプログラムを記録したコンピュータ読取
    可能な記録媒体。
JP2000333472A 2000-10-31 2000-10-31 ノード監視方法、ノード監視システム、および記録媒体 Expired - Lifetime JP3796401B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000333472A JP3796401B2 (ja) 2000-10-31 2000-10-31 ノード監視方法、ノード監視システム、および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000333472A JP3796401B2 (ja) 2000-10-31 2000-10-31 ノード監視方法、ノード監視システム、および記録媒体

Publications (2)

Publication Number Publication Date
JP2002141920A true JP2002141920A (ja) 2002-05-17
JP3796401B2 JP3796401B2 (ja) 2006-07-12

Family

ID=18809552

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000333472A Expired - Lifetime JP3796401B2 (ja) 2000-10-31 2000-10-31 ノード監視方法、ノード監視システム、および記録媒体

Country Status (1)

Country Link
JP (1) JP3796401B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005346708A (ja) * 2004-05-26 2005-12-15 Arm Ltd データ処理装置およびそのポーリング・ループ管理方法
US7805550B2 (en) 2004-05-26 2010-09-28 Arm Limited Management of polling loops in a data processing apparatus
JP2012129907A (ja) * 2010-12-17 2012-07-05 Hitachi Kokusai Electric Inc 列車監視システム
JP2014219719A (ja) * 2013-05-01 2014-11-20 株式会社日立システムズ 監視装置、プログラムおよび監視方法
US20200186455A1 (en) * 2018-12-05 2020-06-11 Vmware, Inc. Dynamic Timeout-Based Fault Detection
JP2020150455A (ja) * 2019-03-14 2020-09-17 アラクサラネットワークス株式会社 ネットワーク統計情報の収集装置、通信システム、及び統計情報の収集方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005346708A (ja) * 2004-05-26 2005-12-15 Arm Ltd データ処理装置およびそのポーリング・ループ管理方法
US7805550B2 (en) 2004-05-26 2010-09-28 Arm Limited Management of polling loops in a data processing apparatus
JP4738891B2 (ja) * 2004-05-26 2011-08-03 エイアールエム リミテッド データ処理装置およびそのポーリング・ループ管理方法
JP2012129907A (ja) * 2010-12-17 2012-07-05 Hitachi Kokusai Electric Inc 列車監視システム
JP2014219719A (ja) * 2013-05-01 2014-11-20 株式会社日立システムズ 監視装置、プログラムおよび監視方法
US20200186455A1 (en) * 2018-12-05 2020-06-11 Vmware, Inc. Dynamic Timeout-Based Fault Detection
US10819611B2 (en) * 2018-12-05 2020-10-27 Vmware, Inc. Dynamic timeout-based fault detection
JP2020150455A (ja) * 2019-03-14 2020-09-17 アラクサラネットワークス株式会社 ネットワーク統計情報の収集装置、通信システム、及び統計情報の収集方法
JP7139268B2 (ja) 2019-03-14 2022-09-20 アラクサラネットワークス株式会社 ネットワーク統計情報の収集装置、通信システム、及び統計情報の収集方法

Also Published As

Publication number Publication date
JP3796401B2 (ja) 2006-07-12

Similar Documents

Publication Publication Date Title
US20210006484A1 (en) Fault detection method, apparatus, and system
US7016955B2 (en) Network management apparatus and method for processing events associated with device reboot
EP3420463B1 (en) Lease-based heartbeat protocol method and apparatus
US7281172B2 (en) Fault information collection program and apparatus
US5383178A (en) Network commentator
US20060200373A1 (en) Facilitating Root Cause Analysis for Abnormal Behavior of Systems in a Networked Environment
CN110377469B (zh) 一种pcie设备的检测系统以及方法
CN108418710B (zh) 一种分布式监控系统、方法及装置
WO2016177144A1 (zh) 网元监测方法和装置
CN111669308A (zh) 基于轮询优化策略的Modbus通讯方法方法、装置、终端及介质
US5363493A (en) Token ring network test device using finite state machine
JP2002141920A (ja) ノード監視方法、ノード監視システム、および記録媒体
US20100329127A1 (en) Network entity self-governing communication timeout management
CN110971459A (zh) 会话故障检测方法、装置、终端设备及可读存储介质
JP2004206634A (ja) 監視方法、稼動監視装置、監視システム及びコンピュータプログラム
WO2007059667A1 (fr) Procede d'obtention de donnees d'alarme des elements de reseau
CN113810238A (zh) 网络监测方法、电子设备及存储介质
JP3971353B2 (ja) ウィルス隔離システム
US8458529B2 (en) Logical entity fault isolation in network systems management
WO2014169547A1 (zh) 对终端外设的操作的处理方法及装置
JP2002140297A (ja) 稼働率算出方法、稼働率算出システム、および記録媒体
JP3945288B2 (ja) Lanパラメータ整合プログラム、lanパラメータ整合方法およびlanパラメータ整合システム
JP4863984B2 (ja) 監視処理プログラム、方法及び装置
JP2002141921A (ja) ノード監視方法、ノード監視システム、および記録媒体
JP2002026932A (ja) 監視制御システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051213

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060417

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3796401

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120421

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120421

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130421

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130421

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140421

Year of fee payment: 8

EXPY Cancellation because of completion of term