JP2006319683A - ネットワークシステム監視方式およびネットワークシステム監視装置 - Google Patents
ネットワークシステム監視方式およびネットワークシステム監視装置 Download PDFInfo
- Publication number
- JP2006319683A JP2006319683A JP2005140459A JP2005140459A JP2006319683A JP 2006319683 A JP2006319683 A JP 2006319683A JP 2005140459 A JP2005140459 A JP 2005140459A JP 2005140459 A JP2005140459 A JP 2005140459A JP 2006319683 A JP2006319683 A JP 2006319683A
- Authority
- JP
- Japan
- Prior art keywords
- computer
- monitoring
- disconnected
- network
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】 計算機の故障かネットワークの故障かを容易に判断して監視することができるネットワークシステム監視方式を提供する。
【解決手段】 分散して配置された複数の計算機が広域ネットワーク網にルータを介して接続されて構成された拠点を複数個有するネットワークシステムにおいて、任意の計算機1−1から他の各計算機に対してハローコールデータを送信して受信する第1の監視および任意の計算機から各ルータに対してピングコマンドを実施する第2の監視を行い、これら監視より第1の所定時間不通となる計算機が検出されかつ不通となる計算機の拠点のルータ器情報が正常であると検出されると不通とされた計算機の異常と判断し、第1の所定時間不通となる計算機が検出されかつ不通となる計算機の拠点のルータ情報が不通であると検出されると任意の計算機から不通となる計算機間のネットワークの異常と判断する。
【選択図】 図1
【解決手段】 分散して配置された複数の計算機が広域ネットワーク網にルータを介して接続されて構成された拠点を複数個有するネットワークシステムにおいて、任意の計算機1−1から他の各計算機に対してハローコールデータを送信して受信する第1の監視および任意の計算機から各ルータに対してピングコマンドを実施する第2の監視を行い、これら監視より第1の所定時間不通となる計算機が検出されかつ不通となる計算機の拠点のルータ器情報が正常であると検出されると不通とされた計算機の異常と判断し、第1の所定時間不通となる計算機が検出されかつ不通となる計算機の拠点のルータ情報が不通であると検出されると任意の計算機から不通となる計算機間のネットワークの異常と判断する。
【選択図】 図1
Description
この発明は、距離が離れた複数の拠点に分散して配置された複数台の計算機を、インターネットや社内イントラネット等の広域ネットワーク(WAN)網にルータを介して接続し、相互にデータを交換するネットワークシステムにおいて、各計算機の障害かネットワークの障害かを容易に判断して監視することができるネットワークシステム監視方式およびネットワークシステム監視装置である。
近年、通信ネットワークの伝送速度および信頼性が向上し、広域ネットワーク網を介して隔てられた複数の拠点に、データの収集や加工処理を行うためのサーバ計算機や、操作員がサーバ計算機に対して各種設定変更要求及びデータ閲覧等を行うための端末として使用するクライアント計算機を分散配置した構成を持つ監視制御システムが増えてきている。このような構成をもつ監視制御システムでは、システムの要素であるネットワーク機器の状態や各計算機の状態を監視し、故障時には故障部位を特定する必要がある。
例えば、同一拠点内にすべての計算機が配置された形態にて構成されるシステムでは、システム内に接続された全計算機に対してハローコールデータを送信し、各計算機からの応答の有無を監視するだけで故障部位を特定することができた。故障発生時には、各計算機の状態をシステム運転員が直接確認することが可能であるため、ハローコールデータが途絶えた場合は、その計算機への経路上の機器をチェックすることで、計算機本体に問題が生じてもネットワーク機器に問題が生じても問題発生時には故障部位が容易に特定できた。
しかし、計算機が広域ネットワークを介して結合したシステムの場合は、すべての機器の状態が容易に把握できないことに加え、ネットワーク経路が複数のルータによって実現されており、また、実際の通信に使用される経路はルーティングプロトコルにより動的に決定されるため、計算機間のハローコールデータの返信が途絶えた場合は、問題が計算機にあるのか、ネットワーク側にあるのかを区別するのは非常に困難を伴っていた。
通信経路上の問題箇所を特定する従来の方法として、経路上のすべてのルータを常に監視しておく方法がある。例えば、監視端末は、各端末宛にトレースルートコマンド(tracerouteを指し、以下、トレースルートコマンドのみにて示す)コマンドを送信し、配送経路の各ルータから応答情報を返送させる。端末宛のトレースルートコマンドにより、各ルータから応答情報が返送される。監視端末は、各ルータからの応答情報及び応答順序を基にLAN上に存在するすべてのルータを検出し、配置構成を登録する。また、各端末へのトレースルートコマンドにより検出・登録した各ルータに対して、通信相手の応答確認に使用されるピングコマンド(pingを指し、以下、ピングコマンドのみにて示す。)コマンドを送信し、その応答の有無により各ルータの状態(正常性)の監視を行っている。ピングコマンドの応答がない場合は、そのルータ名を抽出しシステム操作員に通知を行う(例えば、特許文献1参照)。
その他に、通信経路上の問題箇所を特定する従来の方法として、SNMP(simple networkmanagement protoco1)等のネットワーク管理専用のプロトコルを用いたノード管理を行う方法がある。
従来のシステムによる計算機間のハローコールデータによる故障チェックだけでは、ネットワーク上の問題か、計算機上の問題かを切り分けることが非常に困難であった。また、ネットワーク内の問題を切り分ける方法として、上述したように経路上にある全ルータの生死をトレースルートコマンドおよびピングコマンドで常にチェックしたり、SNMP等のネットワーク管理専用のプロトコルをサポートした機器やソフトを導入して機器の故障を検出したりしていたが、これらの方式では故障チェックを全ルータに対して実施しなければならず、広域ネットワーク網が複雑になればなるほどルータの数が増えるために、監視に要するオーバーヘッドが重くなるという問題点があった。
また、広域ネットワーク網では一般に収束までに数十秒かかるルーティングプロトコルにより、経路が一時的に切断され、復帰することになるが、遠隔の計算機との通信が実施できない事象が発生し、復旧した場合に、経路振り替えなしで復旧したネットワーク障害なのか、ルーティングプロトコル動作により復旧した一時的な切断なのかどうかを把握するのが困難であるという問題点があった。
この発明は上記のような課題を解決するためになされたものであり、計算機上の問題かネットワーク上の問題かを容易に把握できるネットワークシステム監視方式およびネットワークシステム監視装置を提供することを目的とする。
この発明は、分散して配置された複数の計算機が広域ネットワーク網にゲートウェイ器を介して接続されて構成された拠点を複数個有するネットワークシステムにおいて、各計算機のうち任意の計算機から他の各計算機に対して定期的にハローコールデータを送信して受信する第1の監視および任意の計算機から各ゲートウェイ器に対して定期的にピングコマンドを実施する第2の監視を行い、第1の監視により第1の所定時間不通となる計算機が検出されかつ第2の監視により不通となる計算機の拠点のゲートウェイ器情報が正常であると検出されると不通とされた計算機の異常と判断し、第1の監視により第1の所定時間不通となる計算機が検出されかつ第2の監視により不通となる計算機の拠点のゲートウェイ器情報が不通であると検出されると任意の計算機から不通となる計算機間のネットワークの異常と判断するものである。
この発明のネットワークシステム監視方式は、分散して配置された複数の計算機が広域ネットワーク網にゲートウェイ器を介して接続されて構成された拠点を複数個有するネットワークシステムにおいて、各計算機のうち任意の計算機から他の各計算機に対して定期的にハローコールデータを送信して受信する第1の監視および任意の計算機から各ゲートウェイ器に対して定期的にピングコマンドを実施する第2の監視を行い、第1の監視により第1の所定時間不通となる計算機が検出されかつ第2の監視により不通となる計算機の拠点のゲートウェイ器情報が正常であると検出されると不通とされた計算機の異常と判断し、第1の監視により第1の所定時間不通となる計算機が検出されかつ第2の監視により不通となる計算機の拠点のゲートウェイ器情報が不通であると検出されると任意の計算機から不通となる計算機間のネットワークの異常と判断するもので、計算機の故障かネットワークの故障かを容易に判断して監視することができる。
実施の形態1.
以下、この発明の実施の形態を図に基づいて説明する。図1はこの発明の実施の形態1におけるネットワークシステムの構成を示すブロック図、図2は図1に示したネットワークシステムにおけるピングコマンドおよびトレースルートコマンドによる監視手順を示す図、図3および図4は図1に示したネットワークシステムにおける判断方法を示す図である。図において、拠点Aには各計算機1−1、A1、A2が配置され、拠点Bには計算機B1、B2が配置され、拠点Cには計算機C1、C2がそれぞれ配置されている。そして、これら拠点A、B、Cはそれぞれ各拠点A、B、Cのゲートウェイ器としてのルータR1−1、ルータR2−1、ルータR3−1を経由して、多数のルータ群Rnによって構成された広域ネットワーク網に接続されている。
以下、この発明の実施の形態を図に基づいて説明する。図1はこの発明の実施の形態1におけるネットワークシステムの構成を示すブロック図、図2は図1に示したネットワークシステムにおけるピングコマンドおよびトレースルートコマンドによる監視手順を示す図、図3および図4は図1に示したネットワークシステムにおける判断方法を示す図である。図において、拠点Aには各計算機1−1、A1、A2が配置され、拠点Bには計算機B1、B2が配置され、拠点Cには計算機C1、C2がそれぞれ配置されている。そして、これら拠点A、B、Cはそれぞれ各拠点A、B、Cのゲートウェイ器としてのルータR1−1、ルータR2−1、ルータR3−1を経由して、多数のルータ群Rnによって構成された広域ネットワーク網に接続されている。
ここでは任意の計算機を計算機1−1とする。そして計算機1−1には、各拠点A、B、Cにある計算機A1、計算機A2、計算機B1、計算機B2、計算機C1、計算機C2と、各拠点A、B、CのゲートウェイとなるルータR1−1、ルータR2−1、ルータR3−1のIPアドレスのみが登録されている。但し、広域ネットワーク網内のルータ群Rnの情報は登録する必要はない。計算機1−1には図示は省略するが、他の各計算機A1、計算機A2、計算機B1、計算機B2、計算機C1、計算機C2に対して定期的にハローコールデータを送信して受信する第1の監視手段と、各ルータR1−1、ルータR2−1、ルータR3−1に対して定期的にピングコマンドを実施する第2の監視手段と、各ルータR1−1、ルータR2−1、ルータR3−1に対するトレースルートコマンドを定期的に実施する第3の監視手段と、第1の監視手段および第2の監視手段の内容から計算機の故障およびネットワークの故障のいずれかを判断し、ネットワークの復帰がルート変更ありかルート変更無しかを判断する判断手段とにて成るネットワークシステム監視装置を備えている。
次に上記のように構成された実施の形態1のネットワークシステムにおけるネットワークシステム監視方式について説明する。まず、計算機1−1の第1の監視手段は、IPアドレスが登録されている各拠点の計算機A1、計算機A2、計算機B1、計算機B2、計算機C1、計算機C2に対して、定周期で各計算機の生死を監視するためのハローコールデータを送信する。そして、ハローコールデータを受信した各計算機A1、計算機A2、計算機B1、計算機B2、計算機C1、計算機C2は、自計算機の運転状態などの付加情報をセットして、即座に計算機1−1の第1の監視手段に応答データを返信する。次に計算機1−1の第1の監視手段は、各計算機A1、計算機A2、計算機B1、計算機B2、計算機C1、計算機C2から応答データを受信すると、受信した応答データを基に計算機1−1にて保持している各計算機A1、計算機A2、計算機B1、計算機B2、計算機C1、計算機C2の状態管理情報を更新する。
システム運転員は、この状態管理情報を閲覧することで、ネットワークシステム内にある各計算機A1、計算機A2、計算機B1、計算機B2、計算機C1、計算機C2の運用状態を把握することができる。また、計算機1−1の第1の監視手段はハローコールデータを送信してから、応答データを受信するまでの時間を監視しており、第1の所定時間T1を経過しても応答を受信できない場合は、当該計算機或いは当該計算機から計算機1−1までのネットワークに何らかの問題が発生したとみなし、計算機1−1で保持している、当該計算機の第1の監視結果を”正常”から”異常”に更新する。ここで言う第1の所定時間T1とは、ハローコールデータを発信して返信されるまでにかかる時間や、それの複数回分の時間などを適宜設定することが考えられる。
さらに計算機1−1の第2の監視手段および第3の監視手段は、各計算機A1、計算機A2、計算機B1、計算機B2、計算機C1、計算機C2に対するハローコールデータによる第1の監視とあわせて、ピングコマンドおよびトレースルートコマンドによる各拠点A、B、Cのゲートウェイとして使用しているルータR−1、ルータR2−1、ルータR3−1の第2の監視および第3の監視を行う。図2(a)に示すように、第2の監視手段がピングコマンドを各ルータR−1、ルータR2−1、ルータR3−1に対して使用する。そして、各ルータR−1、ルータR2−1、ルータR3−1が計算機1−1と通信可能であるか否かを判断することができる。計算機1−1の第2の監視手段は、各拠点A、B、Cに設置されたルータR−1、ルータR2−1、ルータR3−1に対して定期的にピングコマンドを送信する。そしてピングコマンドが失敗になった場合は、当該ルータは異常であるとみなし、計算機1−1で保持しているルータの第2の監視結果の状態を”正常”から”異常”に更新する。
また、図2(b)に示すように、第3の監視手段はトレースルートコマンドを各ルータR−1、ルータR2−1、ルータR3−1に対して使用すると、ルータまでの経路上にあるルータの一覧を取得することができる。計算機1−1の第3の監視手段は、各拠点A、B、Cに設置されたルータR−1、ルータR2−1、R3−1に対して定期的にトレースルートコマンドを実行し、各ルータR−1、ルータR2−1、ルータR3−1までの経路を取得する。経路情報は計算機1−1の第3の監視手段に保存する。そして、前回実施し保存したルートと、新規に実施して保存したルートとが少しでも変化していれば、計算機1−1で保持しているルート変化状態を”変化なし”から”変化あり”に更新する。尚、トレースルートコマンドが失敗した場合には、ルート変更とはせずその収集結果は保存せず破棄する。これはトレースルートコマンドが失敗する場合をルート変更として見なすことを防止している。
計算機1−1の判断手段は、各計算機A1、計算機A2、計算機B1、計算機B2、計算機C1、計算機C2に対して第1の監視手段により、第1の監視結果が”異常”と検出された場合には、第2の監視手段によるピングコマンドの第2の監視結果を参照し、ピングコマンドが”正常”であれば、当該計算機の異常と判断して、”計算機異常発生”をシステム運転員に通知する。また、ピングコマンドが”異常”であれば、計算機1−1と当該計算機間のネットワークに問題があるとして、”ネットワーク異常発生”をシステム運転員に通知する。”ネットワーク異常発生”とした場合は、さらに第2の所定時間T2時間のタイマを動作させネットワーク異常の復帰を監視する。第2の所定時間T2後又はまでにピングコマンドおよびトレースルートコマンドによる各拠点のルータR2−1、R3−1の監視結果とを組み合わせて最終判定を実施し、結果をユーザ通知する。ここで言う第2の所定時間T2とは、広域ネットワーク網で使用されている、ルーティングプロトコルの収束時間よりも長い時間をセットする。これは、計算機から別の計算機までのルートが変更されることにより接続可能となる場合もあるためであり、この時間より小さいとルート変更が実施される前に故障と判断されてしまうためである。
次に具体的な信号に基づいて、判断手段の具体的な判断について図3および図4に基づいて説明する。図3および図4においては、計算機1−1からルータR2−1および計算機B1への信号について示す。ただし、他のルータおよび計算機においても同様にして信号を受信して判断していることは言うまでもなくその説明は省略する。図3(a)は、遠隔の計算機本体に復旧できない継続故障が発生したときの処理フローを表している。まず、計算機B1へのハローコールデータが”失敗”となった時点から第1の所定時間T1後にハローコールデータによる監視結果がまだ”失敗”となり計算機B1が故障ではないかということが検出される。次にその時点におけるルータR2−1ヘのピングコマンドが”成功”となっているため、遠隔の計算機B1に問題があると判断される。そしてこのことをシステム運転員に”計算機B1の異常発生”として通知する。
図3(b)は、ネットワーク経路上に復旧できない継続故障が発生したときの処理フローを表している。上記に示した場合と同様に、計算機B1のハローコールデータが第1の所定時間”失敗”となり、計算機B1が故障ではないかということが検出される。次にその時点におけるルータR2−1ヘのピングコマンドが”失敗”となっているため、その時点においてまず”計算機1−1と計算機B1との間のネットワーク異常発生”をシステム運転員に第一報として通知する。さらに、第2の所定時間T2時間後に、ピングコマンドおよびトレースルートコマンドによる監視結果を総合してチェックがおこわれる。この場合、ピングコマンドは失敗のままであるため、”計算機1−1と計算機B1との間のネットワーク異常継続”と判定し、システム運転員に最終判断結果として通知する。
図4(a)は、広域ネットワーク網のルーティングプロトコルによる経路切替により一時的なネットワーク不通が発生したときの処理フローを表している。上記に示した場合と同様に、計算機B1のハローコールデータが第1の所定時間”失敗”となり、計算機B1が故障ではないかということが検出される。次にその時点における、ルータR2−1ヘのピングコマンド監視結果も”失敗”となっているため、その時点においてまず”計算機1−1と計算機B1との間のネットワーク異常発生”をシステム運転員に第一報として通知する。さらに、第2の所定時間T2後に、ピングコマンドおよびトレースルートコマンドによる監視結果を総合してチェックがおこわれる。この場合、ピングコマンドは成功しており、トレースルートコマンド結果は変化しているため、”計算機1−1と計算機B1との間のルート変更によるネットワーク復帰”と判定し、システム運転員に最終判断結果として通知する。
図4(b)は、ネットワーク経路上に瞬時故障が発生したときの処理フローを表している。上記に示した場合と同様に、計算機B1のハローコールデータが第1の所定時間”失敗”となり、計算機B1が故障ではないかということが検出される。次にその時点における、ルータR2−1ヘのピングコマンド監視結果も”失敗”となっている。その時点においてまず”計算機1−1と計算機B1との間のネットワーク異常発生”をシステム運転員に第一報として通知する。さらに、第2の所定時間T2後に、ピングコマンドおよびトレースルートコマンドによる監視結果を総合してチェックがおこわれる。この場合、ピングコマンドは失敗から成功に変化しており、トレースルートコマンド結果は変化がないため、”計算機1−1と計算機B1との間のルート変更なしのネットワーク復帰”と判定し、システム運転員に最終判断結果として通知する。
上記のように構成された実施の形態1のネットワークシステム監視装置によるネットワークシステム監視方式は、大掛かりなネットワーク解析ツールを導入しなくても、また、広域ネットワーク網内において多数のルータをすべてチェックしなくても、計算機間のハローコールデータの監視および、ピングコマンドおよびトレースルートコマンドによる各拠点のルータに限定した監視とを組み合わせ、2種類のタイマにより1次判断と最終判断との2回の判定を実施することで、障害の発生および復帰の検出と、障害が計算機側にあるのかネットワーク側にあるのかを切り分けることが容易にできる。さらに、ネットワーク障害の場合は、ルーティングプロトコル動作で復旧したのか否かを切り分けて、システム運転員に通知することで、システム運転員が容易に故障状況を把握でき、システム運転員の負担が軽減される。ルーティングプロトコル動作にて復旧していない場合、すなわちルート変更なしのネットワーク復帰が頻繁に発生するような場合はシステム自体の異常が起こっている可能性があるため、メンテナンスを行うなど、適当な対応が必要であるということを判断することができる。
実施の形態2.
上記実施の形態1では各拠点A、B、Cに設置されたゲートウェイのルータを1個だけ備える例を示したが、これに限られることはなく、本実施の形態2では各拠点A、B、Cに複数のルータを備え、広域ネットワーク網に対して多重化する場合について述べる。図5はこの発明の実施の形態2におけるネットワークシステム監視装置の構成を示すブロック図である。図において、上記実施の形態1と同様な部分と同一部分は同一符号を付してて説明を省略する。各拠点A、B、Cのゲートウェイ器としてのルータを多重化するために、ルータR1−2、ルータR2−2、ルータR3−2がそれぞれルータR1−1、ルータR2−1、ルータR3−1とは別に設置されている。そしてこの場合には、いずれかのルータが正常(生きていれば)であれば使用できる仮想IPアドレスを用意し、その仮想IPアドレスに対してピングコマンドおよびトレースルートコマンドを実行する。
上記実施の形態1では各拠点A、B、Cに設置されたゲートウェイのルータを1個だけ備える例を示したが、これに限られることはなく、本実施の形態2では各拠点A、B、Cに複数のルータを備え、広域ネットワーク網に対して多重化する場合について述べる。図5はこの発明の実施の形態2におけるネットワークシステム監視装置の構成を示すブロック図である。図において、上記実施の形態1と同様な部分と同一部分は同一符号を付してて説明を省略する。各拠点A、B、Cのゲートウェイ器としてのルータを多重化するために、ルータR1−2、ルータR2−2、ルータR3−2がそれぞれルータR1−1、ルータR2−1、ルータR3−1とは別に設置されている。そしてこの場合には、いずれかのルータが正常(生きていれば)であれば使用できる仮想IPアドレスを用意し、その仮想IPアドレスに対してピングコマンドおよびトレースルートコマンドを実行する。
このように設定することにより、上記実施の形態1と同じ方式で、第2の監視は各拠点において多重化されたルータうちのいずれかのルータが正常であれば各拠点のルータ情報を正常であるという判断を行うことができ、計算機の障害かネットワークの障害かの切り分けを行うことができる。また、仮想IPアドレスを使用しない場合には、多重化されたルータのそれぞれに対してピングコマンドおよびトレースルートコマンドを実行し、ピングコマンドはどちらか一方が成功していれば”成功”とみなし、トレースルートコマンドはどちらも変化しなければ”変化無し”とみなすことで、上記実施の形態1と同じ方式で、障害切り分けを行うことができる。
1−1,A1,A2,B1,B2,C1,C2 計算機、
R1−1,R1−2,R2−1,R2−2,R3−1,R3−2 ルータ。
R1−1,R1−2,R2−1,R2−2,R3−1,R3−2 ルータ。
Claims (8)
- 分散して配置された複数の計算機が広域ネットワーク網にゲートウェイ器を介して接続されて構成された拠点を複数個有するネットワークシステムにおいて、上記各計算機のうち任意の計算機から上記他の各計算機に対して定期的にハローコールデータを送信して受信する第1の監視および上記任意の計算機から上記各ゲートウェイ器に対して定期的にピングコマンドを実施する第2の監視を行い、上記第1の監視により第1の所定時間不通となる計算機が検出されかつ上記第2の監視により上記不通となる計算機の拠点のゲートウェイ器情報が正常であると検出されると上記不通とされた計算機の異常と判断し、上記第1の監視により第1の所定時間不通となる計算機が検出されかつ上記第2の監視により上記不通となる計算機の拠点のゲートウェイ器情報が不通であると検出されると上記任意の計算機から上記不通となる計算機間のネットワークの異常と判断することを特徴とするネットワークシステム監視方式。
- 上記任意の計算機から上記各ゲートウェイ器に対するトレースルートコマンドを定期的に実施する第3の監視を行い、上記ネットワークが異常と判断されてから第2の所定時間内において上記第1の監視により上記不通とされた計算機の正常が検出されると、上記第3の監視により上記不通となる計算機の拠点のゲートウェイ器へのルート変更が検出されずかつ上記第2の監視により上記不通となる計算機の拠点のゲートウェイ器情報が正常であると検出されると上記任意の計算機から上記不通となる計算機間のネットワークはルート変更の伴わない復帰と判断され、上記第3の監視により上記不通となる計算機の拠点のゲートウェイ器へのルート変更が検出されかつ上記第2の監視により上記不通となる計算機の拠点のゲートウェイ器情報が正常であると検出されると上記任意の計算機から上記不通となる計算機間のネットワークはルート変更による復帰と判断されることを特徴とする請求項1に記載のネットワークシステム監視方式。
- 上記第2の所定時間は、上記ネットワークシステムのルーティングプロトコルの収束時間より長い時間にて設定されていることを特徴とする請求項2に記載のネットワークシステム監視方式。
- 上記拠点毎に、分散して配置された上記複数の計算機が上記広域ネットワーク網に対して多重化された複数のゲートウェイ器を介して接続され構成されたネットワークシステムにおいて、上記第2の監視は上記各拠点において多重化されたゲートウェイ器うちのいずれかのゲートウェイ器が正常であれば上記各拠点のゲートウェイ器情報を正常であるとすることを特徴とする請求項1ないし請求項3のいずれかに記載のネットワークシステム監視方式。
- 分散して配置された複数の計算機が広域ネットワーク網にゲートウェイ器を介して接続されて構成された拠点を複数個有するネットワークシステムにおいて、上記各計算機のうち任意の計算機から上記他の各計算機に対して定期的にハローコールデータを送信して受信する第1の監視手段と、上記任意の計算機から上記各ゲートウェイ器に対して定期的にピングコマンドを実施する第2の監視手段と、上記第1の監視手段により第1の所定時間不通となる計算機が検出されかつ上記第2の監視手段により上記不通となる計算機の拠点のゲートウェイ器情報が正常であると検出されると上記不通とされた計算機の異常と判断し、上記第1の監視手段により第1の所定時間不通となる計算機が検出されかつ上記第2の監視手段により上記不通となる計算機の拠点のゲートウェイ器情報が不通であると検出されると上記任意の計算機から上記不通となる計算機間のネットワークの異常と判断する判断手段とを備えたことを特徴とするネットワークシステム監視装置。
- 上記任意の計算機から上記各ゲートウェイ器に対するトレースルートコマンドを定期的に実施する第3の監視手段を備え、上記判断手段は、上記ネットワークが異常と判断されてから第2の所定時間内において上記第1の監視手段により上記不通とされた計算機の正常が検出されると、上記第3の監視手段により上記不通となる計算機の拠点のゲートウェイ器へのルート変更が検出されずかつ上記第2の監視手段により上記不通となる計算機の拠点のゲートウェイ器情報が正常であると検出されると上記任意の計算機から上記不通となる計算機間のネットワークはルート変更の伴わない復帰と判断し、上記第3の監視手段により上記不通となる計算機の拠点のゲートウェイ器へのルート変更が検出されかつ上記第2の監視手段により上記不通となる計算機の拠点のゲートウェイ器情報が正常であると検出されると上記任意の計算機から上記不通となる計算機間のネットワークはルート変更による復帰と判断することを特徴とする請求項5に記載のネットワークシステム監視装置。
- 上記判断手段は、第2の所定時間を上記ネットワークシステムのルーティングプロトコルの収束時間より長い時間にて設定することを特徴とする請求項6に記載のネットワークシステム監視装置。
- 上記拠点毎に、分散して配置された上記複数の計算機が上記広域ネットワーク網に対して多重化された複数のゲートウェイ器を介して接続され構成されたネットワークシステムにおいて、上記第2の監視手段は、上記各拠点において多重化されたゲートウェイ器うちのいずれかのゲートウェイ器が正常であれば上記各拠点のゲートウェイ器情報を正常であるとすることを特徴とする請求項5ないし請求項7のいずれかに記載のネットワークシステム監視装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005140459A JP2006319683A (ja) | 2005-05-13 | 2005-05-13 | ネットワークシステム監視方式およびネットワークシステム監視装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005140459A JP2006319683A (ja) | 2005-05-13 | 2005-05-13 | ネットワークシステム監視方式およびネットワークシステム監視装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006319683A true JP2006319683A (ja) | 2006-11-24 |
Family
ID=37539938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005140459A Pending JP2006319683A (ja) | 2005-05-13 | 2005-05-13 | ネットワークシステム監視方式およびネットワークシステム監視装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006319683A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014017720A1 (ko) * | 2012-07-27 | 2014-01-30 | 주식회사 케이티 | 네트워크 관리 중개 방법 및 시스템 |
WO2014199692A1 (ja) * | 2013-06-10 | 2014-12-18 | 日本電気株式会社 | ネットワーク疎通確認装置、ネットワーク疎通確認方法及びネットワーク疎通確認プログラム |
CN114172825A (zh) * | 2022-01-17 | 2022-03-11 | 福建超智集团有限公司 | 一种网络设备异常检测方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002271371A (ja) * | 2001-03-07 | 2002-09-20 | Nec Corp | ネットワークサーバおよびその制御方法 |
JP2003173299A (ja) * | 2001-12-06 | 2003-06-20 | Mitsubishi Electric Corp | データ受信装置、データ送信装置、データ受信方法及びデータ送信方法 |
-
2005
- 2005-05-13 JP JP2005140459A patent/JP2006319683A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002271371A (ja) * | 2001-03-07 | 2002-09-20 | Nec Corp | ネットワークサーバおよびその制御方法 |
JP2003173299A (ja) * | 2001-12-06 | 2003-06-20 | Mitsubishi Electric Corp | データ受信装置、データ送信装置、データ受信方法及びデータ送信方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014017720A1 (ko) * | 2012-07-27 | 2014-01-30 | 주식회사 케이티 | 네트워크 관리 중개 방법 및 시스템 |
WO2014199692A1 (ja) * | 2013-06-10 | 2014-12-18 | 日本電気株式会社 | ネットワーク疎通確認装置、ネットワーク疎通確認方法及びネットワーク疎通確認プログラム |
JPWO2014199692A1 (ja) * | 2013-06-10 | 2017-02-23 | 日本電気株式会社 | ネットワーク疎通確認装置、ネットワーク疎通確認方法及びネットワーク疎通確認プログラム |
CN114172825A (zh) * | 2022-01-17 | 2022-03-11 | 福建超智集团有限公司 | 一种网络设备异常检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3903437B2 (ja) | クラスタにおける信頼性の高い障害解決 | |
EP3599521B1 (en) | System and method of communicating data over high availability industrial control systems | |
CN112637368B (zh) | 分布式工业数据采集系统及方法 | |
US20090310483A1 (en) | Network device and link switching method | |
CN102387087A (zh) | 基于主动检测技术实现备份路由的方法和系统 | |
JP4544415B2 (ja) | 中継ネットワークシステム、ノード装置、および障害通知方法 | |
JP2013130901A (ja) | 監視サーバおよびそれを用いたネットワーク機器復旧システム | |
JP2006229919A (ja) | 情報処理システム、情報処理装置及びそれらに用いる情報処理方法並びにそのプログラム | |
JP2006319683A (ja) | ネットワークシステム監視方式およびネットワークシステム監視装置 | |
CN108270593B (zh) | 一种双机热备份方法和系统 | |
WO2012070274A1 (ja) | 通信システムおよびネットワーク障害検出方法 | |
JP2005244672A (ja) | ネットワークの障害監視処理システム及び方法 | |
JP2006148376A (ja) | ネットワーク監視システム、ネットワーク上位監視装置、ネットワーク下位監視装置及びネットワーク監視方法 | |
JP3914072B2 (ja) | ネットワーク障害監視方法、通信システムおよび回線切替装置 | |
JP4238834B2 (ja) | ネットワーク管理システムおよびネットワーク管理プログラム | |
JP5045603B2 (ja) | 疎通監視方法、疎通監視システム、管理システム及び外部装置 | |
JP2012075009A (ja) | 冗長化装置及び冗長化プログラム | |
CN109510725B (zh) | 通信设备故障检测系统及方法 | |
JP2008204113A (ja) | ネットワーク監視システム | |
JP4692419B2 (ja) | ネットワーク装置及びそれに用いる冗長切替え方法並びにそのプログラム | |
JP2013121095A (ja) | 通信装置 | |
US11411807B2 (en) | Method and system for detecting and mitigating cabling issues with devices in substation automation systems | |
JP7119957B2 (ja) | スイッチ装置及び障害検知プログラム | |
JP5215337B2 (ja) | リンク制御装置、リンク制御システム、及びリンク制御方法 | |
JP4705904B2 (ja) | ネットワーク監視システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080401 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100126 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100525 |