JP2004229224A - Failure surveillance apparatus, method, and program - Google Patents
Failure surveillance apparatus, method, and program Download PDFInfo
- Publication number
- JP2004229224A JP2004229224A JP2003017725A JP2003017725A JP2004229224A JP 2004229224 A JP2004229224 A JP 2004229224A JP 2003017725 A JP2003017725 A JP 2003017725A JP 2003017725 A JP2003017725 A JP 2003017725A JP 2004229224 A JP2004229224 A JP 2004229224A
- Authority
- JP
- Japan
- Prior art keywords
- routing information
- router
- information
- network
- failure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は障害監視装置、障害監視方法及びプログラムに係り、特に、複数台のルータを含んで構成されたネットワークにおける障害の発生を監視するための障害監視方法、該障害監視方法が適用された障害監視装置、及び、コンピュータを障害監視装置装置として機能させるためのプログラムに関する。
【0002】
【従来の技術】
ネットワークにおける障害の発生を監視し、障害が発生した場合に障害発生箇所を判断するための技術としては、従来より種々の技術が提案されている。
【0003】
具体的には、例えば障害監視コンピュータを設置すると共に、障害監視コンピュータと監視センタ用コンピュータを、ネットワークを介して情報を送受可能とし、障害監視コンピュータがping応答確認により障害を検知した場合に監視センタ用コンピュータへ障害検知信号を送出することで、監視対象ネットワークにおける障害発生等を、遠隔の監視センタで迅速かつ的確に把握することを可能とする技術が提案されている(例えば特許文献1参照)
また、例えば被監視対象のネットワークからネットワークの実構造に関する情報と各ネットワークノードに関する情報を取得し、以前に取得した同情報と比較し、比較結果に基づいて障害を検知する技術も提案されている(例えば特許文献2参照)
【0004】
【特許文献1】
特開2001−298426号公報
【特許文献2】
特開2002−14881号公報
【0005】
【発明が解決しようとする課題】
ところで、複数のローカルエリアネットワーク(LAN)が相互に接続された構成のネットワーク(WAN(Wide Area Network)ともいう)においては、個々のLANの外部から個々のLANへの不正アクセスを防止するために、個々のLANと個々のLANの外部との境界(LANの入口)にファイヤウォールを設けることが一般的であり、このファイヤウォールには、pingコマンド等の監視コマンドによって送出される情報やその応答に相当する情報の通過を遮断する設定がされることも多い。
【0006】
これに対して特許文献1に記載の技術は、監視コマンドを用いてコンピュータに直接アクセスし障害検知を行うものであるので、LANの入口に設けられたファイヤウォールに、監視コマンドを用いることで送受される情報の通過を遮断する設定がされていた場合には、当該LAN内に存在しているコンピュータへのアクセスが拒否されるため、上記構成のネットワークにおける障害の発生を検知することが困難である、という問題があった。
【0007】
また、複数のLANが相互に接続された構成のネットワークでは、個々のLANを単位としてネットワークの管理が行われ、個々のLANのセキュリティ・ポリシーに基づき個々のLANの実構造がネットワーク全体を管理する管理者に公開されていなかったり、コンピュータの追加等のLANの実構造の変化があった場合にも前記管理者への報告が行われないことも多く、管理者がネットワークの個々のLAN内の実構造を把握していないネットワークも多数存在している。このようなネットワークにおいても、障害の発生に伴って当該ネットワークを利用して為される業務に支障が生じた等の場合、管理者は障害発生箇所を特定して対策を講ずる必要があるが、特許文献2に記載の技術はネットワークの実構造が既知であることを前提とした技術であり、当該技術を適用したとしても、実構造が不明な部分が存在するネットワークにおける障害の発生を検知することは困難であった。
【0008】
本発明は上記事実を考慮して成されたもので、実構造が不明なローカルネットワークを含むネットワークであっても、コンピュータに直接アクセスすることなく当該ネットワークにおける障害の発生を監視できる障害監視装置、障害監視方法及びプログラムを得ることが目的である。
【0009】
【課題を解決するための手段】
上記目的を達成するために請求項1記載の発明に係る障害監視装置は、通信回線を介して相互に接続された複数台のルータを含んで構成され、各ルータが、所定の宛先へ送達されるべき情報を受信した場合の当該情報の送信先を表すルーティング情報を各宛先毎に記憶し、受信した情報を、該情報の宛先に対応するルーティング情報に従って送信先を選択して送信すると共に、ネットワークの状態に応じて記憶しているルーティング情報を適宜更新する機能を備えているネットワークに接続され、当該ネットワークにおける障害の発生を監視する障害監視装置であって、特定のルータからルーティング情報を取得する取得手段と、前記特定のルータに本来記憶されているべきルーティング情報が予め登録された記憶手段と、前記取得手段によって取得されたルーティング情報を、前記記憶手段に登録されているルーティング情報と比較することで、前記ネットワークにおける障害発生の有無及び障害発生箇所を判断する判断手段と、を含んで構成されている。
【0010】
請求項1記載の発明に係るネットワークは、通信回線を介して相互に接続された複数台のルータを含んで構成されており、各ルータは、所定の宛先へ送達されるべき情報を受信した場合の当該情報の送信先を表すルーティング情報を各宛先毎に記憶し、受信した情報を、該情報の宛先に対応するルーティング情報に従って送信先を選択して送信すると共に、ネットワークの状態に応じて記憶しているルーティング情報を適宜更新する機能を備えている。請求項1記載の発明に係る障害監視装置は上記構成のネットワークに接続されている。
【0011】
ルータの上述した機能は一般に動的ルーティングと称され(ダイナミック・ルーティングともいう)、ルータによるネットワークの状態に応じたルーティング情報の更新は、具体的には、例えば請求項2に記載したように、各ルータは、自ルータが記憶しているルーティング情報に含まれる何れかの送信先と通信不能状態になった場合に自ルータのルーティング情報を更新する(例えば自ルータと通信不能状態になった送信先に対応する情報(前記送信先を通る通信経路に対応する情報)を削除又は無効化する)と共に、隣り合う他ルータと相互にルーティング情報を通知し、他ルータから通知されたルーティング情報に変化が有った場合にも該変化に応じて自ルータのルーティング情報を更新する(例えば上記と同様に、他ルータのルーティング情報上で削除又は無効化されている情報に対応する情報(他ルータと通信不能状態になった送信先に対応する情報(前記送信先を通る通信経路に対応する情報)を削除又は無効化する)ことによって行うことができる。
【0012】
上述した機能(動的ルーティングの機能)を備えたルータを含んで構成されたネットワークにおいては、障害発生を含むネットワークの状態に応じて、ルータに記憶されているルーティング情報の内容が変化する。また、本発明に係るネットワークが、実構造が不明なローカルネットワーク(例えば請求項3に記載したように、障害監視のために必要な情報の送受を遮断するファイヤウォールを介して接続されたローカルネットワーク)を含んで構成されている場合にも、ルータのルーティング情報には、ローカルネットワーク外の他のコンピュータ(外部コンピュータ)と情報の送受を行うローカルネットワーク内のコンピュータに関する情報(当該コンピュータへ送達されるべき情報を受信した場合の当該情報の送信先を表す情報)も含まれているので、当該コンピュータと外部コンピュータと情報の送受に影響を与える障害が発生すれば、ルーティング情報のうち当該コンピュータに関する情報も変化することになり、障害発生箇所がローカルネットワーク内であったとしてもルーティング情報の変化に基づいて障害発生箇所を判断することは可能である。
【0013】
上記事実に基づき請求項1記載の発明では、特定のルータに本来記憶されているべきルーティング情報が記憶手段に予め登録されており、取得手段によって特定のルータからルーティング情報が取得される。そして判断手段は、取得手段によって取得されたルーティング情報を、記憶手段に登録されているルーティング情報と比較することで、ネットワークにおける障害発生の有無及び障害発生箇所を判断する。なお、障害発生箇所の判断には、障害発生箇所を特定する以外に、障害発生箇所を絞り込むことも含まれる。
【0014】
このように、請求項1記載の発明では、ルータのルーティング情報を利用して障害発生の有無及び障害発生箇所を判断するので、実構造が不明なローカルネットワークを含むネットワークであっても適用可能であり、コンピュータに直接アクセスする必要もないので、コンピュータへの直接アクセス(障害監視のために必要な情報の送受)を遮断するファイヤウォール等が設けられている場合にも、この影響を受けることはない。従って、請求項1記載の発明によれば、実構造が不明なローカルネットワークを含むネットワークであっても、コンピュータに直接アクセスすることなく当該ネットワークにおける障害の発生を監視することができる。
【0015】
なお、請求項1記載の発明に係る記憶手段には、特定のルータに本来記憶されているべきルーティング情報の全てを登録することに限られるものではない。例えば、ネットワーク内の特定コンピュータ間の通信に影響を与える障害についてのみ発生を監視する等のように、障害発生の監視対象が限られている場合には、監視対象に対応するルーティング情報のみを登録しておくようにしてもよい。この場合、障害発生の有無及び障害発生箇所の判断は、例えば後述する請求項4のように、記憶手段に登録されているルーティング情報に含まれる各宛先毎の送信先が、取得手段によって取得されたルーティング情報の中に各々存在しているか否かを判断することで行えばよい。
【0016】
また、本発明に係る取得手段は、特定の単一のルータからルーティング情報を取得するようにしてもよいし、ネットワーク内の全てのルータからルーティング情報を取得するようにしてもよいが、ルーティング情報に基づく障害発生箇所の判断では、ルーティング情報を取得したルータと障害発生箇所の位置関係に応じて判断精度が相違する場合があり、障害発生箇所に近いルータからルーティング情報を取得する方が判断精度が向上することが多い。
【0017】
このため、本発明に係るネットワークが、障害監視のために必要な情報の送受を遮断するファイヤウォールを介して接続されたローカルネットワークを含んで構成されている場合には、請求項3に記載したように、少なくとも、ファイヤウォールよりも障害監視装置側でかつファイヤウォールから最も近い位置(ファイヤウォールとの間の通信経路上に別のルータが存在していない位置)に位置しているルータのルーティング情報を取得することが好ましい。上記構成のネットワークにおいて、ローカルネットワーク内で障害が発生した場合には、障害発生箇所の判断精度が低下する可能性が高いが、請求項3記載の発明では、少なくともファイヤウォールから最も近い位置に位置しているルータからルーティング情報を取得するので、ローカルネットワーク内で障害が発生した場合にも障害発生箇所を精度良く判断することができる。
【0018】
また、請求項1記載の発明において、判断手段による障害発生の有無及び障害発生箇所の判断は、具体的には、例えば請求項4に記載したように、記憶手段に登録されているルーティング情報に含まれる各宛先毎の送信先が、取得手段によって取得されたルーティング情報の中に各々存在しているか否かを判断することで行うことができる。この場合、記憶手段に登録されているルーティング情報に含まれる各宛先毎の送信先の中に、取得手段によって取得されたルーティング情報の中に存在していない情報があれば、何らかの障害が発生していると判断できると共に、当該情報から障害発生箇所を判断できるので、障害発生の有無及び障害発生箇所の判断を簡易な処理で実現することができる。
【0019】
また、特定の通信回線に障害が発生した場合、ルータに記憶されているルーティング情報のうち、特定の通信回線を経由する通信経路に対応する送信先は全て削除、或いは無効化されることになるが、通信回線は障害の発生に備えて多重化されていることが一般的であり、特定の通信回線に障害が発生したとしても、特定の宛先に対応する一部の送信先(特定の通信回線を経由しない通信経路に対応する送信先)がルーティング情報に残存(単に残存、或いは有効な送信先として残存)していることも多い。そして、この場合は特定の宛先への情報送信は可能である。
【0020】
上記に基づき請求項5記載の発明は、請求項4記載の発明において、判断手段は、取得手段によって取得されたルーティング情報上で、対応する送信先の数が減少している特定の宛先が存在していることを認識した場合に、取得手段によって取得されたルーティング情報の中に特定の宛先に対応する送信先が残存していれば警告を発し、取得手段によって取得されたルーティング情報の中に特定の宛先に対応する送信先が残存していなければ障害の発生を報知することを特徴としている。
【0021】
請求項5記載の発明では、取得されたルーティング情報の中に特定の宛先に対応する送信先が残存(単に残存、或いは有効な送信先として残存)している場合、すなわち特定の宛先への情報送信が可能な場合には警告を発し、取得されたルーティング情報の中に特定の宛先に対応する送信先が残存(単に残存、或いは有効な送信先として残存)していない場合、すなわち特定の宛先への情報送信が不可能な場合は障害の発生を報知するので、ネットワークに発生した障害の程度をネットワークの管理者等に容易に認識させることができる。
【0022】
また、請求項1記載の発明において、例えば請求項6に記載したように、取得手段はルーティング情報の取得を定期的に(例えば数秒〜数分周期で)行い、判断手段はネットワークにおける障害発生の有無及び障害発生箇所を定期的に(例えば数秒〜数分周期で)判断することが好ましい。これにより、ネットワークに障害が発生した場合に、これを迅速に検知し、障害発生箇所を速やかに判断することができる。
【0023】
なお、請求項6記載の発明において、取得手段によってルーティング情報を取得するルータを固定せず、ルーティング情報の取得対象のルータを動的に変更又は追加するようにしてもよい。例えば、通常時は特定のルータからルーティング情報を取得し、取得したルーティング情報に基づき障害が発生していることを認識した場合に、別のルータからもルーティング情報を取得し、取得したルーティング情報も勘案して障害発生箇所を判断するようにしてもよい。
【0024】
請求項7記載の発明に係る障害監視方法は、通信回線を介して相互に接続された複数台のルータを含んで構成され、各ルータが、所定の宛先へ送達されるべき情報を受信した場合の当該情報の送信先を表すルーティング情報を各宛先毎に記憶し、受信した情報を、該情報の宛先に対応するルーティング情報に従って送信先を選択して送信すると共に、ネットワークの状態に応じて記憶しているルーティング情報を適宜更新する機能を備えているネットワークにおいて、ルーティング情報取得対象の特定のルータに本来記憶されているべきルーティング情報を予め登録しておき、前記特定のルータからルーティング情報を取得し、取得したルーティング情報を、前記予め登録したルーティング情報と比較することで、前記ネットワークにおける障害発生の有無及び障害発生箇所を判断するので、請求項1記載の発明と同様に、実構造が不明なローカルネットワークを含むネットワークであっても、コンピュータに直接アクセスすることなく当該ネットワークにおける障害の発生を監視することができる。
【0025】
請求項8記載の発明に係るプログラムは、通信回線を介して相互に接続された複数台のルータを含んで構成され、各ルータが、所定の宛先へ送達されるべき情報を受信した場合の当該情報の送信先を表すルーティング情報を各宛先毎に記憶し、受信した情報を、該情報の宛先に対応するルーティング情報に従って送信先を選択して送信すると共に、ネットワークの状態に応じて記憶しているルーティング情報を適宜更新する機能を備えているネットワークに接続されたコンピュータを、特定のルータからルーティング情報を取得する取得手段、前記取得手段によって取得されたルーティング情報を、前記特定のルータに本来記憶されているべき予め登録されたルーティング情報と比較することで、前記ネットワークにおける障害発生の有無及び障害発生箇所を判断する判断手段として機能させる。
【0026】
請求項8記載の発明に係るプログラムは、コンピュータを、上記の取得手段、判断手段として機能させるためのプログラムであるので、コンピュータが請求項8記載の発明に係るプログラムを実行することにより、コンピュータが請求項1に記載の障害監視装置として機能することになり、請求項1及び請求項7記載の発明と同様に、実構造が不明なローカルネットワークを含むネットワークであっても、コンピュータに直接アクセスすることなく当該ネットワークにおける障害の発生を監視することができる。
【0027】
【発明の実施の形態】
以下、図面を参照して本発明の実施形態の一例を詳細に説明する。図1には本実施形態に係るコンピュータ・ネットワーク10が示されている。このコンピュータ・ネットワーク10は金融機関の各種業務を支援するために設置されたネットワークであり、詳しくは、各々金融機関の支店が設けられた複数の拠点(図1では例として拠点A〜拠点D)に各々設置されたローカルエリア・ネットワーク(LAN)12が通信網14を介して互いに接続されて構成されている。なお、このLAN12は請求項3に記載のローカルネットワークに対応している。
【0028】
個々の拠点に設置されているLAN12は類似の構成であるので、以下、拠点Aに設置されたLAN12Aを例に構成を説明すると、LAN12Aは複数台のサーバ・コンピュータ16(図1のLAN12Aではサーバ・コンピュータ16A〜16Fを示す)を含んで構成されている。個々のサーバ・コンピュータ16には、金融機関の特定の業務を支援するためのアプリケーション・プログラムが各々インストールされており、当該アプリケーション・プログラムを実行することで、対応する特定業務を支援するアプリケーション処理を行う。
【0029】
本実施形態において、金融機関の個々の業務の支援は各々複数台のサーバ・コンピュータ16(が実行するアプリケーション処理)によって実現され、同一の業務を支援するアプリケーション処理を実行するサーバ・コンピュータ16同士が通信媒体18を介して相互に接続されている。例として、図1のLAN12Aでは、サーバ・コンピュータ16A,16Bが通信媒体18Aを介して相互に接続され、サーバ・コンピュータ16C,16Dが通信媒体18Bを介して相互に接続され、サーバ・コンピュータ16E,16Fが通信媒体18Cを介して相互に接続されている。
【0030】
また、同一の業務を支援するアプリケーション処理を実行するサーバ・コンピュータ16同士を相互に接続する個々の通信媒体18には、各々ルータ(以下、業務ルータと称する)20が接続されており(図1のLAN12Aでは業務ルータ20A〜20Cを示す)、これらの業務ルータ20は通信媒体22を介して相互に接続されている。通信媒体22には、各々ファイヤウォールとして機能する2台のルータ(以下、F/Wルータと称する)24A,24Bが各々接続されている、F/Wルータ24A,24BはLAN12の入口に相当し、通信媒体26A及び通信媒体26Bを介して相互に接続されている。
【0031】
また、個々のLAN12には、個々のLANに対応して各々2台のルータ(以下、バックボーン・ルータと称する)28A,28Bが設けられており、このバックボーン・ルータ28A,28Bは通信媒体26A及び通信媒体26Bに各々接続されている。従って、個々のLAN12のF/Wルータ24と個々のLAN12に対応するバックボーン・ルータ28との間には、バックボーン・ルータ28A⇔F/Wルータ24A、バックボーン・ルータ28A⇔F/Wルータ24B、バックボーン・ルータ28B⇔F/Wルータ24A、バックボーン・ルータ28B⇔F/Wルータ24Bの4つの通信経路が設けられており、通信経路が多重化されている。バックボーン・ルータ28A,28Bは通信回線を介して通信網14に接続されている。
【0032】
業務ルータ20、F/Wルータ24及びバックボーン・ルータ28は互いに類似の構成であり、バックボーン・ルータ28Aを例にその構成を説明すると、バックボーン・ルータ28AはCPU30及び不揮発性メモリ32を内蔵しており、不揮発性メモリ32には外部から受信した情報の送信先を表すルーティング情報34(詳細は後述)が記憶されている。また、不揮発性メモリ32にはCPU30が実行するための所定のプログラムも記憶されており、CPU30が所定のプログラムを実行することで、CPU30は、外部から情報を受信したか否かを監視し、外部から情報を受信すると受信した情報の宛先に基づきルーティング情報34を参照することで送信先を判断し、受信した情報を判断した送信先へ送信すると共に、ネットワークの状態の変化に応じてルーティング情報を適宜更新する処理を行う(動的ルーティング)。
【0033】
また、F/Wルータ24の不揮発性メモリ32には、F/Wルータ24を通過することを阻止すべき情報を規定する規定情報も記憶されており、F/Wルータ24では、外部から受信した情報が前記規定情報に規定された情報(通過を阻止すべき情報)であった場合に、受信した情報を破棄するフィルタリング処理(ファイヤウォールに相当する処理)も行われる。F/Wルータ24は個々のLAN12の入口に相当し、個々のLAN12の入口でF/Wルータ24が上記のフィルタリング処理を行うことで、個々のLAN12内のサーバ・コンピュータ16等の各コンピュータが外部から不正にアクセスされることを防止することができる。F/Wルータ24は請求項3に記載のファイヤウォールに対応している。
【0034】
ところで、LAN12Aの通信媒体18Aには、本発明に係る障害監視装置に相当する障害監視端末36が接続されている。障害監視端末36はパーソナル・コンピュータ(PC)等から成り、CPU36A、ROM36B、RAM36C、入出力ポート36Dを備え、これらはアドレスバス、データバス、制御バス等のバス36Eを介して互いに接続されている。入出力ポート36Dには、CRT又はLCDから成るディスプレイ38、マウス40、キーボード42、ハードディスク装置(HDD)44、通信制御装置46が各々接続されている。通信制御装置46は通信媒体18Aに接続されており、障害監視端末36は、ルーティング情報収集対象のルータ(後述)と通信媒体18A等を介して通信可能とされている。
【0035】
また、障害監視端末36のHDD44には、CPU36Aが障害監視処理(詳細は後述)を行うための障害監視プログラムが予めインストールされている。この障害監視プログラムは請求項8に記載のプログラムに対応しており、CPU36Aが障害監視プログラムを実行することで、障害監視端末36が本発明に係る障害監視装置として機能することになる。
【0036】
更に、HDD44には、ルーティング情報取得対象の複数のルータ(詳細は後述)の不揮発性メモリ32に本来記憶されているべきルーティング情報(コンピュータ・ネットワーク10に何ら障害が発生していない状態で記憶されているべきルーティング情報)が予め登録された登録テーブル48も記憶されている。なお、HDD44は本発明に係る記憶手段に対応している。この登録テーブル48に登録されているルーティング情報は、例えばコンピュータ・ネットワーク10の全体を管理する管理者により、キーボード42等を介して障害監視端末36へ入力される。
【0037】
なお、登録テーブル48には、ルータの不揮発性メモリ32に記憶されるルーティング情報を全て登録することに限られるものではなく、コンピュータ・ネットワーク10内の各コンピュータのうち、例えば金融機関の特定業務を支援するコンピュータ間の通信に影響を与える障害についてのみ発生を監視する等のように、障害発生の監視対象が限られている場合には、監視対象に対応するルーティング情報のみが登録される。
【0038】
次に本実施形態の作用として、まず各ルータにおけるルーティング情報の更新(動的ルーティング)について、図2を参照し、具体例を挙げて説明する。なお、図2では説明を簡単にするために、ルータa〜dの4台のルータが設けられ、コンピュータAが接続されたルータaがルータb及びルータcに各々接続されると共に、コンピュータBが接続されたルータdもルータb及びルータcに各々接続され、コンピュータA,Bが相互に情報を送受する構成のネットワークが示されている。
【0039】
上記構成のネットワークにおいて、ネットワークに何ら障害が発生していない通常時には、ルータa〜ルータdに、特定の宛先(コンピュータA又はコンピュータB)へ送達されるべき情報を個々のルータが受信した場合の当該情報の全ての送信先が各宛先(コンピュータA,B)について各々設定されたルーティング情報が各々記憶されている(図2(A)参照)。
【0040】
すなわち、例えばルータaにおいて、コンピュータBを宛先とする情報を受信した場合に、当該情報のコンピュータBへの送達に利用可能な通信経路(情報の伝達経路)としては「ルータa→ルータb→ルータd→コンピュータB」という通信経路と、「ルータa→ルータc→ルータd→コンピュータB」という通信経路が存在している。このため、ルータaに記憶されているルーティング情報は、コンピュータBを宛先とする情報の送信先として、上記の2種類の通信経路に対応する送信先である「ルータb」及び「ルータc」が設定されている。
【0041】
また、例えばルータbにおいて、コンピュータAを宛先とする情報を受信した場合に、当該情報のコンピュータAへの送達に利用可能な通信経路としては「ルータb→ルータa→コンピュータA」という通信経路と、「ルータb→ルータd→ルータc→ルータa→コンピュータA」という通信経路が存在している。このため、ルータbに記憶されているルーティング情報は、コンピュータAを宛先とする情報の送信先として、上記の2種類の通信経路に対応する送信先である「ルータa」及び「ルータd」が設定されている。
【0042】
また、各ルータは、自ルータが記憶しているルーティング情報に含まれる何れかの送信先と通信不能状態になったか否か、及び、以前に通信不能状態になっていた特定の送信先との通信不能状態が解消したか(通信可能状態になったか)否かを監視し、通信不能状態になるか又は通信不能状態が解消したことを検知した場合に、自ルータのルーティング情報を検知した事象に応じて更新すると共に、自ルータのルーティング情報を隣り合うルータと適宜相互に通知し、通知されたルーティング情報に変化がある(この変化も、隣り合うルータと任意の送信先が通信不能状態になるか、又は任意の送信先との通信不能状態が解消することによって生ずる)ことを検知した場合には、検知した変化に応じて自ルータのルーティング情報を更新する処理(動的ルーティング)を行う。
【0043】
具体的には、例えば図2(B)に示すようにルータaとルータbの間の通信回線に障害が発生し、ルータaとルータbが通信不能状態となり、前記通信回線を経由する通信経路が使用不可の状態となった場合、上記通信不能状態がルータa,bによって各々検知され、ルータaにおいては、ルータaのルーティング情報に設定されている各送信先のうち、通信不能状態となった送信先の情報(コンピュータBを宛先とする情報の送信先の1つである「ルータb」)が無効化されると共に、ルータbにおいては、ルータbのルーティング情報に設定されている各送信先のうち、通信不能状態となった送信先の情報(コンピュータAを宛先とする情報の送信先の1つである「ルータa」、及びコンピュータBを宛先とする情報の送信先の1つである「ルータa」)が無効化される。
【0044】
更に、ルータa,bが隣り合うルータ(ルータc,d)とルーティング情報を相互に通知することで、ルータcにおいても、ルータcのルーティング情報に設定されている各送信先のうち、通信不能状態となっている通信回線を経由する通信経路に対応する送信先の情報(コンピュータAを宛先とする情報の送信先の1つである「ルータd」及びコンピュータBを宛先とする情報の送信先の1つである「ルータa」)が無効化され、ルータdにおいても、ルータdのルーティング情報に設定されている各送信先のうち、通信不能状態となっている通信回線を経由する通信経路に対応する送信先の情報(コンピュータAを宛先とする情報の送信先の1つである「ルータb」)が無効化される。このようにして、ルータaとルータbの間の通信不能状態(通信回線の障害)に応じて各ルータのルーティング情報が各々更新されることになる。
【0045】
また、例えば図2(C)に示すようにルータdとコンピュータBの間の通信回線に障害が発生するか、又はコンピュータBに障害が発生することで、ルータdとコンピュータBの間が通信不能状態になった場合、この通信不能状態の発生がルータdによって検知され、ルータdにおいて、ルータdのルーティング情報に設定されている各送信先のうち、コンピュータBを宛先とする情報の送信先である「コンピュータB」が無効化される。
【0046】
また、ルータdが隣り合うルータc,dとルーティング情報を相互に通知し、ルータc,dがルータaとルーティング情報を相互に通知することで、ルータcにおいても、ルータcのルーティング情報に設定されている各送信先のうち、コンピュータBを宛先とする情報の送信先である「ルータd」及び「ルータa」が各々無効化され、ルータdにおいても、ルータdのルーティング情報に設定されている各送信先のうち、コンピュータBを宛先とする情報の送信先である「ルータd」及び「ルータa」が各々無効化され、ルータaにおいても、ルータaのルーティング情報に設定されている各送信先のうち、コンピュータBを宛先とする情報の送信先である「ルータb」及び「ルータc」が各々無効化される。このようにして、ルータdとコンピュータBの間の通信回線、又はコンピュータBの障害に伴うルータdとコンピュータBの通信不能状態に応じて各ルータのルーティング情報が各々更新されることになる。このように、本実施形態に係る各ルータは、詳しくは請求項2に記載のルータに対応している。
【0047】
なお、以前に発生していた障害が復旧し、各ルータがこれを検知した場合にも各ルータのルーティング情報が各々更新され、詳しくは、無効化されていた対応する情報が有効化される。また、隣り合うルータとのルーティング情報の相互通知には、定期的(例えば30秒周期)に行う方式と、ルーティング情報の変化が生じた場合(ルーティング情報を更新した場合)にルーティング情報の差分(変化分)のみを相互に通知する方式があるが、何れの方式を採用してもよい。
【0048】
続いて、障害監視端末36のCPU36Aが障害監視プログラムを実行することで実現される障害監視処理について、図3のフローチャートを参照して説明する。なお、以下で説明する障害監視処理は、本発明に係る障害監視方法が適用された処理であり、障害監視端末36によって所定周期で繰り返し実行される。
【0049】
本実施形態では、ルーティング情報取得対象のルータが予め複数定められており、ステップ100では、ルーティング情報取得対象の複数のルータの中から、以下で説明する処理を実行していない単一のルータを選択し、選択したルータに対してリモートログインをするための情報を送信することで、当該ルータへのリモートログインを試行する。
【0050】
本実施形態では、各LAN12に対応して設けられた全てのバックボーン・ルータ28A,28B(LAN12Aの入口に設けられたF/Wルータ24から最も近い位置に位置しているバックボーン・ルータ28A,28B、及び、LAN12B〜12Dの入口に設けられたF/Wルータ24よりも障害監視端末側でかつ前記F/Wルータ24から最も近い位置に位置しているバックボーン・ルータ28A,28B)をルーティング情報取得対象のルータとしており、ステップ100でルーティング情報取得対象のバックボーン・ルータ28へ送信された情報は、F/Wルータ24のファイヤウォール機能により破棄されることなくバックボーン・ルータ28で受信される。
【0051】
次のステップ102では、リモートログインのための情報を送信したバックボーン・ルータ28(ルーティング情報取得対象のバックボーン・ルータ28)から正常応答に相当する情報を受信したか否かを判断することで、ルーティング情報取得対象のバックボーン・ルータ28へのログインに成功したか否かを判定する。上記判定が否定された場合は、ルーティング情報取得対象のバックボーン・ルータ28自体に障害が発生していると推定できるため、ステップ104において、ルーティング情報取得対象のバックボーン・ルータ28に障害が発生していることを通知するメッセージを出力する(例えば前記メッセージをディスプレイ38に表示させる)ことで、当該バックボーン・ルータ28の障害発生を管理者等へ通知し、ステップ100へ戻る。
【0052】
一方、ステップ102の判定が肯定された場合はステップ106へ移行し、ログインしたバックボーン・ルータ28に対してルーティング情報の送信を要求し、この要求に従いバックボーン・ルータ28によって不揮発性メモリ32から読み出されて送信されたルーティング情報を受信することで、ログインしたバックボーン・ルータ28のルーティング情報を取得する。なお、上述したステップ100〜ステップ106は本発明に係る取得手段に相当する処理である。
【0053】
次のステップ108以降は本発明に係る判断手段に相当する処理であり、ステップ108では、HDD44に記憶されている登録テーブル48からルーティング情報収集対象のバックボーン・ルータ28に対応するルーティング情報を読み出し、登録テーブル48から読み出したルーティング情報をバックボーン・ルータ28から取得したルーティング情報と比較する。そして、ステップ110において、登録テーブル48から読み出したルーティング情報に含まれる各情報が、バックボーン・ルータ28から取得したルーティング情報の中に有効な情報として存在しているか否か判定する。
【0054】
上記の判定が肯定された場合は何ら処理を行うことなくステップ114へ移行するが、上記の判定が否定された場合はコンピュータ・ネットワーク10に障害が発生していると判断できるので、ステップ112へ移行し、登録テーブル48から読み出したルーティング情報に含まれる各情報のうち、バックボーン・ルータ28から取得したルーティング情報では欠落している(有効な情報として存在していない)情報を全て抽出し、RAM36C又はHDD44に記憶させる。
【0055】
なお、コンピュータ・ネットワーク10内の各ルータの動的ルーティングにより、任意のLAN12内で障害が発生した場合にも、各ルータのルーティング情報に変化(一部の情報の欠落)が生ずるので、ステップ112で欠落している情報がRAM36C又はHDD44に記憶されることになる。
【0056】
ステップ114では、バックボーン・ルータ28から取得したルーティング情報を、障害監視処理を前回実行した際にRAM36C又はHDD44に記憶させた対応する欠落情報と比較し、次のステップ116において、当該欠落情報が取得したルーティング情報上で復旧している(有効となっている)か否か、すなわち障害監視処理を前回実行した際に発生していた障害が復旧しているか否かを判定する。判定が否定された場合には何ら処理を行うことなくステップ120へ移行するが、判定が肯定された場合にはステップ118へ移行し、復旧した欠落情報をRAM36C又はHDD44に記憶させる。
【0057】
ステップ120では、ルーティング情報取得対象の全てのルータからルーティング情報を取得したか否か判定する。判定が否定された場合にはステップ100に戻り、ステップ100〜ステップ120を繰り返す。これにより、ルーティング情報取得対象の全てのルータからルーティング情報が取得され、登録テーブル48から読み出したルーティング情報に含まれる各情報のうち取得したルーティング情報では欠落している情報が有れば、該情報が欠落情報として記憶され、前回の障害監視処理で記憶していた欠落情報のうち取得したルーティング情報上で復旧している情報が有れば、該情報が復旧した欠落情報として記憶されることになる。
【0058】
ステップ120の判定が肯定されるとステップ122へ移行し、RAM36C又はHDD44に記憶されている欠落情報(先のステップ112で記憶された欠落情報)が有るか否か判定する。ステップ122の判定が否定された場合には、コンピュータ・ネットワーク10には何ら障害が発生していない(又は監視対象の障害は発生していない)と判断できるので、何ら処理を行うことなくステップ132へ移行する。
【0059】
一方、ステップ122の判定が肯定された場合には、コンピュータ・ネットワーク10に何らかの障害が発生していると判断できるので、ステップ124へ移行し、RAM36C又はHDD44に記憶されている欠落情報に基づいて障害発生箇所を特定する。なお、LAN12内で障害が発生した場合にも各ルータのルーティング情報に変化(一部の情報の欠落)が生ずることで障害の発生を検知できると共に、各LAN12の入口に設けられたF/Wルータ24から最も近い位置に位置しているバックボーン・ルータ28からルーティング情報を取得しているので、特定のLAN12内で障害が発生した場合にも、例えば特定のLAN12内で障害が発生している、等のように、障害発生箇所を精度良く絞り込む(おおよそ特定する)ことができる。
【0060】
そして、次のステップ126では、ステップ124で特定した障害発生箇所に基づいて、コンピュータ・ネットワーク10の中に通信不能となっている区間が存在しているか否か判定する。例えば個々のLAN12に対応するバックボーン・ルータ28とF/Wルータ24の間の区間には、前述のように4つの通信経路が設けられているが、この4つの通信経路の何れも通信不能状態となっている場合(例えば4つの通信経路の何れでも障害が発生している場合、或いはF/Wルータ24A,24Bに各々障害が発生している場合)には、情報の送信元から送信先へ至る通信経路上に当該区間が含まれる情報の送受を行うことは不可能である。なお、このような状態が生ずると、例として図2(C)に示すように、バックボーン・ルータ28より取得したルーティング情報から、特定の宛先に対応する送信先が全て欠落することになる。
【0061】
ステップ124で特定した障害発生箇所に基づき、通信不能状態となっている区間がコンピュータ・ネットワーク10の中に存在していると判断した場合には、ステップ126の判定が肯定されてステップ130へ移行し、通信不能状態となっている区間を明示して重度の障害(通信不能)が生じていることを通知する障害通知メッセージを出力する(例えばディスプレイ38に表示させる)。
【0062】
また、通信不能状態となっている区間がコンピュータ・ネットワーク10の中に存在していないと判断した場合(この場合、図2(B)に示すように、バックボーン・ルータ28より取得したルーティング情報から、特定の宛先に対応する送信先が部分的に欠落するものの、特定の宛先に対応する一部の送信先は残存している)には、ステップ126の判定が否定されてステップ128へ移行し、特定した障害発生箇所を明示して軽度の障害が生じている(通信可能であるものの一部の通信経路が通信不能状態となっている)ことを通知する警告メッセージを出力する(例えばディスプレイ38に表示させる)。
【0063】
これにより、管理者はコンピュータ・ネットワーク10に障害が発生したこと及び障害発生箇所を容易に認識できると共に、発生した障害の程度も容易に認識することができ、発生した障害を復旧させるための対策を講ずることができる。
【0064】
次のステップ132では、RAM36C又はHDD44に記憶されている復旧した欠落情報(先のステップ118で記憶された情報)が有るか否か判定する。判定が否定された場合には障害監視処理を終了するが、判定が肯定された場合にはステップ134へ移行し、RAM36C又はHDD44に記憶されている復旧した欠落情報に基づいて、以前に発生していた障害が復旧したことを通知する復旧メッセージを出力(例えばディスプレイ38に表示させる)した後に、障害監視処理を終了する。これにより、コンピュータ・ネットワーク10に以前に発生していた障害が復旧したことを管理者が認識することができる。
【0065】
上述した障害監視処理は所定周期で繰り返し実行されるので、コンピュータ・ネットワーク10に障害が発生した場合に、これを迅速に検知し、障害発生箇所を速やかに判断して管理者へ通知することができ、コンピュータ・ネットワーク10が、障害が発生している状態で長時間放置されたり、LAN12内で障害が発生していたために障害発生箇所の特定に時間がかかったりすることを回避することができる。
【0066】
また、例えば特定のLAN12内に設けられ特定業務を支援するアプリケーション処理を行う特定のサーバ・コンピュータ16と、特定のLAN12の外部に設けられた特定のコンピュータの間で情報を送受できない異常が発生した場合、特定のコンピュータの側に問題がなく、特定のLAN12の外部に障害が発生していないのであれば、発生した異常の原因としては、「特定のサーバ・コンピュータ16で行われるアプリケーション処理に問題がある(例えばアプリケーション・プログラムのバグ)」又は「特定のLAN12に障害が発生している」が考えられるが、従来の技術ではこの判別ができないという問題があった。これに対し、本実施形態に係るコンピュータ・ネットワーク10では、コンピュータ・ネットワーク10に障害が発生すれば、障害発生箇所がLAN12内であっても障害通知メッセージ又は警告メッセージが出力されるので、コンピュータ・ネットワークが正常か否かを容易に判断することができ、上記の判別も容易に行うことができる。
【0067】
なお、上記では複数台のルータからルーティング情報を収集する例を説明したが、これに限られるものではなく、単一のルータのみからルーティング情報を収集するようにしてもよい。但し、ルーティング情報収集対象のルータに障害が発生してルーティング情報を収集できない事態が生ずる可能性があることを考慮すると、複数台のルータからルーティング情報を収集するか、又は、ルーティング情報収集対象のルータに障害が発生していた場合には他のルータからルーティング情報を収集する(ルーティング情報収集対象のルータを動的に変更する)ことが好ましい。
【0068】
また、上記では本発明に係るネットワークとして、複数のLANが相互に接続されたコンピュータ・ネットワーク10を例に説明したが、これに限定されるものではなく、本発明は任意の構成のネットワークに適用可能であることは言うまでもない。
【0069】
【発明の効果】
以上説明したように本発明は、通信回線を介して相互に接続された複数台のルータを含んで構成され、各ルータが、所定の宛先へ送達されるべき情報を受信した場合の当該情報の送信先を表すルーティング情報を各宛先毎に記憶し、受信した情報を、該情報の宛先に対応するルーティング情報に従って送信先を選択して送信すると共に、ネットワークの状態に応じて記憶しているルーティング情報を適宜更新する機能を備えているネットワークにおいて、特定のルータからルーティング情報を取得し、取得したルーティング情報を、特定のルータに本来記憶されているべきルーティング情報と比較することで、ネットワークにおける障害発生の有無及び障害発生箇所を判断するので、実構造が不明なローカルネットワークを含むネットワークであっても、コンピュータに直接アクセスすることなく当該ネットワークにおける障害の発生を監視できる、という優れた効果を有する。
【図面の簡単な説明】
【図1】本実施形態に係るコンピュータ・ネットワークの概略構成を示すブロック図である。
【図2】ルータによるルーティング情報の更新を説明するための概略図である。
【図3】障害監視端末によって実行される障害監視処理の内容を示すフローチャートである。
【符号の説明】
10 コンピュータ・ネットワーク
12 LAN
16 サーバ・コンピュータ
24 F/Wルータ
28 バックボーン・ルータ
32 不揮発性メモリ
34 ルーティング情報
36 障害監視端末
38 ディスプレイ
44 HDD
48 登録テーブル[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a fault monitoring device, a fault monitoring method, and a program, and more particularly to a fault monitoring method for monitoring the occurrence of a fault in a network including a plurality of routers, and a fault to which the fault monitoring method is applied. The present invention relates to a monitoring device and a program for causing a computer to function as a failure monitoring device.
[0002]
[Prior art]
2. Description of the Related Art Various techniques have been proposed for monitoring the occurrence of a failure in a network and determining the location of the failure when the failure occurs.
[0003]
Specifically, for example, a fault monitoring computer is installed, and the fault monitoring computer and the computer for the monitoring center can transmit and receive information via a network. A technology has been proposed that enables a remote monitoring center to quickly and accurately grasp the occurrence of a failure in a monitored network by transmitting a failure detection signal to a computer for monitoring (for example, see Patent Document 1).
In addition, for example, a technology has been proposed in which information about the actual structure of a network and information about each network node are acquired from a monitored network and compared with the previously acquired information, and a failure is detected based on the comparison result. (For example, see Patent Document 2)
[0004]
[Patent Document 1]
JP 2001-298426 A
[Patent Document 2]
JP-A-2002-14881
[0005]
[Problems to be solved by the invention]
Meanwhile, in a network (also referred to as a WAN (Wide Area Network)) having a configuration in which a plurality of local area networks (LANs) are connected to each other, in order to prevent unauthorized access to each LAN from outside the LAN. Generally, a firewall is provided at the boundary between each LAN and the outside of each LAN (the entrance of the LAN). The firewall transmits information transmitted by a monitoring command such as a ping command and a response thereof. Is often set to block the passage of information corresponding to.
[0006]
On the other hand, the technology described in
[0007]
In a network having a configuration in which a plurality of LANs are connected to each other, network management is performed for each LAN, and the actual structure of each LAN manages the entire network based on the security policy of each LAN. When the actual structure of the LAN is not disclosed to the administrator or when there is a change in the actual structure of the LAN such as addition of a computer, the report to the administrator is often not made. Many networks do not know the actual structure. Even in such a network, in the event that a failure occurs in the work performed using the network due to the occurrence of the failure, the administrator needs to identify the location where the failure has occurred and take measures, The technique described in
[0008]
The present invention has been made in view of the above facts, and has a failure monitoring device and a failure monitoring device that can monitor the occurrence of a failure in a network including a local network whose actual structure is unknown without directly accessing a computer. The purpose is to obtain a monitoring method and a program.
[0009]
[Means for Solving the Problems]
In order to achieve the above object, a fault monitoring apparatus according to the present invention includes a plurality of routers connected to each other via a communication line, and each router is delivered to a predetermined destination. In the case where information to be received is received, routing information indicating a transmission destination of the information is stored for each destination, and the received information is transmitted by selecting a transmission destination according to the routing information corresponding to the destination of the information, A failure monitoring device connected to a network having a function of appropriately updating stored routing information according to the state of the network and monitoring the occurrence of a failure in the network, and acquiring routing information from a specific router Acquiring means for performing routing information that should be originally stored in the specific router; Routing information acquired Te to, by comparing the routing information registered in the storage means is configured to include a determination means for determining whether a failure has occurred and point of failure in the network.
[0010]
The network according to the first aspect of the present invention includes a plurality of routers interconnected via a communication line, and each router receives information to be delivered to a predetermined destination. The routing information indicating the transmission destination of the information is stored for each destination, and the received information is selected and transmitted according to the routing information corresponding to the destination of the information, and stored according to the state of the network. It has a function of appropriately updating the routing information. The fault monitoring device according to the first aspect of the present invention is connected to the network having the above configuration.
[0011]
The above-described function of the router is generally referred to as dynamic routing (also referred to as dynamic routing), and the updating of the routing information by the router in accordance with the state of the network is specifically, for example, as described in
[0012]
In a network including a router having the above-described function (dynamic routing function), the contents of the routing information stored in the router changes according to the state of the network including the occurrence of a failure. Further, the network according to the present invention may be a local network whose actual structure is unknown (for example, a local network connected via a firewall that blocks transmission and reception of information necessary for fault monitoring as described in claim 3). ), The routing information of the router includes information on a computer in the local network that transmits / receives information to / from another computer (external computer) outside the local network (delivered to the computer). Information indicating the transmission destination of the information when the information to be received is received), and if a failure occurs that affects the transmission and reception of the information between the computer and the external computer, the information about the computer in the routing information Will also change, and the location of the failure It is possible to determine the failure location on the basis of also the change of the routing information as was the work.
[0013]
Based on the above fact, according to the first aspect of the present invention, the routing information that should be originally stored in the specific router is registered in the storage unit in advance, and the acquisition unit acquires the routing information from the specific router. Then, the determining unit determines whether or not a failure has occurred and the location of the failure in the network by comparing the routing information acquired by the acquiring unit with the routing information registered in the storage unit. It should be noted that the determination of the failure location includes not only specifying the failure location but also narrowing down the failure location.
[0014]
As described above, according to the first aspect of the present invention, the presence / absence of a failure and the location of the failure are determined using the routing information of the router, so that the invention can be applied to a network including a local network whose actual structure is unknown. Since there is no need to directly access the computer, even if a firewall or the like that blocks direct access to the computer (transmission and reception of information necessary for fault monitoring) is provided, this is not affected. Therefore, according to the first aspect of the invention, even in a network including a local network whose actual structure is unknown, it is possible to monitor the occurrence of a failure in the network without directly accessing the computer.
[0015]
It should be noted that the storage means according to the first aspect of the present invention is not limited to registering all routing information that should be originally stored in a specific router. If the monitoring target of the failure occurrence is limited, for example, monitoring the occurrence of only the failure affecting communication between specific computers in the network, register only the routing information corresponding to the monitoring target. You may do so. In this case, whether or not a failure has occurred and the location of the failure occurrence are determined, for example, as described in
[0016]
Further, the obtaining means according to the present invention may obtain the routing information from a specific single router, or may obtain the routing information from all the routers in the network. When determining the location of a failure based on the location, the accuracy of the determination may differ depending on the positional relationship between the router from which the routing information was acquired and the location of the failure. Is often improved.
[0017]
For this reason, when the network according to the present invention is configured to include a local network connected via a firewall that blocks transmission and reception of information necessary for fault monitoring, the present invention is described in
[0018]
Further, in the invention according to the first aspect, the determination of the presence / absence of the failure and the location of the failure by the determination means is, for example, based on the routing information registered in the storage means as described in the fourth aspect. The determination can be made by determining whether or not the transmission destination for each destination included in the routing information acquired by the acquisition unit is present. In this case, if any of the transmission destinations for each destination included in the routing information registered in the storage means does not exist in the routing information acquired by the acquisition means, some trouble occurs. It is possible to determine that a failure has occurred and to determine the location of the failure from the information, so that the presence / absence of the failure and the determination of the location of the failure can be realized by simple processing.
[0019]
Further, when a failure occurs in a specific communication line, all of the routing information stored in the router corresponding to the communication path passing through the specific communication line are deleted or invalidated. However, communication lines are generally multiplexed in preparation for the occurrence of a failure. Even if a failure occurs in a particular communication line, some transmission destinations corresponding to a particular destination (a particular communication In many cases, a destination corresponding to a communication path that does not pass through a line remains in the routing information (simply remains or remains as an effective destination). In this case, information transmission to a specific destination is possible.
[0020]
According to a fifth aspect of the present invention based on the above, in the fourth aspect of the invention, the determining unit determines that a specific destination having a reduced number of corresponding destinations exists in the routing information acquired by the acquiring unit. When it is recognized that there is a destination corresponding to a specific destination in the routing information acquired by the acquiring unit, a warning is issued, and the routing information acquired by the acquiring unit is included in the routing information acquired by the acquiring unit. If a transmission destination corresponding to a specific destination does not remain, the occurrence of a failure is reported.
[0021]
According to the fifth aspect of the present invention, when a destination corresponding to a specific destination remains (simply remains or remains as a valid destination) in the acquired routing information, that is, information to a specific destination If the transmission is possible, a warning is issued, and if the destination corresponding to the specific destination does not remain in the acquired routing information (simply remains or remains as a valid destination), that is, the specific destination When it is not possible to transmit information to the network, the occurrence of a failure is reported, so that the degree of the failure that has occurred in the network can be easily recognized by a network administrator or the like.
[0022]
Further, in the invention described in
[0023]
In the invention according to claim 6, the router from which the routing information is obtained by the obtaining means may not be fixed, and the router from which the routing information is obtained may be dynamically changed or added. For example, normally, when routing information is acquired from a specific router, and when it is recognized that a failure has occurred based on the acquired routing information, the routing information is acquired from another router, and the acquired routing information is also acquired. The location where the failure occurred may be determined in consideration of the situation.
[0024]
The fault monitoring method according to the invention according to
[0025]
The program according to the invention according to claim 8 is configured to include a plurality of routers connected to each other via a communication line, wherein each router receives information to be delivered to a predetermined destination. The routing information indicating the destination of the information is stored for each destination, and the received information is selected and transmitted according to the routing information corresponding to the destination of the information, and stored according to the state of the network. A computer connected to a network having a function of appropriately updating the routing information stored in an acquisition unit for acquiring routing information from a specific router, and the routing information acquired by the acquisition unit is originally stored in the specific router. By comparing with the pre-registered routing information that should be To function as a determining means for determining the point of failure.
[0026]
Since the program according to the invention of claim 8 is a program for causing a computer to function as the above-described acquisition means and determination means, the computer executes the program according to the invention of claim 8 to execute the program. It functions as the fault monitoring device according to the first aspect, and, similarly to the inventions according to the first and seventh aspects, directly accesses a computer even in a network including a local network whose actual structure is unknown. It is possible to monitor the occurrence of a failure in the network.
[0027]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, an example of an embodiment of the present invention will be described in detail with reference to the drawings. FIG. 1 shows a
[0028]
Since the
[0029]
In the present embodiment, the support of the individual business of the financial institution is realized by a plurality of server computers 16 (application processing executed by each), and the
[0030]
In addition, routers (hereinafter, referred to as business routers) 20 are connected to individual communication media 18 that mutually connect
[0031]
Each
[0032]
The
[0033]
The
[0034]
Incidentally, a
[0035]
In the
[0036]
Further, the
[0037]
Note that the registration table 48 is not limited to registering all the routing information stored in the
[0038]
Next, as an operation of the present embodiment, updating (dynamic routing) of routing information in each router will be described with reference to FIG. 2 and a specific example. In FIG. 2, for the sake of simplicity, four routers a to d are provided. The router a to which the computer A is connected is connected to the router b and the router c, respectively, and the computer B is connected to the router b. A network is shown in which the connected router d is also connected to the router b and the router c, respectively, and the computers A and B mutually transmit and receive information.
[0039]
In the network having the above configuration, in a normal state where no failure occurs in the network, the router a to the router d receive information to be delivered to a specific destination (computer A or computer B) when each router receives the information. Routing information in which all transmission destinations of the information are set for each destination (computers A and B) is stored (see FIG. 2A).
[0040]
That is, for example, when the router a receives information destined for the computer B, the communication path (information transmission path) available for delivering the information to the computer B is “router a → router b → router”. A communication path “d → computer B” and a communication path “router a → router c → router d → computer B” exist. For this reason, the routing information stored in the router a indicates that “router b” and “router c”, which are the destinations corresponding to the above two types of communication paths, are the destinations of the information destined for the computer B. Is set.
[0041]
For example, when the router b receives information addressed to the computer A, the communication path available for delivering the information to the computer A includes a communication path of “router b → router a → computer A”. , A communication path “router b → router d → router c → router a → computer A” exists. For this reason, the routing information stored in the router b includes “router a” and “router d”, which are the destinations corresponding to the above two types of communication paths, as the destination of the information destined for the computer A. Is set.
[0042]
Further, each router determines whether or not any of the destinations included in the routing information stored in the own router has become incommunicable with each other, and determines whether or not the particular destination has been in a previously incommunicable state. An event that monitors whether the communication disabled state has been resolved (communication enabled state) or not and detects the communication disabled state or detects that the communication disabled state has been resolved, and detects the routing information of the own router. In addition, the routing information of the own router is notified to neighboring routers as appropriate, and the notified routing information changes. (This change also causes the neighboring router and any destination to become incapable of communication.) Or when the communication failure with any destination is eliminated), the routing information of the own router is updated in accordance with the detected change. Perform a physical (dynamic routing).
[0043]
Specifically, for example, as shown in FIG. 2B, a failure occurs in the communication line between the router a and the router b, the router a and the router b become incommunicable, and the communication path through the communication line Becomes unavailable, the above communication disabled state is detected by each of the routers a and b. In the router a, among the transmission destinations set in the routing information of the router a, the communication disabled state is set. The information of the transmission destination (“router b”, which is one of the transmission destinations of the information destined for the computer B) is invalidated, and at the router b, each transmission set in the routing information of the router b is set. Among the destinations, the information of the destination in the communication disabled state (“router a”, which is one of the destinations of information destined for computer A, and one of the destinations of information destined for computer B, Ah "Router a") is invalidated.
[0044]
Further, the routers a and b mutually notify the neighboring routers (routers c and d) of the routing information, so that the router c cannot communicate among the destinations set in the routing information of the router c. Destination information corresponding to the communication path via the communication line in the state (“router d”, which is one of the destinations of the information destined for the computer A, and the destination of the information destined for the computer B) "Router a") is invalidated, and the communication route via the communication line in the communication disabled state among the transmission destinations set in the routing information of the router d is also invalidated in the router d. (The "router b", one of the destinations of the information addressed to the computer A) corresponding to the destination is invalidated. In this way, the routing information of each router is updated in accordance with the communication disabled state between the router a and the router b (failure of the communication line).
[0045]
Further, for example, as shown in FIG. 2C, a failure occurs in a communication line between the router d and the computer B, or when a failure occurs in the computer B, communication between the router d and the computer B becomes impossible. In this case, the occurrence of the communication disabled state is detected by the router d, and in the router d, among the destinations set in the routing information of the router d, the destination of the information destined to the computer B is transmitted. A certain “computer B” is invalidated.
[0046]
Also, the router d mutually notifies the neighboring routers c and d of the routing information, and the routers c and d mutually notify the routing information of the router a. Of the destinations specified, "router d" and "router a", which are destinations of information destined for computer B, are respectively invalidated, and router d is set in the routing information of router d. Out of the transmission destinations, the routers “router d” and “router a”, which are the transmission destinations of the information destined for the computer B, are respectively invalidated. Among the transmission destinations, “router b” and “router c”, which are the transmission destinations of the information destined for the computer B, are respectively invalidated. In this way, the routing information of each router is updated in accordance with the communication line between the router d and the computer B or the communication failure state between the router d and the computer B due to the failure of the computer B. As described above, each router according to the present embodiment corresponds to the router described in
[0047]
In addition, when a fault that has occurred previously is recovered and each router detects this, the routing information of each router is updated, and in detail, the corresponding information that has been invalidated is validated. Further, the mutual notification of the routing information between the adjacent routers is performed periodically (for example, every 30 seconds), and when the routing information changes (when the routing information is updated), the difference between the routing information (when the routing information is updated) is determined. There is a method of mutually notifying only the change), but any method may be adopted.
[0048]
Next, a failure monitoring process realized by the
[0049]
In the present embodiment, a plurality of routers for which routing information is to be obtained are determined in advance, and in
[0050]
In the present embodiment, all the
[0051]
In the
[0052]
On the other hand, if the determination in
[0053]
[0054]
If the above determination is affirmed, the process proceeds to step 114 without performing any processing. However, if the above determination is denied, it can be determined that a failure has occurred in the
[0055]
It should be noted that, even if a failure occurs in any
[0056]
In
[0057]
In
[0058]
If the determination in
[0059]
On the other hand, if the determination in
[0060]
Then, in the
[0061]
If it is determined based on the failure location identified in
[0062]
When it is determined that the section in which communication is disabled does not exist in the computer network 10 (in this case, as shown in FIG. 2B, from the routing information acquired from the
[0063]
As a result, the administrator can easily recognize that a failure has occurred in the
[0064]
In the
[0065]
Since the above-described fault monitoring process is repeatedly executed at a predetermined cycle, when a fault occurs in the
[0066]
Further, for example, an abnormality in which information cannot be transmitted and received between a
[0067]
In the above description, an example in which routing information is collected from a plurality of routers has been described. However, the present invention is not limited to this, and routing information may be collected only from a single router. However, considering that there is a possibility that a failure may occur in the routing information collection target router and the routing information cannot be collected, the routing information may be collected from a plurality of routers or the routing information collection target may not be collected. When a failure has occurred in a router, it is preferable to collect routing information from another router (dynamically change the router for which routing information is to be collected).
[0068]
In the above, the
[0069]
【The invention's effect】
As described above, the present invention is configured to include a plurality of routers connected to each other via a communication line, and when each router receives information to be delivered to a predetermined destination, Routing information representing a transmission destination is stored for each destination, and received information is transmitted by selecting a transmission destination according to the routing information corresponding to the destination of the information and storing the received information according to the state of the network. In a network that has a function to update information as needed, it obtains routing information from a specific router and compares the obtained routing information with the routing information that should be stored in the specific router. A network including a local network whose actual structure is unknown because the presence / absence and failure location are determined Even has the excellent effect that can monitor the occurrence of a failure in the network without having to directly access the computer.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a schematic configuration of a computer network according to an embodiment.
FIG. 2 is a schematic diagram for explaining updating of routing information by a router.
FIG. 3 is a flowchart illustrating details of a failure monitoring process executed by the failure monitoring terminal.
[Explanation of symbols]
10. Computer Network
12 LAN
16 server computer
24 F / W router
28 Backbone Router
32 Non-volatile memory
34 routing information
36 Failure monitoring terminal
38 Display
44 HDD
48 Registration Table
Claims (8)
特定のルータからルーティング情報を取得する取得手段と、
前記特定のルータに本来記憶されているべきルーティング情報が予め登録された記憶手段と、
前記取得手段によって取得されたルーティング情報を、前記記憶手段に登録されているルーティング情報と比較することで、前記ネットワークにおける障害発生の有無及び障害発生箇所を判断する判断手段と、
を含む障害監視装置。It is configured to include a plurality of routers connected to each other via a communication line, and when each router receives information to be delivered to a predetermined destination, the router sends routing information indicating a destination of the information to each destination. A function of storing and transmitting received information, selecting a transmission destination according to routing information corresponding to the destination of the information, transmitting the information, and appropriately updating the stored routing information according to the state of the network. A fault monitoring device connected to a network and monitoring the occurrence of a fault in the network,
Obtaining means for obtaining routing information from a specific router;
Storage means in which routing information that should be originally stored in the specific router is registered in advance,
Determining means for determining the presence or absence of a failure and the location of the failure in the network by comparing the routing information obtained by the obtaining means with the routing information registered in the storage means;
Fault monitoring device including.
前記取得手段は、少なくとも、前記ファイヤウォールよりも障害監視装置側でかつ前記ファイヤウォールから最も近い位置に位置しているルータのルーティング情報を取得することを特徴とする請求項1記載の障害監視装置。The network is configured to include a local network connected via a firewall that blocks transmission and reception of information necessary for fault monitoring,
2. The fault monitoring device according to claim 1, wherein the obtaining unit obtains at least routing information of a router located closer to the fault monitoring device than the firewall and closest to the firewall. .
ルーティング情報取得対象の特定のルータに本来記憶されているべきルーティング情報を予め登録しておき、
前記特定のルータからルーティング情報を取得し、
取得したルーティング情報を、前記予め登録したルーティング情報と比較することで、前記ネットワークにおける障害発生の有無及び障害発生箇所を判断する
障害監視方法。It is configured to include a plurality of routers connected to each other via a communication line, and when each router receives information to be delivered to a predetermined destination, the router sends routing information indicating a destination of the information to each destination. A function of storing and transmitting received information, selecting a transmission destination according to routing information corresponding to the destination of the information, transmitting the information, and appropriately updating the stored routing information according to the state of the network. Network
Register the routing information that should be originally stored in the specific router for which the routing information is to be acquired, in advance,
Obtaining routing information from the specific router,
A failure monitoring method for comparing the acquired routing information with the pre-registered routing information to determine the presence / absence of a failure and the location of the failure in the network.
特定のルータからルーティング情報を取得する取得手段、
前記取得手段によって取得されたルーティング情報を、前記特定のルータに本来記憶されているべき予め登録されたルーティング情報と比較することで、前記ネットワークにおける障害発生の有無及び障害発生箇所を判断する判断手段
として機能させるためのプログラム。It is configured to include a plurality of routers connected to each other via a communication line, and when each router receives information to be delivered to a predetermined destination, the router sends routing information indicating a destination of the information to each destination. A function of storing and transmitting received information, selecting a transmission destination according to routing information corresponding to the destination of the information, transmitting the information, and appropriately updating the stored routing information according to the state of the network. Computers connected to the network
Acquisition means for acquiring routing information from a specific router,
Determining means for determining whether or not a failure has occurred and a failure occurrence location in the network by comparing the routing information obtained by the obtaining means with pre-registered routing information which should be originally stored in the specific router; Program to function as.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003017725A JP2004229224A (en) | 2003-01-27 | 2003-01-27 | Failure surveillance apparatus, method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003017725A JP2004229224A (en) | 2003-01-27 | 2003-01-27 | Failure surveillance apparatus, method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004229224A true JP2004229224A (en) | 2004-08-12 |
Family
ID=32904809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003017725A Pending JP2004229224A (en) | 2003-01-27 | 2003-01-27 | Failure surveillance apparatus, method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004229224A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009239592A (en) * | 2008-03-27 | 2009-10-15 | Bank Of Tokyo-Mitsubishi Ufj Ltd | Failure monitoring apparatus, method and program |
-
2003
- 2003-01-27 JP JP2003017725A patent/JP2004229224A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009239592A (en) * | 2008-03-27 | 2009-10-15 | Bank Of Tokyo-Mitsubishi Ufj Ltd | Failure monitoring apparatus, method and program |
JP4505518B2 (en) * | 2008-03-27 | 2010-07-21 | 株式会社三菱東京Ufj銀行 | Fault monitoring apparatus, method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8224761B1 (en) | System and method for interactive correlation rule design in a network security system | |
CN1946077B (en) | System and method for detecting abnormal traffic based on early notification | |
JP2004021549A (en) | Network monitoring system and program | |
CN114006723B (en) | Network security prediction method, device and system based on threat information | |
CN111030873A (en) | Fault diagnosis method and device | |
US8131871B2 (en) | Method and system for the automatic reroute of data over a local area network | |
JP4612525B2 (en) | Network fault site identification apparatus and method | |
JP2009110072A (en) | Security system | |
JP2011090429A (en) | Integrated monitoring system | |
Kučera et al. | Fault Detection in Building management system networks | |
JP2008244632A (en) | System, method, and program for setting object to be monitored, network monitoring system, management device, and collection device | |
US11153769B2 (en) | Network fault discovery | |
JP2002164899A (en) | Network monitoring method and its equipment | |
JP2004229224A (en) | Failure surveillance apparatus, method, and program | |
JP4836920B2 (en) | Network monitoring system and terminal device | |
JP2019022099A (en) | Security policy information management system, security policy information management method, and program | |
JP2017228887A (en) | Control system, network device, and control method of control device | |
JP2006050442A (en) | Traffic monitoring method and system | |
JP4505518B2 (en) | Fault monitoring apparatus, method and program | |
JP2003131905A (en) | Management server system | |
CN114338110B (en) | Method, device and system for predicting and defending threat information in situation awareness | |
JP4361570B2 (en) | Packet control instruction management method | |
CN114006720B (en) | Network security situation awareness method, device and system | |
EP4362413A1 (en) | Diagnostic device and diagnosis method | |
JP4946824B2 (en) | Monitoring device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070904 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080108 |