JP2005117371A - リモート監視装置およびリモート監視システム - Google Patents

リモート監視装置およびリモート監視システム Download PDF

Info

Publication number
JP2005117371A
JP2005117371A JP2003349095A JP2003349095A JP2005117371A JP 2005117371 A JP2005117371 A JP 2005117371A JP 2003349095 A JP2003349095 A JP 2003349095A JP 2003349095 A JP2003349095 A JP 2003349095A JP 2005117371 A JP2005117371 A JP 2005117371A
Authority
JP
Japan
Prior art keywords
monitoring
remote
remote monitoring
monitored
server device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003349095A
Other languages
English (en)
Inventor
Yuichi Maruyama
裕一 丸山
Minoru Hashimoto
稔 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AVAL DATA CORP
Original Assignee
AVAL DATA CORP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AVAL DATA CORP filed Critical AVAL DATA CORP
Priority to JP2003349095A priority Critical patent/JP2005117371A/ja
Publication of JP2005117371A publication Critical patent/JP2005117371A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】ネットワーク介して接続された通信機器の通信状態や障害を検出して、管理者に確実に通知することができるとともに、障害の発生した通信機器を復旧処理の一部を自動的に行う。
【解決手段】ローカルネットワークを介して監視対象の通信機器と接続されたリモート監視装置14と、リモート監視装置14と広域ネットワーク24,26を介して遠隔地に接続され、リモート監視装置14および監視対象の通信装置を監視及び管理する監視サーバ装置12とを備えて、リモート監視システム10を構成する。ここで、リモート監視装置14は、取得した監視対象の通信機器の情報に基づいて、監視対象の通信機器がハングアップしたことを検出した場合、自動的もしくは監視サーバ装置から与えられた指示に従って、ハングアップした監視対象の通信機器の電源を再投入して初期化する機能を備える。
【選択図】 図1

Description

本発明は、ネットワークを介して接続された機器を遠隔地から監視および管理するリモート監視システム、及び、このリモート監視システムで用いられるリモート監視装置に関するものである。
SNMP(Simple Network Management Protocol(簡易ネットワーク管理プロトコル))は、インターネット等の標準プロトコルであるTCP/IP(Transmission Control Protocol/Internet Protocol)等を使用するネットワークを介して接続された機器(ネットワークノード)を監視および管理するためのプロトコルである。このSNMPを使用したリモート監視システムが普及しつつある。
SNMPでは、管理する側の機器は管理マネージャと呼ばれ、管理される側の機器(管理対象機器)はエージェントと呼ばれる。管理マネージャは、ポーリングと呼ばれる処理によってエージェントに対し情報の問い合わせを行い、エージェントは、管理マネージャからの問い合わせに応じて、もしくは異常発生時にトラップと呼ばれる処理によって自発的に、管理マネージャに対しMIB(Management Information Base)と呼ばれる管理情報を送信する。
リモート監視システムにおいて、管理マネージャは、SNMPを使用し、遠隔地からネットワークを介してエージェントが持っているMIBを収集し、収集したMIBに基づいて、その監視および管理を行う。
こうしたSNMPを使用してネットワークに接続された機器の監視および管理を行う従来のシステムとしては、例えば特許文献1〜3が提案されている。
特許文献1は、遠距離監視システムの異常時の復旧方式に関し、センタ監視局から離れたところに設置されたリモート監視局に回線インターフェース制御部と、回線インターフェース制御部を制御するための本体制御部と、回線インターフェース制御部に設けられ本体制御部からのポーリングを監視するポーリング監視部とを有する遠隔監視システムにおいて、ポーリング監視部が本体制御部の異常を検出したときには回線インターフェース制御部がセンタ監視局にその異常を通知する異常通知手段と、回線インターフェース制御部が本体制御部の異常を検出したときには本体制御部をリセットしシステム全体の自動再立ち上げを行い本体制御部の正常を確認したときにはセンタ監視局にその正常を通知する正常通知手段とを有するものである。
また、特許文献2は、ネットワーク管理方法に関し、マネージャとエージェントからなり、SNMPで管理されるネットワークにおいて、エージェントはトラップを送信するとき、トラップのマネージャにおける受信確認が必要か否かを判定し、受信確認が必要なトラップに対応するトラップ監視タイマを起動し、トラップをマネージャに送信し、トラップ監視タイマの経過時間を監視し、マネージャからのトラップの応答を受信し、トラップ監視タイマのタイムアウト前に、トラップの応答受信したときは、トラップ受信タイマを解除し、トラップの応答受信前に、トラップ監視タイマがタイムアウトとなった場合は、トラップを再送するものである。
特許文献3は、ネットワーク管理情報収集方式に関し、SNMPを用いて、SNMPマネージャを実装したネットワーク管理装置が、ネットワーク構成機器であるSNMPエージェントを実装した被管理装置を、ネットワーク管理装置から被管理装置へのポーリングにより獲得する情報と被管理装置からネットワーク管理装置に自律的且つ非同期的に通知されるSNMPトラップとに依拠して、管理し、被管理装置に状態の変化が発生した旨の情報がポーリングにより収集されたときには、ネットワーク管理装置に係る外部表示装置における管理対象の状態を表わすための表示手段での該当する表示を変化せしめることにより、ネットワーク管理者に状態の変化が発生したことを通知することが可能になされたネットワーク管理システムのネットワーク管理情報収集方式において、トラップの受信を契機に非同期的なポーリングを被管理装置に対して開始するためのスケジュールを制御するためのスケジュール制御手段と、スケジュール制御手段によるスケジュールの制御を行うためのパラメータを設定するためのパラメータ設定手段と、をネットワーク管理装置上に有するものである。
特開平10−49450号公報 特開平10−51476号公報 特開平11−4222号公報
上述したSNMPによるを使用してネットワークの管理を行う従来のリモート監視システムでは、監視対象の機器に障害が発生した場合、保守員が現地に直接出向いて対応していた。こうした対応において、障害が発生した機器の復旧のためには、機器の部品を交換しなければならないこともあるが、電源の再投入による機器の初期化のみを行えばよいことが多々あった。
また、管理マネージャとエージェントとの間の通信は、前述のように、一般にポーリングやトラップを使用する方法で行われているが、この方法では、必須の情報のため以外のトラフィックが発生する。特に、システムの規模が大きくなると負荷の集中が著しくなり、監視のパフォーマンスが低下する可能性があった。
また、管理マネージャとエージェントとの間の通信の回線そのもの又はその回線に関連する機器(例えば、回線接続用のルータ等)が故障した場合、エージェントから管理マネージャに対し障害が発生したことを通知することができなくなってしまっていた。
また、SNMPはUDP(User Datagram Protocol)と呼ばれるコネクションレス型のプロトコルの上位にマッピングされるが、UDPは誤り訂正やデータ再送の機能を持っていないため、通信データ消失の可能性を排除することができず、障害発生の検出を確実に行うための渉外となる可能性があった。
また、管理マネージャは、SNMPに対応していない機器やMIBを持っていない機器を直接監視することができず、これらの機器は別の手段を使用して監視する必要があった。
本発明は、上記の事情を鑑みてなされたものであり、ネットワーク介して接続された機器の通信状態や障害を検出して、管理者に確実に通知することができるとともに、障害の発生した機器を復旧処理の一部を自動的に行うことができるリモート監視システムを提供することを目的とする。
また、本発明は、本発明のリモート監視システムにおいて好適に使用することができるリモート監視装置を提供することを目的とする。
本発明のリモート監視装置は、広域ネットワークを介して遠隔地に設置された監視サーバ装置と接続されるとともに、ローカルネットワークを介して接続された監視対象の機器の監視を行うリモート監視装置であって、前記監視サーバ装置との通信を行う遠隔通信手段と;前記監視対象の機器の情報を取得する監視情報取得手段と;前記監視対象の機器の少なくとも1つに電源を供給する電源供給手段と;前記監視情報取得手段によって取得した前記電源供給手段から電源を供給している監視対象の機器の情報に基づいて、前記電源供給手段から電源を供給している監視対象の機器がハングアップしたことを検出した場合、自動的又は前記遠隔通信手段を介して前記監視サーバ装置から与えられた指示に従って前記電源供給手段を制御して、前記ハングアップした監視対象の機器の電源を再投入して初期化する初期化手段と;を備えることを特徴とするリモート監視装置である。
このリモート監視装置では、監視情報取得手段が、ローカルネットワークを介して接続された監視対象の機器の情報を取得する。この情報の取得の結果、電源供給手段から電源を供給している監視対象の機器がハングアップしたことを検出した場合、初期化手段が、自動的又は遠隔通信手段を介して監視サーバ装置から与えられた指示に従って電源供給手段を制御して、当該ハングアップした監視対象の機器の電源を再投入して初期化することにより、当該ハングアップした監視対象の機器の復旧を図る。したがって、本発明のリモート監視装置によれば、監視対象の機器に障害が発生した場合、保守員が現地に直接出向いて対応する機械を低減することができ、復旧作業に係るコストを削減することができる。
本発明のリモート監視システムは、ローカルネットワークを介して監視対象の機器と接続された上述の本発明のリモート監視装置と;前記リモート監視装置と広域ネットワークを介して遠隔地に接続され、前記リモート監視装置及び前記監視対象の機器の監視及び管理を行う監視サーバ装置と;を備えることを特徴とするリモート監視システムである。
このリモート監視システムでは、本発明のリモート監視装置が、監視対象の機器のハングアップを検出したときに、自動的又は監視サーバ装置からの指示に従って、当該ハングアップした監視対象の機器の電源を再投入して初期化することにより、当該ハングアップした監視対象の機器の復旧を図る。したがって、本発明のリモート監視システムによれば、監視対象の機器に障害が発生した場合、保守員が現地に直接出向いて対応する機械を低減することができ、復旧作業に係るコストを削減することができる。
本発明のリモート監視システムでは、前記リモート監視装置が、前記監視対象の機器の少なくとも1つについて異常を検出したときには異常検出のトラップ情報を前記監視サーバ装置に対して自発的に送信するとともに、前記監視対象の機器の全てについて異常を検出しない期間中には正常検出のトラップ情報を前記監視サーバ装置に対して自発的に送信する構成とすることができる。この場合には、ポーリングの手法を用いずにトラップの手法のみで、リモート監視装置が、その監視結果を監視サーバ装置に対して報告することができるので、リモート監視装置とリモート監視サーバとの間のトラフィックを低減することができる。
また、本発明のリモート監視システムでは、前記監視サーバ装置と前記リモート監視装置とは、共に広域ルネットワークである主回線及び副回線を介して接続され、前記監視サーバ装置と前記リモート監視装置との間の通信は、前記主回線が正常動作している場合には前記主回線を介して行われ、前記主回線に障害が発生して通信ができない状態である場合には前記副回線を介して行われる構成とすることができる。この場合には、主回線による通信に関連する部分に障害が発生した場合であっても、副回線を介して監視サーバ装置とリモート監視装置との間の通信を行うことができるので、監視サーバ装置とリモート監視装置との間の通信ができなくなる事態の発生頻度を低減することができる。
また、本発明のリモート監視システムでは、前記リモート監視装置が、前記監視サーバ装置に対して前記トラップ情報を送信した後、前記監視サーバ装置から前記トラップ情報を受信したことを表す情報を受信するまで、所定の回数繰り返し前記トラップ情報の送信を行う構成とすることができる。この場合には、リモート監視装置が監視サーバ装置に対して送信したトラップ情報の消失を有効に防止することができる。
以上説明したように、本発明のリモート監視システムによれば、ネットワーク介して接続された機器の通信状態や障害を検出して、管理者に確実に通知することができるとともに、障害の発生した機器を復旧処理の一部を自動的に行うことができるという効果を奏する。
また、本発明リモート監視装置を用いれば、本発明のリモート監視システムを容易に構築することができるという効果を奏する。
以下に、本発明の一実施形態を、図1〜図8を参照しつつ説明する。
図1は、本実施形態のリモート監視システム10の構成概略図である。このリモート監視システム10は、インターネット設備を持つマンション、ホテル、工場等の監視対象の建物の内部に設置されているルータ18、コアスイッチングハブ(以下、「コアハブ」ともいう)29、スイッチングハブ(以下、単に「ハブ」ともいう)30等の機器(以下、これらを総称する場合には、「監視対象機器」という)を、SNMPを使用し、遠隔地にある管理センタである監視サーバ装置12から広域ネットワークを介してリモート監視および管理するものである。図1に示されるように、リモート監視システム10は、監視サーバ装置12と、リモート監視装置(以下、単に「監視装置」ともいう)14とを備えている。なお、本実施形態においては、監視対象機器は、LAN28上においてプライベートIPアドレスを用いてアクセスされるようになっている。
監視サーバ装置12は、SNMPの管理マネージャとなるもので、このリモート監視システム10全体の監視および管理を行う。管理マネージャは、例えば監視サーバ装置12上で動作するソフトウェアプログラムによって実現される。監視サーバ装置12は、管理センタ内に設置され、ルータ16等を介してIP網やインターネット等の主回線24に接続されている。また、監視サーバ装置12は、モデム20等を介して公衆電話回線(PSTN(Public Switched Telephone Networks))等の副回線26に接続可能に構成されている。
この監視サーバ装置(管理マネージャ)12は、広域ネットワークである主回線24又は副回線26を介して監視および管理を行い、異常発生を検知した場合には、管理者に対して、発生した障害の詳細情報を、ディスプレイ等のモニタ画面、警報音、電子メール等で通知する機能を備えている。
一方、監視装置14は、監視サーバ装置12に対してはSNMPのエージェントとなり、例えばルータやスイッチングハブ等の監視対象機器に対してはSNMPの管理マネージャとなるもので、監視対象機器が設置される各々の建物内に設置され、ルータ18等を介してIP網等の主回線24に接続されているとともに、モデム22等を介して公衆電話回線等の副回線26に接続可能に構成されている。また、監視装置14は、LAN28を介してルータ18やスイッチングハブ30等を含む監視対象機器と互いに接続されている。
監視装置14は、監視サーバ装置12の管理の下で、ローカルネットワークであるLAN28を介して監視対象機器(ローカルIPを持つものを含む)の監視を行い、その管理情報を主回線24もしくは副回線26を介して監視サーバ装置12に通知する機能を備えている。また、ルータ18及びコアスイッチングハブ29といった主要機器の電源は監視装置14から供給されており、その電源のオン/オフは、監視装置14によって制御される。監視装置14は、主要機器のハングアップを検知し、電源再投入により、これらの機器の復旧を試みる機能を備えている。
なお、監視サーバ装置12と監視装置14とは、主回線24が正常動作している場合には主回線24を介して互いに通信を行い、主回線24に障害が発生して通信ができない状態である場合には、バックアップ用の回線である副回線26を介して通信を行うことが可能である。また、リモート監視システム10では、1つの監視サーバ装置12に対して、1つないしは複数の監視装置14を使用することができ、各々の監視装置14は、1つないしは複数の監視対象機器を管理することが可能である。
次に、監視装置14の詳細について説明する。
監視装置14は、図2に示されるように、監視装置14は、主制御部32と、監視制御部34と、MIBデータベース36と、バックアップ回線I/F(インターフェース)38と、管理マネージャI/F40と、監視対象機器I/F42と、機器初期化制御部44と、自己診断制御部46とを備えている。これら各構成要素は、内部バス48を介して相互に接続されている。また、監視装置14は、機器初期化制御部44によって電源供給のON/OFFが制御される電源供給部50を更に備えている。
ここで、主制御部32は、例えばプロセッサやメモリ部等を備えており、この監視装置14全体の動作を制御する。
監視制御部34は、ポーリングによって収集した監視対象機器のMIB等の情報を解析し、これを独自形式のプライベートMIBに変換してMIBデータベース36に格納する。独自形式のプライベートMIBを使用することにより、SNMPに対応していない機器やMIBを持っていない機器にも対応可能となる。MIBデータベース36に格納されたプライベートMIBは、監視制御部34の制御により、監視サーバ装置12からの要求に応じて適宜送信される。また、監視制御部34は、特定のMIBデータが、設定された閾値をオーバしていることを検出した場合にはトラップを発生し、これを監視サーバ装置12に通知する。
MIBデータベース36は、監視制御部34により生成されたプライベートMIBを格納するためのデータベースである。
バックアップ回線I/F38は、ルータ18やコアスイッチングハブ等の主要機器が故障し、監視サーバ装置12に対して管理情報の通知ができなくなった場合に使用されるバックアップ用の副回線26、本実施形態の場合、モデム22を使用した公衆電話回線のインターフェースである。
管理マネージャI/F40は、監視サーバ装置12との通信を行い、例えば監視サーバ装置12からのポーリングに対する応答やプライベートMIBの送出、トラップの送信、監視サーバ装置12からの指示による監視装置14の設定や制御を行う。また、管理マネージャI/F40は、トラップの消失を防止するための受信確認、および再送機能を備えている。
監視対象機器I/F42は、例えばルータ18やスイッチングハブ30等の監視対象機器の監視を行うもので、定期的なポーリングによるMIBの収集、監視対象機器から送信されるトラップの受信処理等を行う。
機器初期化制御部44は、制御装置14から電源を供給されている、ルータ18やコアスイッチングハブ等の主要機器に異常が発生したことを検知した場合、これらの主要機器の電源の再投入(電源を一旦オフした後、再度オンする)を所定回数繰り返し行う初期化(リブート)処理を行う。
自己診断制御部46は、監視装置14自身の障害発生を検出するための内部温度センサやウォッチドッグタイマ等を備えており、監視装置14自身の正常性を自己判断し、異常であることを検出した場合、監視装置14自身を初期化して正常復帰を試みる。正常復帰時に、監視サーバ装置12に対して、正常復帰した旨の通知を行うトラップを送信する。
次に、リモート監視システム10の動作を説明する。
まず、リモート監視システム10の動作の概略説明を行う。
遠隔地の管理センタ内に配置された監視サーバ装置12と監視対象の各々の建物内に設置された監視装置14との間の通信は、前述の通り、主回線24の正常時は主回線24を介して行われ、主回線24の障害の発生時は副回線26を介して行われる。
リモート監視システム10では、基本的に監視装置14から監視サーバ装置12に対し、トラップ(正常トラップ又は障害トラップ)による管理情報を送信することにより、監視サーバ装置12において、管理情報に基づいて監視装置14及び監視対象機器の監視および管理が行われる。また、必要に応じて、監視サーバ装置12が、監視装置14に対し、ポーリングによるSNMPコマンドやピン(ping)コマンド等の送信を行い、その応答を受信することによって、監視装置14および監視対象機器の監視および管理を行う。
ここで、トラップは、その内容の違いに応じて、正常であることを報告するための正常トラップと、異常が発生したことを報告する障害トラップの2種類がある。正常トラップには、機器が正常であることや、監視に必要な各種の情報が含まれる。こうした正常トラップは、基本的に監視装置14による監視結果が正常である期間中に定期的に監視装置14から監視サーバ装置12へ自発的に送信される。
一方、障害トラップには、障害が発生した機器の情報や障害内容の情報などが含まれる。監視装置14は、監視サーバ装置12に対して正常トラップを定期的に送信し、自分自身と監視対象機器が正常に動作していることを監視サーバ装置12に通知する。
なお、監視サーバ装置12は、定期的に正常トラップを検出できない場合に、監視装置14および監視対象機器の状態を確認し、正常トラップを検出できない原因を調べる。
このように、正常時はトラップのみで監視装置14および監視対象機器の監視を行うことにより、SNMPコマンドやピン(ping)コマンド等の定期的なポーリング処理が不要となり、監視結果の通知には直接的には関わらないトラフィックの増加を最小限に抑えることができる。また、各々の監視装置14の監視エリア内の機器の監視および管理を監視装置14自身が行うため、その監視および管理を各々の監視装置14に分散させることができ、監視サーバ装置12は、自分自身の処理の負荷や通信のトラフィックを低減することができる。
以下、リモート監視システム10の動作の詳細説明を、図3〜図8を主に参照して行う。
(1)監視対象機器が正常動作している場合
監視対象機器が正常動作している場合には、まず、図3に示されるように、監視装置14は、監視サーバ装置12から開始指示コマンドを受信すると、この監視装置14の監視エリア内(例えば、LAN28内部)に設置されている各々の監視対象機器に対してポーリングによる情報要求(存在確認)を順次行う。これに応じて、各々の監視対象機器から順次情報が送出される。監視装置14は、各々の監視対象機器から送出される情報を受信し、自分自身が監視すべき監視対象機器の情報が記録されたノード管理テーブルを作成する。この監視対象機器の情報は、監視サーバ装置12から編集指示コマンドが与えられた場合や、新たな監視対象機器が追加された場合、監視対象機器が撤去された場合等に逐次更新される。
次に、監視装置14は、あらかじめ設定されているポーリング周期、応答待ち時間等の条件で、ノード管理テーブルに記録されている各々の監視対象機器に対してポーリングによる状態情報要求(MIBの送信要求等)を順次行う。これに応じて、各々の監視対象機器から順次状態情報が送出される。監視装置14は、各々の監視対象機器から収集した状態情報を解析、編集してプライベートMIBを生成し、これをMIBデータベース36に格納する。
こうした各々の監視対象機器からの状態情報の全てが正常状態を示す情報である期間においては、監視装置14は、監視サーバ装置12へ向けて、定期的に正常トラップを送信する。この正常トラップを受けた監視サーバ装置12は、監視装置14に向けて、正常トラップを受けた旨を通知するためのACKを送信する。
かかる監視装置14から監視サーバ装置12への正常トラップ送信においてトラップ消失を防止するため、監視装置14におけるMIBの中には、正常トラップを識別するためのトラップ番号と、この正常トラップが監視サーバ装置12に受信されたことを示すトラップ応答番号のエントリが設けられている。また、監視サーバ装置12に対して送信される正常トラップにトラップ番号が含まれるようになっている。
また、監視サーバ装置12は、正常トラップを受信すると、監視装置14に対してACKを送信する。この時、ACKの情報の中には、トラップ番号に対するとトラップ応答番号の情報が含まれている。
そして、監視装置14は、送信したトラップ番号に対応するトラップ応答番号を含むACKが所定時間内に返送されて来ない場合には、再度ACKを受け取ることができなかった正常トラップを再送する。これにより、トラップの消失を防止し、監視サーバ装置12にトラップによる管理情報を確実に送信することができる。なお、規定の回数再送処理を行っても適切なトラップ応答番号を含むACKが受信できない場合には、主回線24に代えて副回線26を利用して正常トラップの送出を規定回数まで行う。
(2)主要機器を除く監視対象機器で障害が発生した場合
主要機器を除く監視対象機器で異常が発生した場合には、(a)異常が発生した監視対象機器からトラップが監視装置14に通知される、(b)監視装置14による状態情報の要求に対する応答情報の内容が正常とはいえない状態となる、及び(c)監視装置14による死活監視等の情報要求に対して応答がなくなる、の3つの内のいずれかが発生することにより、監視装置14により障害が発生したことが検出される。
上記の(a)の場合には、図4に示されるように、監視対象機器で異常が発生し、そのことを監視対象機器が検出すると、監視対象機器から監視装置14に対してトラップによる異常通知が行われる。このトラップを受けると、監視装置14は、当該監視対象機器において異常が発生したことを認識し、トラップを分析してフィルタリングを行う。そして、監視装置14は、監視サーバ装置12に対して障害トラップによる異常通知を行う。これに応じて、監視サーバ装置12では、監視対象機器で異常が発生したことを表すモニタ画面表示、警報音、電子メール発信等の処理が行われ、管理者に通知される。なお、上記のフィルタリングはシステム管理者の設定によって行われる。この結果、システム管理者により必要であるとされた異常通知のみが行われる。
上記の(b)の場合には、図5に示されるように、監視装置14において、収集された状態情報と、あらかじめ設定されているアラーム条件と比較し、例えばMIBに閾値オーバ等の異常が検出された場合には、監視装置14は、当該監視対象機器において異常が発生したことを認識し、トラップを分析してフィルタリングを行う。そして、監視装置14は、異常を解析した後、監視サーバ装置12に対して障害トラップによる異常通知を行う。これに応じて、監視サーバ装置12では、監視対象機器で異常が発生したことを表すモニタ画面表示、警報音、電子メール発信等の処理が行われ、管理者に通知される。なお、この場合にも、フィルタリングはシステム管理者の設定によって行われ、システム管理者により必要であるとされた異常通知のみが行われる。
上記の(c)の場合には、図6に示されるように、監視装置14から監視対象機器に対して死活監視が送出されたときに、監視対象機器でハングアップ等が発生していると、監視装置14は、監視対象機器からの応答を受信することができない。この無応答により、監視装置14は、監視対象機器で異常が発生していることを検出し、監視サーバ装置12に対して障害トラップによる異常通知が送出される。これに応じて、監視サーバ装置12では、監視対象機器で異常が発生したことを表すモニタ画面表示、警報音、電子メール発信等の処理が行われ、管理者に通知される。
以上のような主要機器を除く監視対象機器で障害が発生した場合に監視装置14から監視サーバ装置12へ向けて送出される障害トラップにおいても、上述の正常トラップの場合と同様のトラップ再送処理を行っている。これにより、トラップの消失を防止し、監視サーバ装置12にトラップによる管理情報を確実に送信することができる。
(3)監視対象機器における主要機器で障害が発生した場合
監視対象機器の中でも、ルータ18やコアスイッチングハブ等の主要機器については、主回線24の障害による障害通知の不達を防止するためにリアルタイムの死活監視が要求される。このため、これらの主要機器に対するポーリング等の間隔は、他の監視対象機器に対するポーリング間隔よりも短く設定されている。また、SNMPコマンドによる定期的な死活監視に加えて、ピンコマンドによる不定期な死活監視が併用される。なお、ピン(ping)コマンドは、SNMPに対応していない機器や、MIBを持っていない機器に対しても有効に利用することができる。これにより、このような機器に対しても別の手段を設けることなく監視を行うことができる。
図7に示すように、監視装置14から、主要機器に例えば死活監視が送出された時に、その主要機器がハングアップしていると、監視装置14は、その収容機器から応答を受信することができない。これにより、監視装置14は、主要機器で異常が発生していることを検知し、電源を再投入し初期化して正常復帰させるよう試みる。この後、監視装置14は、副回線26を介して監視サーバ装置12に障害トラップを送出する。そして、一定時間が経過すると、監視装置14から、当該主要機器に死活監視を再度が送出する。この死活監視に対しても無応答であった場合には、監視装置14は、電源を再投入による初期化処理を規定回数まで行う。なお、この電源の再投入による初期化処理を行うごとに、監視装置14は、副回線26を介して監視サーバ装置12に障害トラップを送出する。これにより、当該主要機器が正常復帰すると、監視装置14から監視サーバ装置12に対し主回線24を介して、トラップによりその旨が通知される。この結果、監視サーバ装置12は、当該主要機器が異常から回復したことを検知する。一方、電源の再投入による初期化処理により正常復帰しない場合、監視装置14は、副回線26を介して監視サーバ装置12に障害トラップによりその旨を通知する。これにより、監視サーバ装置12は、当該主要機器で発生した異常が自己復帰できなかったことを検知する。
以上のような主要機器で障害が発生した場合に監視装置14から監視サーバ装置12へ向けて送出されるトラップにおいても、上述の正常トラップの場合と同様のトラップ再送処理を行っている。これにより、トラップの消失を防止し、監視サーバ装置12にトラップによる管理情報を確実に送信することができる。
なお、主要機器の障害を上記のような無応答によって認識した場合に限らず、他の要因によって認識した場合にも、監視装置14は、電源の再投入処理を行い、異常が発生したと推測される主要機器の復旧を図ることができる。
(4)監視装置で障害が発生した場合
監視装置14で障害が発生した場合には、正常トラップ及び障害トラップの双方のトラップが監視サーバ装置12に送信されなくなる。この場合には、保守員を派遣することになる。
以上説明したように、本実施形態では、監視装置14が、監視対象機器のうち主要機器のハングアップ等の異常を検出したときに、自動的に当該ハングアップした監視対象の機器の電源を再投入して初期化することにより、当該ハングアップした監視対象の機器の復旧を図る。したがって、主要機器に異常が発生した場合、保守員が現地に直接出向いて対応する機械を低減することができ、復旧作業に係るコストを削減することができる。
監視装置14が、前記監視対象機器の少なくとも1つについて異常を検出したときには異常検出のトラップを監視サーバ装置14に対して送信するとともに、監視対象機器の全てについて異常を検出しない期間中には正常検出のトラップを監視サーバ装置12に対して送信する。したがって、ポーリングの手法を用いずにトラップの手法のみで、監視装置14が、その監視結果を監視サーバ装置12に対して報告することができるので、監視装置12と監視サーバ装置14との間のトラフィックを低減することができる。
また、監視サーバ装置12と監視装置14とは、共に広域ネットワークである主回線24及び副回線26を介して接続され、監視サーバ装置12と監視装置14との間の通信は、主回線24が正常動作している場合には主回線24を介して行われ、主回線24に障害が発生して通信ができない状態である場合には副回線26を介して行われる。したがって、主回線24による通信に関連する部分に障害が発生した場合であっても、副回線26を介して監視サーバ装置12と監視装置14との間の通信を行うことができるので、監視サーバ装置12と監視装置14との間の通信ができなくなる事態の発生頻度を低減することができる。
また、監視装置14が、監視サーバ装置12に対してトラップ情報を送信した後、監視サーバ装置12から管理情報を受信したことを表すACKを受信するまで、所定の回数繰り返しトラップ情報の送信を行う。したがって、監視装置14が監視サーバ装置12に対して送信したトラップ情報の消失を有効に防止することができる。
なお、上記の実施形態では、監視装置14がルータの異常を検知すると、自動的に主要機器の電源を再投入して初期化しているが、これに限定されず、監視装置14は、監視サーバ装置12からの指示に従って主要機器の電源を再投入するようにしてもよい。この場合、監視装置14は、主要機器の異常を検知すると、副回線26を介して監視サーバ装置12に異常通知を行う。これにより、監視サーバ装置12は主要機器の異常を検知し、副回線26を介して監視装置14にルータ18の電源を再投入するよう指示を与える。監視装置14は、監視サーバ装置12からの指示を受信すると、上記の実施形態の場合と同様にして、電源を再投入し当該主要機器を初期化して正常復帰させるよう試みる。
また、上記の実施形態では、監視装置14から監視サーバ装置12への監視結果情報の通知を全てトラップを使用して行った。これに対して、特に監視対象機器の全てが正常である期間には、監視サーバ装置12からの情報要求のポーリングに応じて監視装置14から監視結果を監視サーバ装置12へ通知するシーケンスを適宜用いることもできる。
また、上記の実施形態では、監視対象機器がLAN28上においてプライベートIPアドレスを用いてアクセスされることとしたが、グローバルIPアドレスを用いてアクセスされることとしてもよい。
また、本発明は上記実施形態に限定されず、本発明の主旨を逸脱しない範囲において、種々の改良や変更をしてもよいのは勿論である。
以上説明したように、本発明のリモート監視装置及びリモート監視システムは、ネットワーク介して接続された機器の通信状態や障害を検出して、管理者に通知する監視対象機器のリモート監視に適している。
本発明のリモート監視システムの一実施形態の構成概略図である。 図1のリモート監視装置の内部構成を示すブロック概略図である。 本発明のリモート監視システムの動作を説明するためのシーケンス図(その1)である。 本発明のリモート監視システムの動作を説明するためのシーケンス図(その2)である。 本発明のリモート監視システムの動作を説明するためのシーケンス図(その3)である。 本発明のリモート監視システムの動作を説明するためのシーケンス図(その4)である。 本発明のリモート監視システムの動作を説明するためのシーケンス図(その5)である。
符号の説明
10…リモート監視システム、12…監視サーバ装置、14…リモート監視装置、16,18…ルータ、20,22…モデム、24…主回線、26…副回線、28…LAN、29…コアスイッチングハブ、30…スイッチングハブ、32…主制御部、34…監視制御部、36…MIBデータベース、38…バックアップ回線I/F、40…管理マネージャI/F、42…監視対象機器I/F、44…機器初期化制御部、46…自己診断制御部、48…内部バス、50…電源供給部。

Claims (5)

  1. 広域ネットワークを介して遠隔地に設置された監視サーバ装置と接続されるとともに、ローカルネットワークを介して接続された監視対象の機器の監視を行うリモート監視装置であって、
    前記監視サーバ装置との通信を行う遠隔通信手段と;
    前記監視対象の機器の情報を取得する監視情報取得手段と;
    前記監視対象の機器の少なくとも1つに電源を供給する電源供給手段と;
    前記監視情報取得手段によって取得した前記電源供給手段から電源を供給している監視対象の機器の情報に基づいて、前記電源供給手段から電源を供給している監視対象の機器がハングアップしたことを検出した場合、自動的又は前記遠隔通信手段を介して前記監視サーバ装置から与えられた指示に従って前記電源供給手段を制御して、前記ハングアップした監視対象の機器の電源を再投入して初期化する初期化手段と;を備えることを特徴とするリモート監視装置。
  2. ローカルネットワークを介して監視対象の機器と接続された請求項1に記載のリモート監視装置と;
    前記リモート監視装置と広域ネットワークを介して遠隔地に接続され、前記リモート監視装置及び前記監視対象の機器の監視及び管理を行う監視サーバ装置と;を備えることを特徴とするリモート監視システム。
  3. 前記リモート監視装置は、前記監視対象の機器の少なくとも1つについて異常を検出したときには異常検出のトラップ情報を前記監視サーバ装置に対して自発的に送信するとともに、前記監視対象の機器の全てについて異常を検出しない期間中には正常検出のトラップ情報を前記監視サーバ装置に対して自発的に送信する、ことを特徴とする請求項2に記載のリモート監視システム。
  4. 前記監視サーバ装置と前記リモート監視装置とは、共に広域ルネットワークである主回線及び副回線を介して接続されており、
    前記監視サーバ装置と前記リモート監視装置との間の通信は、前記主回線が正常動作している場合には前記主回線を介して行われ、前記主回線に障害が発生して通信ができない状態である場合には前記副回線を介して行われる、ことを特徴とする請求項2又は3に記載のリモート監視システム。
  5. 前記リモート監視装置は、前記監視サーバ装置に対して前記トラップ情報を送信した後、前記監視サーバ装置から前記トラップ情報を受信したことを表す情報を受信するまで、所定の回数繰り返し前記トラップ情報の送信を行う、ことを特徴とする請求項2〜4のいずれか一項に記載のリモート監視システム。

JP2003349095A 2003-10-08 2003-10-08 リモート監視装置およびリモート監視システム Pending JP2005117371A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003349095A JP2005117371A (ja) 2003-10-08 2003-10-08 リモート監視装置およびリモート監視システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003349095A JP2005117371A (ja) 2003-10-08 2003-10-08 リモート監視装置およびリモート監視システム

Publications (1)

Publication Number Publication Date
JP2005117371A true JP2005117371A (ja) 2005-04-28

Family

ID=34541050

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003349095A Pending JP2005117371A (ja) 2003-10-08 2003-10-08 リモート監視装置およびリモート監視システム

Country Status (1)

Country Link
JP (1) JP2005117371A (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007028576A (ja) * 2005-06-15 2007-02-01 Ntt Electornics Corp ネットワーク装置管理アダプタ
JP2007096707A (ja) * 2005-09-28 2007-04-12 Fujitsu Ltd ネットワーク管理サーバ及びクライアント操作管理方法
JP2007228565A (ja) * 2006-01-25 2007-09-06 Nec Infrontia Corp 通信装置を管理するための管理システム、その通信装置および管理方法
JP2010288101A (ja) * 2009-06-12 2010-12-24 Total Life Service Community:Kk 緊急通報方法とシステム
JP2011160406A (ja) * 2010-01-06 2011-08-18 Frontiers Co Ltd ネットワーク機器監視モニタ装置
JP2011159181A (ja) * 2010-02-02 2011-08-18 Fujitsu Component Ltd 電源制御装置、電源制御システム及びプログラム
WO2012043029A1 (ja) * 2010-09-28 2012-04-05 株式会社創業 ネットワーク機器監視モニタ装置
JP2012104050A (ja) * 2010-11-12 2012-05-31 Miharu Communications Co Ltd Snmpトラップの伝送方法とsnmpトラップの伝送装置
US8391137B2 (en) 2006-01-25 2013-03-05 Nec Infrontia Corporation Management system and management method for managing a communication apparatus
WO2013180146A1 (en) * 2012-05-30 2013-12-05 Nec Corporation Internet protocol (ip) network device, network system, method thereof
JP2014209277A (ja) * 2013-04-16 2014-11-06 Necエンジニアリング株式会社 ネットワーク管理装置、ネットワーク管理方法及びプログラム
JP2015230499A (ja) * 2014-06-03 2015-12-21 住友電気工業株式会社 交通管制用通信システム及び通信方法
JP2016143140A (ja) * 2015-01-30 2016-08-08 富士ゼロックス株式会社 装置管理システム、管理装置、中継装置及びプログラム
JP2019110410A (ja) * 2017-12-18 2019-07-04 株式会社明電舎 ネットワーク機器
JP2022510694A (ja) * 2018-12-07 2022-01-27 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング 通信ネットワークを介して接続された複数の電子デバイスが例外を正しく処理するか否かの同時試験
WO2024042599A1 (ja) * 2022-08-23 2024-02-29 楽天モバイル株式会社 障害発生時におけるサーバ状態確認支援

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007028576A (ja) * 2005-06-15 2007-02-01 Ntt Electornics Corp ネットワーク装置管理アダプタ
JP2007096707A (ja) * 2005-09-28 2007-04-12 Fujitsu Ltd ネットワーク管理サーバ及びクライアント操作管理方法
US8391137B2 (en) 2006-01-25 2013-03-05 Nec Infrontia Corporation Management system and management method for managing a communication apparatus
JP2007228565A (ja) * 2006-01-25 2007-09-06 Nec Infrontia Corp 通信装置を管理するための管理システム、その通信装置および管理方法
JP2010288101A (ja) * 2009-06-12 2010-12-24 Total Life Service Community:Kk 緊急通報方法とシステム
JP2011160406A (ja) * 2010-01-06 2011-08-18 Frontiers Co Ltd ネットワーク機器監視モニタ装置
JP2011159181A (ja) * 2010-02-02 2011-08-18 Fujitsu Component Ltd 電源制御装置、電源制御システム及びプログラム
WO2012043029A1 (ja) * 2010-09-28 2012-04-05 株式会社創業 ネットワーク機器監視モニタ装置
JP2012104050A (ja) * 2010-11-12 2012-05-31 Miharu Communications Co Ltd Snmpトラップの伝送方法とsnmpトラップの伝送装置
WO2013180146A1 (en) * 2012-05-30 2013-12-05 Nec Corporation Internet protocol (ip) network device, network system, method thereof
US9124491B2 (en) 2012-05-30 2015-09-01 Nec Corporation Internet protocol (IP) network device, network system, method thereof
JP2014209277A (ja) * 2013-04-16 2014-11-06 Necエンジニアリング株式会社 ネットワーク管理装置、ネットワーク管理方法及びプログラム
JP2015230499A (ja) * 2014-06-03 2015-12-21 住友電気工業株式会社 交通管制用通信システム及び通信方法
JP2016143140A (ja) * 2015-01-30 2016-08-08 富士ゼロックス株式会社 装置管理システム、管理装置、中継装置及びプログラム
JP2019110410A (ja) * 2017-12-18 2019-07-04 株式会社明電舎 ネットワーク機器
JP2022510694A (ja) * 2018-12-07 2022-01-27 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング 通信ネットワークを介して接続された複数の電子デバイスが例外を正しく処理するか否かの同時試験
JP7147065B2 (ja) 2018-12-07 2022-10-04 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング 通信ネットワークを介して接続された複数の電子デバイスが例外を正しく処理するか否かの同時試験
WO2024042599A1 (ja) * 2022-08-23 2024-02-29 楽天モバイル株式会社 障害発生時におけるサーバ状態確認支援

Similar Documents

Publication Publication Date Title
US20230362051A1 (en) Control Plane Device Switching Method and Apparatus, and Forwarding-Control Separation System
JP2005117371A (ja) リモート監視装置およびリモート監視システム
US8332506B2 (en) Network monitor program executed in a computer of cluster system, information processing method and computer
JP2004021549A (ja) ネットワーク監視システムおよびプログラム
US7213179B2 (en) Automated and embedded software reliability measurement and classification in network elements
CN111988162B (zh) 一种管理端口配置模式的方法及装置
CN111045866A (zh) 一种bmc故障处理方法、装置、电子设备及存储介质
CN103810076A (zh) 数据复制的监控方法及装置
CN111953542B (zh) 一种保障网关稳定运行的系统
JP2008059114A (ja) Snmpを利用した自動ネットワーク監視システム
CN111694707A (zh) 一种小型服务器集群管理系统及方法
JP2013130901A (ja) 監視サーバおよびそれを用いたネットワーク機器復旧システム
JP4259416B2 (ja) デバイス管理システム
JP2004280717A (ja) 遠隔制御監視システム及びそれに用いる情報通信方法
JP2008097326A (ja) Snmpシーケンス管理方法、マネージャ装置及びエージェント装置
JP2009110072A (ja) 警備システム
JP2008010924A (ja) ネットワーク中継装置用自動再起動装置
JP2006154991A (ja) 情報処理システム、情報処理システムの制御方法、監視装置、監視プログラム、保守管理プログラム
KR101214651B1 (ko) Snmp trap을 이용한 usp의 장애발생을 sms를 이용하여 통지하는 장치
JP4619925B2 (ja) 通信装置および通信方法
JP2007206998A (ja) 遠隔診断用の仲介装置
JP3757072B2 (ja) ネットワークシステムを構成する計算機の監視方法
JP2000148539A (ja) 障害検知方法、コンピュータシステム及び構成装置、記録媒体
KR102301767B1 (ko) 네트워크 기반의 카메라 제어장치 및 방법
JP3735527B2 (ja) 遠隔機器監視システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051021

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060405