JP2008259047A - Network monitoring system, and centralized monitoring apparatus - Google Patents
Network monitoring system, and centralized monitoring apparatus Download PDFInfo
- Publication number
- JP2008259047A JP2008259047A JP2007100840A JP2007100840A JP2008259047A JP 2008259047 A JP2008259047 A JP 2008259047A JP 2007100840 A JP2007100840 A JP 2007100840A JP 2007100840 A JP2007100840 A JP 2007100840A JP 2008259047 A JP2008259047 A JP 2008259047A
- Authority
- JP
- Japan
- Prior art keywords
- network
- monitoring
- distributed processing
- distributed
- centralized monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
本発明は、ネットワーク監視システムおよび集中監視装置に係り、特に信頼性に優れたネットワーク監視システムおよび集中監視装置に関する。 The present invention relates to a network monitoring system and a centralized monitoring apparatus, and more particularly to a network monitoring system and a centralized monitoring apparatus excellent in reliability.
従来、大規模なネットワークにおいて監視を行う場合には、図1のような構成をとることが一般的である。ここで、図1は分散監視システムのブロック図である。図1において、監視すべきネットワーク機器(監視対象機器)10−1〜10−10に対して、集中監視装置100Aと監視対象機器の一部分の監視を担当する分散監視装置200−1、200−2とによってネットワーク全体を監視する形態である。図1において、分散監視装置200−1は、ネットワーク機器10−1〜10−5を監視し、分散監視装置200−2は、ネットワーク機器10−6〜10−10を監視する。
Conventionally, when monitoring is performed in a large-scale network, a configuration as shown in FIG. 1 is generally used. Here, FIG. 1 is a block diagram of the distributed monitoring system. In FIG. 1, the
このような監視の形態をとるとき、集中監視装置100Aと分散監視装置200は、ともに図2に示すネットワーク全体のノードリストを保持する。ここで、図2はノードリストを説明する図である。図2において、分散監視装置200−1は自己の監視対象外のネットワーク機器10−6〜10−10のリスト20を保有する。同様に、分散監視装置200−2は自己の監視対象外のネットワーク機器10−1〜10−5のリストを保有する。
When taking such a monitoring form, the
図3を参照して、このシステムの動作を説明する。ここで、図3は分散監視システムの機能ブロックと動作を説明する図である。なお、図3では図1に示した監視対象機器のうち、1台のネットワーク機器(すなわち10−1)に関する処理のみを記載している。 The operation of this system will be described with reference to FIG. Here, FIG. 3 is a diagram for explaining functional blocks and operations of the distributed monitoring system. In FIG. 3, only the processing related to one network device (that is, 10-1) among the monitoring target devices illustrated in FIG. 1 is illustrated.
本来ネットワーク監視は、統合的に行われるべきであり、その為には1台の監視装置が全てのネットワーク機器(10−1〜10−10)を監視するのが望ましい。しかし、大規模なネットワークとなり、監視対象機器が多くなってきた場合には、監視パケットの送受信による負荷が高くなり、1台の監視装置で全ての機器を監視する事は非常に困難である。例えば1000台の機器を監視し障害検知までの時間を5分以内とした場合には、毎秒約3台の機器に対して状態確認パケットを送受信する必要があり、障害発生などによって多くの機器が応答できない状況が発生した場合には、パケットの処理と障害の検知のために多くのリソースを必要とするため高負荷状態となり、正常にネットワークを監視することができなくなる可能性がある。そのため、複数の監視装置をネットワーク内に設置し、分散監視システムを構築する事が必要となる。 Originally, network monitoring should be performed in an integrated manner. For this purpose, it is desirable that a single monitoring device monitors all network devices (10-1 to 10-10). However, when the network becomes large and the number of devices to be monitored increases, the load due to transmission and reception of monitoring packets increases, and it is very difficult to monitor all the devices with one monitoring device. For example, when 1000 devices are monitored and the time until failure detection is within 5 minutes, it is necessary to send and receive status confirmation packets to approximately 3 devices per second. When a situation in which a response cannot be made occurs, many resources are required for packet processing and failure detection, so there is a possibility that the network becomes unable to be monitored normally because of a high load state. Therefore, it is necessary to install a plurality of monitoring devices in the network and construct a distributed monitoring system.
図3において、集中監視装置100Aは、監視機能部110Aと通信部120Aとから構成される。また、監視機能部110Aは対象ノードリスト111Aと障害判定条件テーブル112Aとを含む。分散監視装置200−1は、監視機能部210と通信部220とから構成される。監視機能部210は監視機能部110Aと同様に、対象ノードリスト211と障害判定条件テーブル212とを含む。さらに、ネットワーク機器10−1は通信部12と制御部15とから構成される。
In FIG. 3, the
図3に示す分散監視システムにおいて、ネットワーク機器10−1を監視するにあたって集中監視装置100Aと分散監視装置200−1の双方に、監視対象となるネットワーク機器10−1の情報を登録する必要がある。また、ネットワークの構成および障害判定条件についても同様に双方に登録する必要がある。集中監視装置100Aおよび分散監視装置200−1において、オペレータは登録された対象ノードの情報を基に、監視対象ノードリスト111Aおよび211に監視対象ノード情報を書き込む。オペレータは、また、登録された障害判定条件を基に障害状態判定条件テーブル112Aおよび212に障害状態判定条件を書き込む。その後、集中監視装置100Aの監視機能部110Aは、対象ノードリスト111Aと障害判定条件テーブル112Aを参照して、対象ノード判定処理を実施する(S101)。また、分散監視装置200−1の監視機能部210は、対象ノードリスト211と障害判定条件テーブル212を参照して、対象ノード判定処理を実施する(S201)。これら処理により、集中監視装置100Aと分散監視装置200−1は、ネットワークの基本構成を理解し、発生する障害に応じて自立的に障害検知機能や機器監視機能を制御する。また、集中監視装置100Aと分散監視装置200−1は、ネットワーク監視者が障害箇所の特定および復旧を行うにあたって有益な情報を提供する。
In the distributed monitoring system shown in FIG. 3, when monitoring the network device 10-1, it is necessary to register information on the network device 10-1 to be monitored in both the centralized
通常時、実際の監視は分散監視装置200−1が実施する。分散監視装置200−1は、ステップ201で状態確認を実施すると判定されたネットワーク機器10−1に対して対象ノードの状態確認処理を実施する(S202)。この状態確認処理は、主にPing(Packet Internet Groper)によって行われる。ネットワーク機器10−1は、状態確認データを受信し(S203)、制御部150において確認データに対する応答として現在の自分の機器状態を示すデータを生成し(S204)、その状態データを送信する(S206)。実際に送信されるデータに含まれる内容は、きわめて限定的であり、対象装置が稼働しているか否かを判断する程度の情報のみが含まれている。分散監視装置200−1は対象ノードからの状態データを受信し(S207)、受信したデータを基に障害が発生しているのか否かを判定する(S208)。ステップ208の障害判定処理において、ネットワークに障害が発生していると判断できた場合には、設定に応じて画面表示の変更・アラームの発報(S209)などを実施する。 In the normal state, the actual monitoring is performed by the distributed monitoring apparatus 200-1. The distributed monitoring apparatus 200-1 performs the status check process of the target node on the network device 10-1 that is determined to check the status in Step 201 (S202). This state confirmation process is mainly performed by Ping (Packet Internet Groper). The network device 10-1 receives the status confirmation data (S203), the control unit 150 generates data indicating the current device status as a response to the confirmation data (S204), and transmits the status data (S206). ). The content included in the data that is actually transmitted is extremely limited, and includes only information that can be used to determine whether the target device is operating. The distributed monitoring apparatus 200-1 receives the status data from the target node (S207), and determines whether a failure has occurred based on the received data (S208). If it is determined in the failure determination process in step 208 that a failure has occurred in the network, a screen display change / alarm notification (S209) is performed according to the settings.
さらに、分散監視装置200−1は、集中監視装置100Aに対して、ネットワーク内で障害が発生した旨を通知する(S211)。集中監視装置100Aは、障害通知を受信し(S212)、受信した分散監視装置200−1からのデータを確認し(S213)、障害状態の判定を実施した(S214)上で、分散監視装置200−1が実施したのと同様に画面表示の変更・アラームの発報などを行う(S216)。また、他の分散監視装置200−2に対しても障害が発生した旨を通知し(S217)、それぞれの監視装置間で情報の統一を行う。
Furthermore, the distributed monitoring apparatus 200-1 notifies the
すなわち従来の監視システムにおいては、分散監視装置200−1から集中監視装置100Aに対して送信される障害発生通知は、ネットワークの基本構成や障害と判定するための条件を基にして生成されたデータである。そのため、障害発生データを生成するために集中監視装置100Aと分散監視装置200−1にてネットワークの基本構成などの情報を保持する必要がある。また、このデータは複数存在する監視装置間において同一のデータが保持されている必要がある。万一、集中監視装置100Aと分散監視装置200の間でデータの不一致が発生した場合には、分散監視装置200が実際の障害を検知できない場合や、集中監視装置100Aが通知された情報を解析した結果、障害と判定されずにアラームの発報が行われないなどの状況に陥る可能性がある。分散監視装置200は、集中監視装置100Aとほぼ同様の機能を持ち、ネットワークの基本構造や障害状態の判定処理などを実施することができる。しかし、そのために機器に要求されるスペックは高くなり、また、設定情報の整合性について細心の注意を払う必要がある。
That is, in the conventional monitoring system, the failure occurrence notification transmitted from the distributed monitoring device 200-1 to the centralized
大規模ネットワークを監視するためには、複数の監視装置を設置し、それぞれネットワークの一部分を監視した上で相互に連係動作させる必要がある。 In order to monitor a large-scale network, it is necessary to install a plurality of monitoring devices, monitor each part of the network, and operate them in cooperation with each other.
その際に、集中監視装置〜分散監視装置間で相互に連係動作をさせるために、集中・分散監視装置に対して重複するような機能を実装する必要がある。ここで言うところの重複する機能とは、ネットワーク機器情報、構成情報、障害判定条件を基にして、ネットワークの構成を把握しての動作を行う機能である。 At that time, it is necessary to implement an overlapping function with respect to the centralized / distributed monitoring apparatus in order to cause the centralized monitoring apparatus to the distributed monitoring apparatus to cooperate with each other. The overlapping functions mentioned here are functions that perform operations by grasping the network configuration based on network device information, configuration information, and failure determination conditions.
そのため、集中・分散の両監視装置に対して、規模の大きなソフトウェアを導入する必要がある。要求されるマシンスペックも高くなってしまう。また、そのソフトウェアを導入するために必要な設計・構築作業に大きなコストが必要となる。 Therefore, it is necessary to install large-scale software for both centralized and distributed monitoring devices. The required machine specs are also high. In addition, a large cost is required for the design and construction work necessary for introducing the software.
また、複数の分散監視装置および集中監視装置が連動して動作しているため、監視システムとして正常かつ円滑な動作を行わせるためには、全ての監視装置で統一された設定を行う必要があり、ネットワーク構築後の構成変更などによる、監視装置への修正作業は繁雑を極める。 In addition, since multiple distributed monitoring devices and centralized monitoring devices operate in tandem, it is necessary to perform unified settings for all monitoring devices in order to perform normal and smooth operation as a monitoring system. And the modification work to the monitoring device due to the configuration change after the network construction is extremely complicated.
万一、整合性が失われた場合には、複数の監視装置において検出する障害事象に差異が発生する可能性があり、ネットワーク管理者が実施する障害特定プロセスに多大な影響を与えると同時に、復旧までに要する時間の増大を招く。これは、障害箇所の特定および復旧時間の短縮を目的として導入される監視システムとしては、致命的な問題点である。 In the unlikely event that consistency is lost, there may be differences in the failure events detected by multiple monitoring devices, which will greatly affect the failure identification process performed by the network administrator. This will increase the time required for recovery. This is a fatal problem for a monitoring system introduced for the purpose of identifying the fault location and shortening the recovery time.
本発明では、分散監視装置の機能を低減した分散処理装置を導入することによって前述の課題を解決する。 In the present invention, the above-described problem is solved by introducing a distributed processing device in which the functions of the distributed monitoring device are reduced.
分散監視装置で必要とされる機能を絞り込み、分散監視装置を小規模なものにすることによって、装置自体に対する要求スペックを低減すると同時に導入に必要とされるコストの低減を実現する。また、分散監視装置は極めて従属性の高いものとし、集中監視装置の指示により動作するエージェントとしての動作のみを担い、個別の監視装置に対する設定などは実施しない。そのため、不整合は発生せず、問題点が解決される。 By narrowing down the functions required for the distributed monitoring apparatus and making the distributed monitoring apparatus small-scale, the required specifications for the apparatus itself are reduced, and at the same time, the cost required for introduction is reduced. Further, the distributed monitoring device is assumed to have extremely high dependency, and only operates as an agent that operates in accordance with an instruction from the centralized monitoring device, and does not perform setting for individual monitoring devices. Therefore, inconsistency does not occur and the problem is solved.
具体的には、従来の分散監視装置が必要としていたネットワーク機器情報、構成情報、障害判定条件を、分散処理装置に登録することなく、ネットワーク監視を行うことができる。 Specifically, network monitoring can be performed without registering network device information, configuration information, and failure determination conditions required by a conventional distributed monitoring apparatus in the distributed processing apparatus.
上述した課題は、集中監視装置と、複数の分散処理装置とから構成され、集中監視装置は、ネットワークを構成するネットワーク機器と複数の分散処理装置との距離から、ネットワーク機器と通信する第1の分散処理装置を選択し、第1の分散処理装置にネットワーク機器のアドレスを送信し、第1の分散処理装置は、ネットワーク機器の状態を定期的に第1のパケットを送信し、ネットワーク機器の状態に変化があったとき、前期集中監視装置に第2のパケットを送信し、集中監視装置は、第2のパケットを受信したとき、アラームを発行するネットワーク監視システムにより、達成できる。 The above-described problem is configured by a centralized monitoring device and a plurality of distributed processing devices. The centralized monitoring device communicates with the network device from the distance between the network device constituting the network and the plurality of distributed processing devices. The distributed processing device is selected, the address of the network device is transmitted to the first distributed processing device, and the first distributed processing device periodically transmits the first packet as the status of the network device, and the status of the network device. When there is a change, the second packet is transmitted to the centralized monitoring apparatus in the previous period, and the centralized monitoring apparatus can be achieved by a network monitoring system that issues an alarm when receiving the second packet.
また、複数の分散処理装置と接続され、ネットワークを構成するネットワーク機器と複数の分散処理装置との距離から、ネットワーク機器と通信する第1の分散処理装置を選択し、第1の分散処理装置にネットワーク機器のアドレスを送信し、第1の分散処理装置からパケットを受信したとき、アラームを発行する集中監視装置により、達成できる。 In addition, a first distributed processing device that communicates with a network device is selected from the distances between the network devices that are connected to the plurality of distributed processing devices and configure the network, and the plurality of distributed processing devices. This can be achieved by a centralized monitoring device that transmits an address of a network device and issues an alarm when a packet is received from the first distributed processing device.
本発明によって、大規模ネットワークを監視する場合に必要となるコストが大幅に低減される。ここでいうコストとは、分散監視装置の機能を削減し、分散処理装置とすることで低減可能なハードウェアコストも含まれるが、それ以上に監視装置の運用、維持のためのコスト(すなわち人的コスト)も含む。人的コストの低減によって、大規模ネットワークに対する監視を容易に実現することができ、規模の大きなネットワークにおいても末端に至るまで監視を行うことが可能なため、ネットワークの信頼性の向上する。 The present invention significantly reduces the cost required when monitoring a large network. The cost mentioned here includes the hardware cost that can be reduced by reducing the functions of the distributed monitoring device and making it a distributed processing device. Cost). By reducing human costs, monitoring of a large-scale network can be easily realized, and even a large-scale network can be monitored to the end, so that the reliability of the network is improved.
以下本発明の実施の形態について、実施例を用い図4ないし図18を参照しながら、詳細に説明する。なお、以下の実施例において、同一部位には同じ参照番号を振り、説明は繰り返さない。ここで、図4は分散監視システムのブロック図である。図5はノードリストを説明する図である。図6は分散監視システムの機能ブロック図と動作を説明する図である。図7は分散監視ネットワークの構成を説明するブロック図である。図8はネットワーク機器情報のテーブルを説明する図である。図9はネットワーク構成情報のテーブルを説明する図である。図10は障害判定条件テーブルを説明する図である。図11はネットワークトポロジを説明する図である。図12は集中監視装置の対象ノードリスト作成処理を説明するフローチャートである。図13はノードリストの生成過程を説明する図である。図14は状態保持テーブルの生成を説明する図である。図15は状態保持テーブルを説明する図である。図16は複数の分散監視システムのネットワーク上の配置を説明する図である。図17および図18は同一ネットワーク上での分散処理装置の配置を説明する図である。 Hereinafter, embodiments of the present invention will be described in detail with reference to FIGS. 4 to 18 using examples. In the following examples, the same parts are denoted by the same reference numerals, and description thereof will not be repeated. Here, FIG. 4 is a block diagram of the distributed monitoring system. FIG. 5 is a diagram for explaining the node list. FIG. 6 is a functional block diagram of the distributed monitoring system and a diagram for explaining the operation. FIG. 7 is a block diagram illustrating the configuration of the distributed monitoring network. FIG. 8 is a diagram for explaining a table of network device information. FIG. 9 is a diagram illustrating a network configuration information table. FIG. 10 is a diagram for explaining the failure determination condition table. FIG. 11 is a diagram for explaining a network topology. FIG. 12 is a flowchart for explaining target node list creation processing of the centralized monitoring apparatus. FIG. 13 is a diagram for explaining a node list generation process. FIG. 14 is a diagram for explaining the generation of the state holding table. FIG. 15 is a diagram for explaining the state holding table. FIG. 16 is a diagram for explaining the arrangement of a plurality of distributed monitoring systems on a network. FIGS. 17 and 18 are diagrams for explaining the arrangement of distributed processing apparatuses on the same network.
図4において、分散監視システム500は、集中監視装置100Bと、2台の分散処理装置300と、監視対象である10台のネットワーク機器10とから構成されている。分散処理装置300−1は、ネットワーク機器10−1〜10−5と、通信処理を実施し、分散処理装置300−2は、ネットワーク機器10−6〜10−10と、通信処理を実施する。図4の分散監視システム500は、図1の分散監視システムと構成が類似している。しかし、集中監視装置100B、分散処理装置300が保有するノードリストは、図5に示すように異なる。
In FIG. 4, the distributed
図5において、図5(a)は集中監視装置100Bが保有するノードリスト20、図5(b)は分散処理装置300−1が保有するノードリスト20A−1、図5(c)は分散処理装置300−2が保有するノードリスト20A−2である。集中監視装置100Bが保有するノードリスト20は、図2のノードリスト20と同一である。一方、分散処理装置300が保有するノードリスト20Aは、自身が通信するネットワーク機器10のみのリストとなっている。すなわち、分散処理装置300は、ネットワークの全体構成を知らない状態にある。
5, FIG. 5A shows the
図4に戻って、分散処理装置300−1、300−2は、従来構成において分散監視装置200−1、200−2が実施していた機能の一部を実装したものであり、集中監視装置のエージェントとして処理の一部の担うものである。 Returning to FIG. 4, the distributed processing devices 300-1 and 300-2 are implemented with some of the functions performed by the distributed monitoring devices 200-1 and 200-2 in the conventional configuration. As part of the process.
そもそも大規模ネットワークを1台の監視装置のみで監視することが、現実できでないとされる大きな要因は、ネットワーク機器10に対する状態確認パケットの処理が、監視装置にとって負荷の高いためである。本実施例の構成では、ネットワーク機器10−1〜10−10への状態確認パケットの処理を、分散処理装置300−1、300−2で分散実施させることで、この問題を解決している。
In the first place, a major factor that makes it impossible to monitor a large-scale network with only one monitoring device is that the processing of the status confirmation packet for the
図6において、集中監視装置100Bは、対象ノード設定部130、監視機能部110B、記憶部140、通信部120Bとから構成される。分散処理装置300は、対象ノード登録部310、通信部330、記憶部320、監視機能部340とから構成される。なお、ネットワーク機器10は前述の通りの構成である。また、集中監視装置100Bの対象ノード設定部130は、対象ノードリスト111Bとノードリスト転送条件テーブル132を保持する。集中監視装置100Bの記憶部140は、対象ノードリスト141を保持する。集中監視装置100Bの監視機能部110Bは、障害状態判定条件テーブル112Bを保持する。一方、分散処理装置300の記憶部320は、対象ノードリスト321と、対象ノード状態保持テーブル322を保持する。
In FIG. 6, the
集中監視装置100Bは、集中監視装置100Aと比較して、対象ノード設定部130と記憶部140が追加されている。この対象ノード設定部130は、集中監視装置100Bに登録された全監視対象ノードを、分散処理装置300−1、300−2に分担させる処理を実施する部分であり、そのノードを記憶しておくための領域が記憶部140である。集中監視装置100Bのオペレータは、対象ノードリスト111Bに、集中監視装置100Bに監視させる全ノードを、登録する。オペレータは、またノードリスト転送条件を、ノードリスト転送条件テーブル132に登録する。この登録は、集中監視装置100Bで生成される対象ノードリストを、どのように分散処理装置300に配分するかを決定するための条件である。オペレータは、さらに障害判定条件テーブル112Bに障害状態判定条件を登録する。
Compared with the
ノードリスト転送条件テーブル132は、ノードリストを転送する分散処理装置300−1、300−2とその分散処理装置300−1、300−2が処理可能なノード数の上限値の組み合わせで構成される。これは集中監視装置100Bに登録された対象ノードリスト201をネットワーク内の分散処理装置300に割り振る際にその能力差に応じて対象ノードを配分するためのものである。
The node list transfer condition table 132 includes a combination of the distributed processing devices 300-1 and 300-2 that transfer the node list and the upper limit value of the number of nodes that can be processed by the distributed processing devices 300-1 and 300-2. . This is for allocating target nodes according to the difference in capability when the
集中監視装置100Bは、対象ノードリスト111Bとノード転送条件テーブル132に基づいて、対象ノードリストを生成し(S111)、対象ノードリスト141に記録する。集中監視装置100Bは、ネットワーク内のセグメント情報を元に対象となる分散処理装置300−1、300−2へノードリストを配分する。配分にあたっては、集中監視装置100Aが持つネットワークトポロジ情報を基に効果的な配分を行う。
The
配分が完了すると、通信部部120Bは、対象ノードリストを該当する分散処理装置300に転送する(S112)。 When the distribution is completed, the communication unit 120B transfers the target node list to the corresponding distributed processing device 300 (S112).
分散処理装置300は、通信部300にて対象ノードリストを受信すると(S113)、対象ノードリストを、対象ノード登録部310に転送する。対象ノード登録部310は、受信した対象ノードリストに基づいて記憶部320の対象ノードリスト321を更新する(S114)。分散処理装置300の監視機能b340は、対象ノードリスト321に登録された対象ノード10に対して、状態確認を実施する(S116)。監視機能部340は、対象ノード10からの、状態データを受信する(S117)。なお、ここで状態データの受信とは、予め定められた時間内に応答を受信しなかったことによる、タイムアウトを含む。
When the
監視機能部340は、対象ノード10からの状態データを受信した後、対象ノード10の状態判定を実施する(S118)。具体的には、ノードからの状態データが前回同様の機器から送信された状態データと比較して変化があったか否かを判定する。基本的にPingによって行われる状態確認の場合には、応答があったか否かで機器の正常性を確認しているため、ステップ118では前回の状態確認時にその対象機器からの応答があったか否かが判定基準となる。
After receiving the status data from the
状態判定において、状態が変化した(前回は応答ありだが今回は応答がない場合または前回は応答なしだが今回は応答があった場合)と判定された場合には、分散処理装置300は、集中監視装置100Bに対して、状態が変化したノードを通知する(S119)。通知される情報は、状態が変化したノードを集中監視装置100Bが特定するために必要な最低限の情報(状態変化が発生したノードが一意に特定可能な情報であり、具体的にはノードのIPアドレスである)であって、現在のノードの状態などは転送しない。なお、ステップ118では、監視機能部340は、記憶部320に記録された対象ノード状態保持テーブル322を参照して判定し、対象ノード状態保持テーブル322を更新する。ここで、対象ノード状態保持テーブル322のデフォルト値は、いずれの対象ノードも正常を意味する「応答有り」である。
In the state determination, if it is determined that the state has changed (when there was a response at the previous time but no response at this time or when there was no response at the previous time but there was a response this time), the distributed
集中監視装置100Bは、分散処理装置300からの状態変化ノードのIPアドレスを受信する(S121)と、分散処理装置300−1が通知してきたノードが自分の管理下にあるかどうか(すなわち対象ノードリスト111Bに含まれているかどうか)を確認する(S123)。自分の管理下にあるとき、集中監視装置100Bは、通知されたノードの状態がどのように変化したのかを再確認する(S122)。集中監視装置100Bは、ノードの状態を受信したとき(S124)、障害状態の判定を行い(S125)、アラーム発報(S126)などの処理を行う。
When the
ステップ124の障害状態の判定処理は、集中監視装置100Bから対象ノード10の状態を取得し、ステップ122のノード状態再確認がPingであればその応答の有無、SNMP(Simple Network Management Protocol)による状態収集の場合にはI/Fの状態などから障害状態であるか否かを判定する処理である。
The failure state determination process in step 124 acquires the state of the
集中監視装置100Bのステップ122の処理は、1つのネットワーク内に複数の集中監視装置100Bを設置する必要がある場合、複数の分散処理装置100Bで誤った設定がなされるなどして自装置が対象としていない機器の情報が転送されてきた場合、に破棄するための処理である。
The process of step 122 of the
図7を参照して、分散監視システム500のネットワーク構成の詳細を説明する。図7において、分散監視システム500は、センタ(セグメント1)に配置された集中監視装置100Bと分散処理装置300−1とネットワーク機器10−1と、拠点A(セグメント2)に配置されたネットワーク機器10−2と、拠点Bに配置された分散処理装置300−2とネットワーク機器10−3と、拠点C(セグメント4)に配置されたネットワーク機器10−4と、ネットワーク機器10間を接続するセグメント5〜7とから構成されていることとする。
Details of the network configuration of the distributed
図8を参照して、集中監視装置100Bおよび分散処理装置300が保持するネットワーク機器情報テーブルを説明する。なお、集中監視装置100Bが保持するネットワーク機器情報テーブルは、配下の全てのネットワーク機器10について、記載されている。一方、分散処理装置300が保持するネットワーク機器情報テーブルは、分散処理装置300の配下のネットワーク機器10についてのみ、記載されている。図8において、ネットワーク機器情報テーブル80は、種別81と名称82とI/F番号83とI/F種別84とIPアドレス85とから構成される。なお、ネットワーク機器情報テーブル80は、ノードリスト20と同じであっても良い。
With reference to FIG. 8, a network device information table held by the
図9を参照して、集中監視装置100Bが保持するネットワーク構成テーブル90を説明する。ネットワーク構成テーブル90は、通信機器91とI/F番号92と接続先93とから構成される。通信機器91には、集中監視装置100B、分散処理装置300、ネットワーク機器10とを含んで、ネットワーク構成テーブル90が構成されている。
With reference to FIG. 9, the network configuration table 90 held by the
図10を参照して、集中監視装置100Bが保持する障害判定条件テーブル112Bを説明する。障害判定条件テーブル112Bは、名称1121とI/F番号1122と監視対象1123とから構成される。
With reference to FIG. 10, the failure determination condition table 112B held by the
図11を参照して、分散処理装置から見たネットワークを説明する。図11において、ネットワークの構成は図7と同一である。しかし、図11(a)は、分散処理300−1から参照したネットワーク機器10の構成であり、図11(b)は、分散処理300−2から参照したネットワーク機器10の構成である。図11において、第1階層には、分散処理装置300−1、300−2がある。分散処理装置300−1の第2階層には、ネットワーク機器10−1があり、第3階層にはネットワーク機器10−2と10−3とがあり、第4階層にはネットワーク機器10−4がある。一方、分散処理装置300−2の第2階層には、ネットワーク機器10−3があり、第3階層にはネットワーク機器10−4と10−1とがあり、第4階層にはネットワーク機器10−1がある。
With reference to FIG. 11, a network viewed from the distributed processing apparatus will be described. In FIG. 11, the network configuration is the same as in FIG. However, FIG. 11A shows the configuration of the
図12を参照して、図6のステップ111を更に詳細に説明する。対象ノード設定部130は、対象ノードリスト111Bから対象ノードを読み込む(S501)。対象ノード設定部130は、ノード転送条件テーブル132を参照して、条件が一致しているか判定する(S502)。一致しているとき、対象ノード設定部130は、次ノードの処理処理に遷移する(S504)。一方、ステップ502で一致していないとき、対象ノード設定部130は、ネットワーク距離計算を実施する(S506)。対象ノード設定部130は、演算した結果に等距離があるかどうか判定する(S507)。等距離でないとき、近い分散処理装置の対象ノードリストに追加し(S508)、ステップ504に遷移する。一方、ステップ507で等距離の場合、ランダムな分散処理装置の対象ノードリストへ追加し(S509)、ステップ504に遷移する。
With reference to FIG. 12, step 111 of FIG. 6 will be described in more detail. The target
図13において、図13(a)は集中監視装置100Bが保持するノードリストである。図13(b)は集中管理装置100Bに入力される転送条件である。図13(c)は転送条件から決定される転送ノードリストのうち分散処理装置300−1が保持する転送ノードリストである。図13(d)は転送条件から決定される転送ノードリストのうち分散処理装置300−2が保持する転送ノードリストである。図13(e)は転送条件から未決の転送ノードリストである。図13(f)は未決のネットワーク装置10−4に対する分散処理装置300の距離である。図13(g)は分散処理装置300−1宛てに最終的に転送されるノードリストである。図13(h)は分散処理装置300−2宛てに最終的に転送されるノードリストである。
In FIG. 13, FIG. 13A shows a node list held by the
図13(e)に示すネットワーク装置10−4は、オペレータからの入力では分散処理装置が未決な装置であり、分散処理装置300からネットーク装置10−4までの距離を集中監視装置100Bが演算し、処理すべき分散処理装置300は、図13(f)において分散処理装置300−2であると判断している。
The network device 10-4 shown in FIG. 13E is a device whose distributed processing device has not yet been determined by input from the operator, and the
図14は、図6のステップ116ないしステップ118の処理を詳細に説明するものである。分散処理装置300の監視機能部340はPingを発行する(S601)と、Ping応答受信を待ち(S602)、状態保持テーブル322を参照して状態変化があったか判断する(S603)。ステップ603で状態変化していないと判断したときは次ノードに遷移し(S604)、ステップ603で状態変化したときは状態変化通知を集中監視装置に送信し(S605)、状態保持テーブル322を更新して(S606)、次ノードに遷移する(S604)。
FIG. 14 explains the processing in steps 116 to 118 in FIG. 6 in detail. When the
図15において、状態保持テーブル322は、ネットワーク機器名称と応答有無とから構成される。監視機能部340は、この状態保持テーブル322とPing応答有無とから、状態に変化があったとき状態変化通知を送信し、状態保持テーブル322を更新する。
In FIG. 15, the state holding table 322 is composed of network device names and presence / absence of responses. The
図16において、センタには2台の集中監視装置100B−1、100B−2と、3台の分散処理装置300−1〜300−3と、2台のネットワーク機器10−1、10−4を配置し、拠点Aにはネットワーク機器10−2、拠点Bにはネットワーク機器10−3、拠点Xにはネットワーク機器10−5を配置している。集中監視装置100B−1は、分散処理装置300−1、300−2と第1の監視システムを構成し、ネットワーク機器10−1、10−2、10−3を監視している。また、集中監視装置100B−2は、分散処理装置300−3と第2の監視システムを構成し、ネットワーク機器10−4、10−5を監視している。
In FIG. 16, two
図17において、センタには集中監視装置100Bと、2台の分散処理装置300−1、300−2と、2台のネットワーク機器10−1、10−5を配置し、拠点Aにはネットワーク機器10−2、拠点Bにはネットワーク機器10−3、拠点Cにはネットワーク機器10−4、拠点Xにはネットワーク機器10−6を配置している。図17の監視システムの形態は、複数台の分散処理装置と集中監視装置を1拠点に設置し大規模なネットワークを集中的に監視する形態である。この形態において、分散処理装置は純粋に集中監視装置の負荷低減のための処理装置として扱われる。
In FIG. 17, a
図18において、センタには集中監視装置100Bと、分散処理装置300−1と、2台のネットワーク機器10−1、10−5を配置し、拠点Aにはネットワーク機器10−2、拠点Bには分散処理装置300−2とネットワーク機器10−3、拠点Cにはネットワーク機器10−4、拠点Xにはネットワーク機器10−6を配置している。図18の監視システムの形態は、複数台の分散処理装置を監視対象ネットワーク内に分散して設置し、集中監視装置で統括的な管理を行う形態である。この形態においては、分散処理装置自体をネットワーク内に分散配置することにより、監視に利用されるトラフィック量の低減も期待できる。
In FIG. 18, a
10…ネットワーク機器、12…通信部、15…制御部、20…ノードリスト、100…集中監視装置、110…監視機能部、120…通信部、130…対象ノード設定部、140…記憶部、200…分散監視装置、210…監視機能部、220…通信部、300…分散処理装置、310…対象ノード登録部、320…記憶部、330…通信部、340…監視制御部、500…分散監視システム。
DESCRIPTION OF
Claims (6)
前記集中監視装置は、ネットワークを構成するネットワーク機器と前記複数の分散処理装置との距離から、前記ネットワーク機器と通信する第1の分散処理装置を選択し、前記第1の分散処理装置に前記ネットワーク機器のアドレスを送信し、
前記第1の分散処理装置は、前記ネットワーク機器の状態を定期的に第1のパケットを送信し、前記ネットワーク機器の状態に変化があったとき、前期集中監視装置に第2のパケットを送信し、
前記集中監視装置は、前記第2のパケットを受信したとき、アラームを発行することを特徴とするネットワーク監視システム。 In a network monitoring system composed of a centralized monitoring device and a plurality of distributed processing devices,
The centralized monitoring device selects a first distributed processing device that communicates with the network device based on the distance between the network device constituting the network and the plurality of distributed processing devices, and the network is selected as the first distributed processing device. Send the device address,
The first distributed processing device periodically transmits a first packet to the state of the network device, and transmits a second packet to the centralized monitoring device in the previous period when the state of the network device has changed. ,
The network monitoring system, wherein the centralized monitoring device issues an alarm when receiving the second packet.
前記集中監視装置は、前記第2のパケットを受信したとき、前記第2のパケットの対象のネットワーク機器が管理下にあるかどうか判定することを特徴とするネットワーク監視システム。 The network monitoring system according to claim 1,
The centralized monitoring device, when receiving the second packet, determines whether or not the network device targeted by the second packet is under management.
前記集中監視装置は、前記第2のパケットを受信したとき、前記第2のパケットの対象のネットワーク機器の状態を確認することを特徴とするネットワーク監視システム。 The network monitoring system according to claim 1 or 2,
The central monitoring apparatus, when receiving the second packet, checks a state of a target network device of the second packet.
ネットワークを構成するネットワーク機器と前記複数の分散処理装置との距離から、前記ネットワーク機器と通信する第1の分散処理装置を選択し、前記第1の分散処理装置に前記ネットワーク機器のアドレスを送信し、
前記第1の分散処理装置からパケットを受信したとき、アラームを発行することを特徴とする集中監視装置。 In a centralized monitoring device connected to a plurality of distributed processing devices,
A first distributed processing device that communicates with the network device is selected from the distances between the network devices constituting the network and the plurality of distributed processing devices, and the address of the network device is transmitted to the first distributed processing device. ,
A centralized monitoring device that issues an alarm when a packet is received from the first distributed processing device.
前記集中監視装置は、前記第2のパケットを受信したとき、前記パケットの対象のネットワーク機器が管理下にあるかどうか判定することを特徴とする集中監視装置。 The centralized monitoring device according to claim 4,
The centralized monitoring device, when receiving the second packet, determines whether or not a network device targeted for the packet is under management.
前記集中監視装置は、前記第2のパケットを受信したとき、前記パケットの対象のネットワーク機器の状態を確認することを特徴とする集中監視装置。 The centralized monitoring device according to claim 4 or 5,
The centralized monitoring device, when receiving the second packet, confirms a state of a network device targeted by the packet.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007100840A JP2008259047A (en) | 2007-04-06 | 2007-04-06 | Network monitoring system, and centralized monitoring apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007100840A JP2008259047A (en) | 2007-04-06 | 2007-04-06 | Network monitoring system, and centralized monitoring apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008259047A true JP2008259047A (en) | 2008-10-23 |
Family
ID=39982162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007100840A Pending JP2008259047A (en) | 2007-04-06 | 2007-04-06 | Network monitoring system, and centralized monitoring apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008259047A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010095588A1 (en) * | 2009-02-18 | 2010-08-26 | 日本電気株式会社 | Decentralized monitoring system, decentralized monitoring method and program |
WO2019012627A1 (en) * | 2017-07-12 | 2019-01-17 | 日本電気株式会社 | Network control system, method and program |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0787088A (en) * | 1993-09-17 | 1995-03-31 | Fujitsu Ltd | Network monitor form decision device |
JPH08340333A (en) * | 1995-06-12 | 1996-12-24 | Nec Corp | Intermediate monitor method for network monitor system and its device |
JPH10161952A (en) * | 1996-11-27 | 1998-06-19 | Toshiba Corp | Method and system for monitoring computer fault |
JP2001067292A (en) * | 1999-08-30 | 2001-03-16 | Nec Corp | State informing system for network management system |
JP2002281032A (en) * | 2001-03-16 | 2002-09-27 | Toshiba Corp | Switching program for object to be monitored and its method and monitor system |
JP2004221930A (en) * | 2003-01-15 | 2004-08-05 | Kddi Corp | Method, device and program for determining management range for managing distributed network |
-
2007
- 2007-04-06 JP JP2007100840A patent/JP2008259047A/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0787088A (en) * | 1993-09-17 | 1995-03-31 | Fujitsu Ltd | Network monitor form decision device |
JPH08340333A (en) * | 1995-06-12 | 1996-12-24 | Nec Corp | Intermediate monitor method for network monitor system and its device |
JPH10161952A (en) * | 1996-11-27 | 1998-06-19 | Toshiba Corp | Method and system for monitoring computer fault |
JP2001067292A (en) * | 1999-08-30 | 2001-03-16 | Nec Corp | State informing system for network management system |
JP2002281032A (en) * | 2001-03-16 | 2002-09-27 | Toshiba Corp | Switching program for object to be monitored and its method and monitor system |
JP2004221930A (en) * | 2003-01-15 | 2004-08-05 | Kddi Corp | Method, device and program for determining management range for managing distributed network |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010095588A1 (en) * | 2009-02-18 | 2010-08-26 | 日本電気株式会社 | Decentralized monitoring system, decentralized monitoring method and program |
JPWO2010095588A1 (en) * | 2009-02-18 | 2012-08-23 | 日本電気株式会社 | Distributed monitoring system, distributed monitoring method, and program |
US8560682B2 (en) | 2009-02-18 | 2013-10-15 | Nec Corporation | Distribution monitoring system, distribution monitoring method, and program |
JP5578445B2 (en) * | 2009-02-18 | 2014-08-27 | 日本電気株式会社 | Distributed monitoring system, distributed monitoring method, and program |
WO2019012627A1 (en) * | 2017-07-12 | 2019-01-17 | 日本電気株式会社 | Network control system, method and program |
JPWO2019012627A1 (en) * | 2017-07-12 | 2020-04-16 | 日本電気株式会社 | Network control system, method and program |
US11032144B2 (en) | 2017-07-12 | 2021-06-08 | Nec Corporation | Network control system, method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Paradis et al. | A survey of fault management in wireless sensor networks | |
Ward et al. | Observing the clouds: a survey and taxonomy of cloud monitoring | |
US10027574B2 (en) | Redundant pathways for network elements | |
JP5079917B2 (en) | Method for monitoring events in a communication network | |
JP5530864B2 (en) | Network system, management server, and management method | |
CN105024855A (en) | Distributed cluster management system and method | |
EP2394402A1 (en) | Interface monitoring for link aggregation | |
US7313735B1 (en) | In-line server health checking | |
US20120026870A1 (en) | Proxy agents in a network | |
CN102823194A (en) | Operations, administrations and management proxy and a method for handling operations, administrations and management messages | |
CN103036702A (en) | Network segment crossing N+1 backup method and network segment crossing N+1 backup device | |
CN104243232A (en) | Virtual network fault detection and location method | |
TW201340649A (en) | Multi-blade network traffic management apparatus with improved failure handling and methods thereof | |
JP4900358B2 (en) | Server management system, server management method, and server management program | |
JP4954420B2 (en) | Communications system | |
JP2008259047A (en) | Network monitoring system, and centralized monitoring apparatus | |
US9100302B2 (en) | Methods and systems for monitoring multicast availability | |
JP2016515343A (en) | Multi-ring reliable messaging system | |
US20070198993A1 (en) | Communication system event handling systems and techniques | |
JP2006148376A (en) | Network monitoring system, network superordinate monitoring system, network subordinate monitoring system, and network monitoring method | |
Duan et al. | Best effort broadcast under cascading failures in interdependent critical infrastructure networks | |
WO2018188528A1 (en) | Data center automated network troubleshooting system | |
JP5308399B2 (en) | Monitoring server system, communication device, and monitoring control network connection device | |
JP6733923B1 (en) | Network management system, network management method, and network management program | |
JP5761422B2 (en) | Management device, network system, integrated management system, management method, and management program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090924 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110215 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111011 |