JP2010087834A - Network monitoring system - Google Patents

Network monitoring system Download PDF

Info

Publication number
JP2010087834A
JP2010087834A JP2008254567A JP2008254567A JP2010087834A JP 2010087834 A JP2010087834 A JP 2010087834A JP 2008254567 A JP2008254567 A JP 2008254567A JP 2008254567 A JP2008254567 A JP 2008254567A JP 2010087834 A JP2010087834 A JP 2010087834A
Authority
JP
Japan
Prior art keywords
monitoring
server
network
monitoring server
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008254567A
Other languages
Japanese (ja)
Inventor
Daisuke Yamashita
乃丞 山下
Misaki Kakuno
みさき 角野
Shinichi Watabe
伸一 渡部
Hirokazu Nagai
浩和 永井
Keisuke Tagami
啓介 田上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2008254567A priority Critical patent/JP2010087834A/en
Publication of JP2010087834A publication Critical patent/JP2010087834A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a system for continuously monitoring a network element being subjected to monitoring by a monitoring server, the system continuing monitor processing without interruption even if any one of monitoring servers is stopped. <P>SOLUTION: Each of a plurality of monitoring servers monitors a network element of a predetermined monitor target among a plurality of network elements constituting a communication network. Each of the plurality of monitoring servers receives allocation information for extracting a network element, that is its own monitor target, from among the plurality of network elements and monitors the network element of the monitor target corresponding to the allocation information. When a management server connected to the plurality of monitoring servers detects that any one of the plurality of monitoring servers continues monitor processing, the management server transmits to any other monitoring server than the monitoring server that continues monitor processing, allocation information for extracting network elements including the network element that is the monitor target for the monitoring server which continues monitor processing. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、IPネットワークを構成する複数のネットワークエレメントの状態を監視するネットワーク監視システムに関する。   The present invention relates to a network monitoring system that monitors the states of a plurality of network elements that constitute an IP network.

従来、IP(Internet Protocol)ネットワークを構成するスイッチやルータ、ホストといったネットワーク機器、コンピュータ装置などのネットワークエレメント(以下、NEともいう)と遠隔から通信を行い、NEの状態を監視するように構成されたネットワーク監視システムが利用されている。   Conventionally, it is configured to remotely communicate with network elements (hereinafter also referred to as NE) such as network devices such as switches, routers, and hosts constituting an IP (Internet Protocol) network, and computer devices (hereinafter also referred to as NE), and monitor the state of the NE. A network monitoring system is used.

例えば、図9は、ネットワークを構成する複数台のNE600(NE600−1、NE600−2、NE600−3、・・・)の状態を監視サーバ700が監視するネットワーク監視システムの例を示す図である。監視サーバ700は、例えば5分間隔の周期でNE600のそれぞれにICMP(Internet Control Message Protocol)やSNMP(Simple Network Management Protocol)に基づいて、定期的に情報取得のための要求を送信する。NE600は、このような情報取得要求を受信した際に自身に何らかの異常が発生していれば、異常が発生したことを示すエラー情報を応答として送信する。監視サーバ700は、受信したエラー情報をエラーリストとして記憶して蓄積し、蓄積したエラーリストを自身のディスプレイに表示させる。ネットワークの管理者は、監視サーバ700のディスプレイに表示されるエラーリストを見ることで、NE600に発生した異常を知ることができ、故障の早期発見と復旧等の適切な処置を行うことができる。   For example, FIG. 9 is a diagram illustrating an example of a network monitoring system in which the monitoring server 700 monitors the state of a plurality of NEs 600 (NE600-1, NE600-2, NE600-3,...) Configuring a network. . For example, the monitoring server 700 periodically transmits a request for information acquisition to each NE 600 based on ICMP (Internet Control Message Protocol) or SNMP (Simple Network Management Protocol) at a period of 5 minutes. If any abnormality has occurred in the NE 600 when such an information acquisition request is received, the NE 600 transmits error information indicating that the abnormality has occurred as a response. The monitoring server 700 stores and accumulates the received error information as an error list, and displays the accumulated error list on its own display. The network administrator can know the abnormality that has occurred in the NE 600 by looking at the error list displayed on the display of the monitoring server 700, and can take appropriate measures such as early detection and recovery of a failure.

ここで、NE600と監視サーバ700とを接続する回線や監視サーバ700自体のハードウェア性能には限りがあるため、一台の監視サーバ700により監視可能なNE600の台数には限りがある。そこで、一台の監視サーバ700で監視できない程に大量のNE600を監視する場合、複数台の監視サーバ700を用いてNE600を監視することになる。例えば、図10は、大量のNE600(NE600−1〜NE600−9、・・・)を、複数台の監視サーバ700(監視サーバ700−1、監視サーバ700−2、監視サーバ700−3、・・・)により監視する例を示す図である。図10の例では、複数台の監視サーバ700が、ネットワークを構成する複数のNE600を分担して監視する。例えば、監視サーバ700−1は、NE600−1、NE600−2、NE600−3、・・・を監視対象とし、監視サーバ700−2は、NE600−4、NE600−5、NE600−6、・・・を監視対象とし、監視サーバ700−3は、NE600−7、NE600−8、NE600−9、・・・を監視対象としている。このように、複数台の監視サーバ700が大量のNE600の監視を分担することで、1台の監視サーバ700では監視しきれない数のNE600を監視することができる。   Here, since the performance of the line connecting the NE 600 and the monitoring server 700 and the hardware performance of the monitoring server 700 are limited, the number of NE 600 that can be monitored by one monitoring server 700 is limited. Therefore, when monitoring a large number of NEs 600 that cannot be monitored by one monitoring server 700, the NEs 600 are monitored using a plurality of monitoring servers 700. For example, FIG. 10 shows a large amount of NE600 (NE600-1 to NE600-9,...) And a plurality of monitoring servers 700 (monitoring server 700-1, monitoring server 700-2, monitoring server 700-3,. It is a figure which shows the example monitored by (*). In the example of FIG. 10, a plurality of monitoring servers 700 share and monitor a plurality of NEs 600 constituting a network. For example, the monitoring server 700-1 targets NE600-1, NE600-2, NE600-3,..., And the monitoring server 700-2 includes NE600-4, NE600-5, NE600-6,. .. Is a monitoring target, and the monitoring server 700-3 is monitoring targets NE600-7, NE600-8, NE600-9,. As described above, since a plurality of monitoring servers 700 share the monitoring of a large number of NEs 600, the number of NEs 600 that cannot be monitored by one monitoring server 700 can be monitored.

特許文献1には、監視サーバからネットワークエレメントへの監視経路が切断された場合に、他の通信経路を通して監視を継続する技術が提案されている。
特許文献2には、VRRP(Virtual Router Redundancy Protocol)に基づく通信を行うネットワークシステムにおいて、ルータの処理負荷に応じて稼動するルータを切り替え、不可分散を行う技術が提案されている。
特開2000−13373号公報 特開2003−46539号公報
Patent Document 1 proposes a technique for continuing monitoring through another communication path when the monitoring path from the monitoring server to the network element is disconnected.
Patent Document 2 proposes a technique for performing non-dispersion by switching a router that operates according to the processing load of a router in a network system that performs communication based on VRRP (Virtual Router Redundancy Protocol).
JP 2000-13373 A JP 2003-46539 A

しかしながら、複数の監視サーバ700がそれぞれ異なるNE600を監視する場合、監視サーバ700の故障時には、故障した監視サーバ700が監視対象とするNE600の状態監視が行えず、NE600に異常が発生したことを検知できない。そこで、監視サーバ700によるネットワーク監視システムの可用性を向上させるための対策として、同一の監視対象のNE600に対する監視サーバ700を複数台用意してデュアルシステムやデュプレックスシステムを構成することが考えられる。しかし、監視サーバ700を構成するコンピュータ装置は高価である場合が多く、特に大量のNE600を監視対象とする複数台の監視サーバ700のそれぞれのコンピュータ装置を複数台用意するのは導入、運用に多大なコストがかかるという問題がある。   However, when a plurality of monitoring servers 700 monitor different NEs 600, when the monitoring server 700 fails, the failure monitoring server 700 cannot monitor the status of the NE 600 to be monitored and detects that an abnormality has occurred in the NE 600. Can not. Therefore, as a measure for improving the availability of the network monitoring system by the monitoring server 700, it is conceivable to prepare a plurality of monitoring servers 700 for the same monitored NE 600 to form a dual system or a duplex system. However, the computer devices that constitute the monitoring server 700 are often expensive. In particular, preparing a plurality of computer devices for each of the plurality of monitoring servers 700 for monitoring a large number of NEs 600 is very difficult to introduce and operate. There is a problem that costs are high.

本発明は、このような状況に鑑みてなされたもので、ネットワークを監視する複数の監視サーバのいずれかが故障した場合の対策として、予め監視サーバ700を増設しておくことなく、監視対象となっているNE600への監視を途切れさせずに可用性を向上させるネットワーク監視システムを提供する。   The present invention has been made in view of such a situation. As a countermeasure when any of a plurality of monitoring servers that monitor a network fails, the monitoring target 700 can be monitored without adding the monitoring server 700 in advance. A network monitoring system that improves availability without interrupting monitoring of the NE 600 is provided.

上述した課題を解決するために、本発明は、通信ネットワークを構成する複数のネットワークエレメントのうち、予め定められた監視対象のネットワークエレメントを監視し、ネットワークエレメントから送信されるエラー情報を受信する複数の監視サーバと、複数の監視サーバのそれぞれから送信されるエラー情報が記憶される管理サーバとを備えたネットワーク監視システムであって、監視サーバは、管理サーバから、複数のネットワークエレメントから自身の監視対象のネットワークエレメントを抽出する割り振り情報を受信する受信部と、受信部が受信した割り振り情報に応じた監視対象のネットワークエレメントを監視するネットワークエレメント監視部と、を備え、管理サーバは、複数の監視サーバのうち、いずれかの監視サーバによるネットワークエレメントの監視処理が停止したことを検知する検知部と、検知部がネットワークエレメントの監視処理が停止したことを検知すると、監視処理を停止した監視サーバ以外の監視サーバに、監視処理を停止した監視サーバが監視対象としていたネットワークエレメントを含むネットワークエレメントを監視対象として抽出する割り振り情報を送信する割り振り情報送信部と、を備えることを特徴とする。   In order to solve the above-described problem, the present invention monitors a predetermined network element to be monitored among a plurality of network elements constituting a communication network, and receives error information transmitted from the network element. Monitoring server and a management server in which error information transmitted from each of the plurality of monitoring servers is stored, the monitoring server monitoring itself from a plurality of network elements from the management server A receiving unit that receives allocation information for extracting a target network element; and a network element monitoring unit that monitors a network element to be monitored according to the allocation information received by the receiving unit. One of the monitoring servers Stops the monitoring process on a monitoring server other than the monitoring server that stopped the monitoring process when the detection unit detects that the network element monitoring process has stopped and the detection unit detects that the network element monitoring process has stopped. And an allocation information transmitting unit that transmits allocation information for extracting the network element including the network element that has been the monitoring target.

また、本発明は、上述の管理サーバの割り振り情報送信部が送信する割り振り情報は、通信ネットワークを構成する複数のネットワークエレメントの全てから、監視サーバ以外の監視サーバのそれぞれが監視対象とするネットワークエレメントを抽出する割り振り情報であることを特徴とする。   Further, according to the present invention, the allocation information transmitted by the allocation information transmission unit of the management server described above is a network element that is monitored by each of the monitoring servers other than the monitoring server from all of the plurality of network elements constituting the communication network. It is the allocation information which extracts.

また、本発明は、上述の管理サーバの割り振り情報送信部が送信する割り振り情報は、監視処理を停止した監視サーバが監視対象としていたネットワークエレメントのみを、監視サーバ以外の監視サーバが追加の監視対象として抽出する割り振り情報であることを特徴とする。   Further, according to the present invention, the allocation information transmitted by the allocation information transmission unit of the management server described above includes only network elements that are monitored by the monitoring server that has stopped monitoring processing, and monitoring servers other than the monitoring server add additional monitoring targets. It is the allocation information extracted as follows.

また、本発明は、上述の監視サーバは、予め定められた監視周期ごとに監視対象のネットワークエレメントの監視処理を行い、管理サーバは、監視サーバの処理能力を示す監視サーバ情報が記憶される監視サーバ情報記憶部と、割り振り情報送信部によって送信される割り振り情報により監視サーバに監視対象として割り振られるネットワークエレメントと、監視サーバに対応する監視サーバ情報とに基づく監視サーバの監視処理の処理負荷が、予め定められた閾値を超える場合、監視サーバに、監視周期を延伸することを示す情報を送信することを特徴とする。   Further, according to the present invention, the above-described monitoring server performs monitoring processing of a network element to be monitored at every predetermined monitoring cycle, and the management server stores monitoring server information indicating the processing capacity of the monitoring server. The processing load of the monitoring process of the monitoring server based on the server information storage unit, the network element allocated to the monitoring server by the allocation information transmitted by the allocation information transmitting unit, and the monitoring server information corresponding to the monitoring server is When a predetermined threshold value is exceeded, information indicating that the monitoring cycle is extended is transmitted to the monitoring server.

また、本発明は、上述の管理サーバの監視サーバ情報記憶部に記憶される監視サーバ情報には、監視サーバのCPU使用率とメモリ量とによって監視サーバの処理能力を示す情報が含まれることを特徴とする。   According to the present invention, the monitoring server information stored in the monitoring server information storage unit of the management server includes information indicating the processing capacity of the monitoring server based on the CPU usage rate and the memory amount of the monitoring server. Features.

また、本発明は、上述の管理サーバの監視サーバ情報記憶部に記憶される監視サーバ情報には、監視サーバによるネットワークエレメントの監視処理の所要時間によって監視サーバの処理能力を示す情報が含まれることを特徴とする。   According to the present invention, the monitoring server information stored in the monitoring server information storage unit of the management server includes information indicating the processing capability of the monitoring server according to the time required for the monitoring process of the network element by the monitoring server. It is characterized by.

以上説明したように、本発明によれば、通信ネットワークを構成する複数のネットワークエレメントのうち、予め定められた監視対象のネットワークエレメントを監視する複数の監視サーバは、複数のネットワークエレメントから自身の監視対象のネットワークエレメントを抽出する割り振り情報を受信して、割り振り情報に応じた監視対象のネットワークエレメントを監視し、複数の監視サーバのそれぞれから送信されるエラー情報が記憶される管理サーバは、複数の監視サーバのうち、いずれかの監視サーバによる監視処理が停止したことを検知すると、監視処理を停止した監視サーバ以外の監視サーバに、監視処理を停止した監視サーバが監視対象としていたネットワークエレメントを含むネットワークエレメントを監視対象として抽出する割り振り情報を送信するようにしたので、複数の監視サーバのいずれかが停止したときにも、監視処理を停止した監視サーバが監視対象としていたネットワークエレメントの監視を他の監視サーバが行うことができ、監視対象のネットワークエレメントの監視を途切れさせずに続けることが可能となる。   As described above, according to the present invention, among a plurality of network elements constituting a communication network, a plurality of monitoring servers that monitor a predetermined network element to be monitored are monitored by the plurality of network elements. The management server that receives the allocation information for extracting the target network element, monitors the network element to be monitored according to the allocation information, and stores the error information transmitted from each of the plurality of monitoring servers. When it is detected that one of the monitoring servers has stopped the monitoring process, the monitoring server other than the monitoring server that stopped the monitoring process includes the network element that was monitored by the monitoring server that stopped the monitoring process. Extract network elements for monitoring Since the allocation information to be transmitted is transmitted, even if one of the monitoring servers stops, other monitoring servers can monitor the network element that was monitored by the monitoring server that stopped the monitoring process. It is possible to continue monitoring the network element to be monitored without interruption.

以下、本発明の一実施形態について、図面を参照して説明する。
図1は、本実施形態によるネットワークシステム1の構成を示す図である。本実施形態によるネットワークシステム1は、複数台のNE(ネットワークエレメント)100(NE100−1〜NE100−9、・・・)と、複数台の監視サーバ200(監視サーバ200−1、監視サーバ200−2、監視サーバ200−3、・・・)と、管理サーバ300と、APサーバ400と、複数台の監視用クライアント端末500(監視用クライアント端末500−1、監視用クライアント端末500−2、監視用クライアント端末500−3、・・・)とを備えている。ここで、NE100、監視サーバ200、管理サーバ300、APサーバ400、監視用クライアント端末500のそれぞれの台数は、NE100により構成されるIPネットワーク(a)の規模や、各機器の性能等に応じて定められ、構成されるようにして良い。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a diagram showing a configuration of a network system 1 according to the present embodiment. The network system 1 according to this embodiment includes a plurality of NEs (network elements) 100 (NE100-1 to NE100-9,...) And a plurality of monitoring servers 200 (monitoring server 200-1, monitoring server 200-). 2, monitoring server 200-3,...), Management server 300, AP server 400, and a plurality of monitoring client terminals 500 (monitoring client terminal 500-1, monitoring client terminal 500-2, monitoring) Client terminal 500-3, ...). Here, the number of the NE 100, the monitoring server 200, the management server 300, the AP server 400, and the monitoring client terminal 500 depends on the scale of the IP network (a) configured by the NE 100, the performance of each device, and the like. It may be defined and configured.

複数台のNE100は、IPネットワーク(a)を構成するスイッチやルータ、ホストサーバといったネットワーク機器、コンピュータ装置などであり、これらを総称してネットワークエレメントと呼ぶ。NE100は、自身を監視対象とする監視サーバ200から送信されるSNMPやICMPに基づく情報取得要求を受信し、応答する。ここで、NE100は、自身にエラーが発生している場合には、受信する情報取得要求に対してエラー情報を送信する。エラー情報には、NE100自身の識別情報やエラー内容などの情報が含まれる。   The plurality of NEs 100 are network devices such as switches, routers, and host servers constituting the IP network (a), computer devices, and the like, and are collectively referred to as network elements. The NE 100 receives and responds to an information acquisition request based on SNMP or ICMP transmitted from the monitoring server 200 that monitors itself. Here, if an error has occurred in the NE 100, the NE 100 transmits error information in response to the received information acquisition request. The error information includes information such as identification information of NE 100 itself and error contents.

複数台の監視サーバ200は、CPU(中央演算装置)、メモリ、HDD(ハードディスク)などを備え、それぞれに自身の監視対象として定められたNE100との間でICMPやSNMPに基づく通信を行い、監視対象のNE100の状態を監視するコンピュータ装置である。本実施形態における初期状態では、監視サーバ200−1の監視対象は、IPネットワーク(a)のうち、NE100−3、NE100−6、NE100−9、・・・により構成されるIPネットワーク(a−1)である。同様に、監視サーバ200−2の監視対象は、IPネットワーク(a)のうち、NE100−1、NE100−4、NE100−7、・・・により構成されるIPネットワーク(a−2)である。同様に、監視サーバ200−3の監視対象は、IPネットワーク(a)のうち、NE100−2、NE100−5、NE100−8、・・・により構成されるIPネットワーク(a−3)である。   The plurality of monitoring servers 200 are provided with a CPU (Central Processing Unit), a memory, an HDD (Hard Disk), etc., and perform communication based on ICMP and SNMP with the NE 100 determined as their monitoring targets. This is a computer device that monitors the state of the target NE 100. In the initial state in the present embodiment, the monitoring target of the monitoring server 200-1 is an IP network (a−) composed of NE100-3, NE100-6, NE100-9,. 1). Similarly, the monitoring target of the monitoring server 200-2 is the IP network (a-2) configured by the NE 100-1, NE 100-4, NE 100-7,... Of the IP network (a). Similarly, the monitoring target of the monitoring server 200-3 is the IP network (a-3) configured by the NE 100-2, NE 100-5, NE 100-8,... Of the IP network (a).

図2は、複数台の監視サーバ200と管理サーバ300との構成を詳細に示す図である。監視サーバ200−1は、NE情報記憶部210−1と、監視対象NE抽出部220−1と、通信部230−1と、NE監視部240−1と、OS(オペレーティングシステム)250−1とを備えている。複数台の監視サーバ200は同様の構成であるので、ここでは監視サーバ200−1の構成を代表して説明し、複数台の監視サーバ200のうち特定の監視サーバ200を識別する「−1」等の表記は省略して説明する。   FIG. 2 is a diagram showing in detail the configuration of a plurality of monitoring servers 200 and management servers 300. The monitoring server 200-1 includes an NE information storage unit 210-1, a monitoring target NE extraction unit 220-1, a communication unit 230-1, an NE monitoring unit 240-1, and an OS (operating system) 250-1. It has. Since the plurality of monitoring servers 200 have the same configuration, here, the configuration of the monitoring server 200-1 will be described as a representative, and “−1” for identifying a specific monitoring server 200 among the plurality of monitoring servers 200. The notation such as is omitted for explanation.

NE情報記憶部210には、自身の監視サーバ200が監視対象とするか否かに関わらず、IPネットワーク(a)が備える全てのNE100に関するNE情報が記憶される。図3は、NE情報記憶部210に記憶されるNE情報のデータ例を示す図である。NE情報は、NE100を識別するNE識別情報と、NE識別情報に対応するIPアドレスなどの情報が対応付けられた情報である。本実施形態では、NE識別情報が「1」である場合には図1におけるNE100−1を示し、NE識別情報が「2」である場合にはNE100−2を示すといったように、NE識別情報の数字(N)と、図1においてNE100の後に付された数字(NE100−N)とが対応することとする。NE情報記憶部210には、監視サーバ200の起動時に管理サーバ300からNE情報が送信され、記憶される。   The NE information storage unit 210 stores NE information related to all NEs 100 included in the IP network (a) regardless of whether or not the own monitoring server 200 is a monitoring target. FIG. 3 is a diagram illustrating a data example of NE information stored in the NE information storage unit 210. The NE information is information in which NE identification information for identifying the NE 100 is associated with information such as an IP address corresponding to the NE identification information. In the present embodiment, when the NE identification information is “1”, the NE identification information is shown as NE 100-1 in FIG. 1, and when the NE identification information is “2”, the NE identification information is shown. The number (N) in FIG. 1 corresponds to the number (NE100-N) added after NE100 in FIG. The NE information storage unit 210 transmits and stores NE information from the management server 300 when the monitoring server 200 is activated.

図2に戻り、監視対象NE抽出部220は、管理サーバ300から送信される割り振り情報と、予め定められた割り振り条件とに基づいて、NE情報記憶部210に記憶されたNE情報のうち、自身の監視サーバ200が監視対象とするNE100の識別情報を抽出する。例えば、管理サーバ300から送信される割り振り情報として、起動状態にある監視サーバ200の台数と、監視サーバ200毎の割り振り番号と、NE情報とを受信する。予め定められた割り振り条件には、NE情報に含まれるNE識別情報を、起動状態にある監視サーバ200の台数で割った余り(剰余)の値が、自身の割り振り番号に一致するNE識別情報を自身の監視対象とする条件を適用することができる。   Returning to FIG. 2, the monitoring target NE extraction unit 220 includes itself among the NE information stored in the NE information storage unit 210 based on the allocation information transmitted from the management server 300 and the predetermined allocation condition. The identification information of the NE 100 to be monitored by the monitoring server 200 is extracted. For example, as the allocation information transmitted from the management server 300, the number of monitoring servers 200 in the activated state, the allocation number for each monitoring server 200, and NE information are received. The predetermined allocation condition includes NE identification information in which the value of the remainder (remainder) obtained by dividing the NE identification information included in the NE information by the number of monitoring servers 200 in the active state matches the own allocation number. You can apply the conditions that you want to monitor.

例えば、監視サーバ200−1と、監視サーバ200−2と、監視サーバ200−3との3台が起動状態にあり、監視サーバ200−1には割り振り番号として「0」が割り振られ、監視サーバ200−2には割り振り番号として「1」が割り振られ、監視サーバ200−3には割り振り番号として「2」が割り振られ、NE情報に含まれるNE識別情報が1〜9であるとする割り振り情報が送られる。監視サーバ200が、この割り振り情報と上述の割り振り条件とに基づいて監視対象のNE100を抽出すると、監視サーバ200−1の監視対象は、NE情報に含まれるNE識別情報「1〜9」を起動状態にある監視サーバ200の台数「3」で割った余りが「0」となるNE100−3、NE100−6、NE100−9となる。同様に、監視サーバ200−2の監視対象はNE100−1、NE100−4、NE100−7となる。同様に、監視サーバ200−3の監視対象はNE100−2、NE100−5、NE100−8となる。   For example, three servers, a monitoring server 200-1, a monitoring server 200-2, and a monitoring server 200-3 are in an activated state, and “0” is allocated as an allocation number to the monitoring server 200-1, and the monitoring server Allocation information that “1” is allocated as the allocation number 200-2, “2” is allocated as the allocation number to the monitoring server 200-3, and the NE identification information included in the NE information is 1 to 9. Will be sent. When the monitoring server 200 extracts the NE 100 to be monitored based on this allocation information and the above-described allocation conditions, the monitoring target of the monitoring server 200-1 activates the NE identification information “1-9” included in the NE information. NE100-3, NE100-6, and NE100-9 in which the remainder obtained by dividing the number of monitoring servers 200 in the state by “3” is “0”. Similarly, the monitoring targets of the monitoring server 200-2 are NE100-1, NE100-4, and NE100-7. Similarly, the monitoring targets of the monitoring server 200-3 are NE100-2, NE100-5, and NE100-8.

通信部230は、ネットワークを介して管理サーバ300と情報の送受信を行う。
NE監視部240は、監視対象NE抽出部220によって監視対象として抽出されたNE識別情報に対応するNE100とICMPやSNMPに基づく通信を行い、監視対象のNE100を監視する。NE監視部240は、定められた周期ごとに監視対象のNE100に情報取得要求のポーリングを行い、NE100からエラーが発生したことを示すエラー情報を受信すると、通信部230を介して管理サーバ300に送信する。また、NE監視部240が通信部230を介して管理サーバ300に送信するエラー情報には、監視サーバ200からNE100への情報取得要求に対する応答として送信されるエラー情報の他に、情報取得要求に対してNE100が応答せず、応答がタイムアウトした場合のエラー情報や、NE100が、自身に異常が発生した場合に自発的に送信し、自身の変化を通知するSNMPトラップと呼ばれるエラー情報がある。
The communication unit 230 transmits / receives information to / from the management server 300 via the network.
The NE monitoring unit 240 communicates with the NE 100 corresponding to the NE identification information extracted as the monitoring target by the monitoring target NE extraction unit 220 based on ICMP or SNMP, and monitors the NE 100 to be monitored. The NE monitoring unit 240 polls the monitoring target NE 100 for an information acquisition request every predetermined period, and when receiving error information indicating that an error has occurred from the NE 100, the NE monitoring unit 240 notifies the management server 300 via the communication unit 230. Send. The error information transmitted from the monitoring server 200 to the management server 300 via the communication unit 230 includes, in addition to error information transmitted as a response to the information acquisition request from the monitoring server 200 to the NE 100, the information acquisition request. In contrast, there is error information when the NE 100 does not respond and the response times out, or error information called an SNMP trap that the NE 100 spontaneously transmits and notifies its own change when an abnormality occurs.

OS250は、監視サーバ200が備えるCPU、メモリ、HDDなどのハードウェアリソースを管理し、監視サーバ200が備える各機能部からの要求に応じてハードウェアリソースの資源割り当てを行う基本ソフトウェアである。OS250には、CPU、メモリ、HDDなどの各ハードウェアリソースの性能、容量、使用率、空き容量などがリアルタイムに記憶される。また、OS250は監視サーバ200が備えるNE監視部240などの各機能部にハードウェアリソースの資源割り当てを行っており、資源割り当てを行っているか否かによって各機能部のプロセスが起動状態にあるか否かを判定することが可能である。   The OS 250 is basic software that manages hardware resources such as a CPU, a memory, and an HDD provided in the monitoring server 200 and allocates hardware resources in response to requests from the functional units provided in the monitoring server 200. The OS 250 stores the performance, capacity, usage rate, free capacity, and the like of each hardware resource such as a CPU, memory, and HDD in real time. In addition, the OS 250 allocates hardware resources to each function unit such as the NE monitoring unit 240 included in the monitoring server 200, and whether the process of each function unit is in an activated state depending on whether the resource allocation is performed. It is possible to determine whether or not.

図1に戻り、管理サーバ300は、複数台の監視サーバ200に接続されたコンピュータ装置であり、監視サーバ200から送信されるエラー情報を受信して記憶するとともに、複数台の監視サーバ200の動作を管理する。図2を参照して、管理サーバ300の詳細な構成を説明する。管理サーバ300は、NE情報記憶部310と、通信部320と、監視サーバ状態取得部330と、監視サーバ情報記憶部340と、割り振り情報送信部350と、エラー情報記憶部360と、OS370とを備えている。   Returning to FIG. 1, the management server 300 is a computer device connected to a plurality of monitoring servers 200, receives and stores error information transmitted from the monitoring server 200, and operates the plurality of monitoring servers 200. Manage. The detailed configuration of the management server 300 will be described with reference to FIG. The management server 300 includes an NE information storage unit 310, a communication unit 320, a monitoring server state acquisition unit 330, a monitoring server information storage unit 340, an allocation information transmission unit 350, an error information storage unit 360, and an OS 370. I have.

NE情報記憶部310には、図3に示したNE情報が記憶されている。NE情報は、管理者からの操作情報の入力に応じて記憶される。NE情報記憶部310に記憶されたNE情報は、監視サーバ状態取得部330が、監視サーバ200が起動したことを検知すると、通信部320によって監視サーバ200に送信される。
通信部320は、ネットワークを介して複数台の監視サーバ200のそれぞれと情報の送受信を行う。通信部320は、例えば、監視サーバ200にNE情報を送信し、また、各監視サーバ200がNE100から受信したエラー情報を受信する。また、通信部320は、図1に示したAPサーバ400からの要求に応じて、エラー情報記憶部360に記憶されたNE100のエラー情報を送信する。
監視サーバ状態取得部330は、通信部320を介して監視サーバ200と通信を行い、監視サーバ200の状態を示す情報を取得して監視サーバ情報記憶部340に記憶させる。図4は、監視サーバ情報記憶部340に記憶される監視サーバ情報のデータ例を示す図である。監視サーバ情報には、監視サーバ識別情報に対応付けられて、起動フラグと、ポーリング所要時間と、CPU数と、CPU使用率と、メモリ容量と、HDD容量などの情報が含まれる。
The NE information storage unit 310 stores NE information shown in FIG. The NE information is stored in response to operation information input from the administrator. The NE information stored in the NE information storage unit 310 is transmitted to the monitoring server 200 by the communication unit 320 when the monitoring server state acquisition unit 330 detects that the monitoring server 200 is activated.
The communication unit 320 transmits / receives information to / from each of the plurality of monitoring servers 200 via the network. For example, the communication unit 320 transmits NE information to the monitoring server 200 and receives error information received from the NE 100 by each monitoring server 200. Further, the communication unit 320 transmits the NE 100 error information stored in the error information storage unit 360 in response to the request from the AP server 400 illustrated in FIG.
The monitoring server state acquisition unit 330 communicates with the monitoring server 200 via the communication unit 320, acquires information indicating the state of the monitoring server 200, and stores the information in the monitoring server information storage unit 340. FIG. 4 is a diagram illustrating an example of monitoring server information data stored in the monitoring server information storage unit 340. The monitoring server information includes information such as a start flag, a polling required time, the number of CPUs, a CPU usage rate, a memory capacity, and an HDD capacity in association with the monitoring server identification information.

監視サーバ情報に含まれる監視サーバ識別情報は、複数台の監視サーバ200のそれぞれを識別する情報である。起動フラグは、監視サーバ識別情報に示される監視サーバ200のNE監視部240が起動状態にあるか停止状態にあるかを示す情報である。例えば、起動フラグには、監視サーバ200のNE監視部240が起動状態であれば「1」が、停止状態であれば「0」が記憶される。例えば、監視サーバ状態取得部330は、監視サーバ200のOS250を介してNE監視部240のプロセスに通信要求を行い、応答があればNE監視部240は起動状態であると判定し、応答がなければNE監視部240は停止状態であると判定する。   The monitoring server identification information included in the monitoring server information is information for identifying each of the plurality of monitoring servers 200. The activation flag is information indicating whether the NE monitoring unit 240 of the monitoring server 200 indicated by the monitoring server identification information is in an activated state or a stopped state. For example, “1” is stored in the activation flag if the NE monitoring unit 240 of the monitoring server 200 is in the activated state, and “0” is stored in the suspended state. For example, the monitoring server state acquisition unit 330 makes a communication request to the process of the NE monitoring unit 240 via the OS 250 of the monitoring server 200. If there is a response, the NE monitoring unit 240 determines that the NE monitoring unit 240 is in an activated state and there is no response. For example, the NE monitoring unit 240 determines that it is in a stopped state.

監視サーバ情報に含まれるポーリング所要時間は、監視サーバ200が監視対象とするNE100にポーリングを行い、監視対象の全てのNE100から応答を受信するまでの実績の所要時間である。監視サーバ状態取得部330は、通信部320を介して監視サーバ200のNE監視部240からポーリング所要時間を取得して監視サーバ情報記憶部340に記憶させる。   The polling required time included in the monitoring server information is an actual required time until the monitoring server 200 polls the NE 100 to be monitored and receives responses from all the NEs 100 to be monitored. The monitoring server state acquisition unit 330 acquires the required polling time from the NE monitoring unit 240 of the monitoring server 200 via the communication unit 320 and stores it in the monitoring server information storage unit 340.

監視サーバ情報に含まれるCPUは、監視サーバ200に備えられるCPUの個数やクロック数などの性能を示す情報である。CPU使用率は、監視サーバ200にて実行されているソフトウェアが単位時間あたりにCPUを占有している時間の割合であり、例えば0%付近であれば何も実行されていないことを示し、100%であれば継続して処理が実行されており、100%付近の状態が続く場合にはCPUの処理能力を超えた処理要求が行われていることを示す。メモリ容量は、監視サーバ200に備えられるメモリの容量を示す情報である。HDD空き容量は、監視サーバ200に備えられるHDDのうち、空き容量を示す情報である。ここで、起動フラグや、CPU、CPU使用率、メモリ容量、HDD空き容量等のマシン性能情報は、監視サーバ200のOS250と通信を行うことにより取得することができる。   The CPU included in the monitoring server information is information indicating performance such as the number of CPUs and the number of clocks provided in the monitoring server 200. The CPU usage rate is a ratio of the time that the software executed on the monitoring server 200 occupies the CPU per unit time. For example, if it is around 0%, nothing is executed. If it is%, processing is continuously executed, and if the state near 100% continues, it indicates that a processing request exceeding the processing capacity of the CPU is being performed. The memory capacity is information indicating the capacity of the memory provided in the monitoring server 200. The HDD free capacity is information indicating the free capacity of the HDDs provided in the monitoring server 200. Here, machine performance information such as a start flag, CPU, CPU usage rate, memory capacity, HDD free capacity, and the like can be acquired by communicating with the OS 250 of the monitoring server 200.

割り振り情報送信部350は、監視サーバ状態取得部330が監視サーバ200のNE監視部240が起動または停止し、起動状態が変化したことを検知すると、NE情報記憶部310に記憶されたNE情報と、監視サーバ情報記憶部340に記憶された監視サーバ情報とに基づいて割り振り情報を生成し、起動状態にある監視サーバ200に送信する。例えば、割り振り情報には、上述のように、起動状態にある監視サーバ200の台数と、NE情報記憶部310に記憶されたNE情報と、監視サーバ200への割り振り番号とが含まれる。ここで、割り振り番号には、0以上かつ起動状態にある監視サーバ200の台数以下の数字であって、監視サーバ200のそれぞれに一意となる数字が付与される。
エラー情報記憶部360には、監視サーバ200から送信され、通信部320が受信したNE100のエラー情報が記憶される。
OS370は、監視サーバ200が備えるCPU、メモリ、HDDなどのハードウェアリソースを管理し、監視サーバ200が備える各機能部からの要求に応じてハードウェアリソースの資源割り当てを行う基本ソフトウェアである。
When the monitoring server state acquisition unit 330 detects that the NE monitoring unit 240 of the monitoring server 200 is activated or stopped and the activation state has changed, the allocation information transmission unit 350 detects the NE information stored in the NE information storage unit 310 and The allocation information is generated based on the monitoring server information stored in the monitoring server information storage unit 340, and is transmitted to the monitoring server 200 in the activated state. For example, as described above, the allocation information includes the number of monitoring servers 200 in the activated state, NE information stored in the NE information storage unit 310, and an allocation number to the monitoring server 200. Here, the allocation number is a number that is greater than or equal to 0 and equal to or less than the number of monitoring servers 200 in the activated state, and is unique to each monitoring server 200.
The error information storage unit 360 stores NE100 error information transmitted from the monitoring server 200 and received by the communication unit 320.
The OS 370 is basic software that manages hardware resources such as a CPU, a memory, and an HDD included in the monitoring server 200 and allocates hardware resources according to requests from each functional unit included in the monitoring server 200.

図1に戻り、APサーバ400は、監視用クライアント端末500からの要求に応じて管理サーバ300のエラー情報記憶部360に記憶されたNE100のエラー情報を読み出し、監視用クライアント端末500に送信する。本実施形態では、APサーバ400はウェブサービス機能部を備えており、管理サーバ300から読み出した異常通知を、HTTP(HyperText Transfer Protocol)などの通信により監視用クライアント端末500に送信する。   Returning to FIG. 1, the AP server 400 reads the NE 100 error information stored in the error information storage unit 360 of the management server 300 in response to a request from the monitoring client terminal 500 and transmits the NE 100 error information to the monitoring client terminal 500. In this embodiment, the AP server 400 includes a web service function unit, and transmits an abnormality notification read from the management server 300 to the monitoring client terminal 500 by communication such as HTTP (HyperText Transfer Protocol).

監視用クライアント端末500は、APサーバ400から送信される複数のNE100の状態を出力するコンピュータ端末である。監視用クライアント端末500は、IPネットワーク(a)の管理者に利用され、管理者からの要求に応じてAPサーバ400から監視対象のNE100のエラー情報を受信して表示する。本実施形態では、監視用クライアント端末500は、ウェブブラウザ機能部を備えており、APサーバ400と通信を行って、APサーバ400から送信されるエラー情報を自身が備えるディスプレイに出力する。ここで、監視用クライアント端末500は、例えば、NE100にエラーが発生した発生日時、エラー情報に対応するエラーメッセージ、エラー情報を送信したNE100のIPアドレスなどを表示する。IPネットワーク(a)の管理者は、監視用クライアント端末500に表示される異常通知によって監視対象のNE100の状態や発生した異常を知ることができ、故障の早期発見と復旧等の適切な処置を行うことができる。   The monitoring client terminal 500 is a computer terminal that outputs the states of a plurality of NEs 100 transmitted from the AP server 400. The monitoring client terminal 500 is used by an administrator of the IP network (a), receives error information of the NE 100 to be monitored from the AP server 400 and displays it in response to a request from the administrator. In this embodiment, the monitoring client terminal 500 includes a web browser function unit, communicates with the AP server 400, and outputs error information transmitted from the AP server 400 to a display included in the monitoring client terminal 500. Here, the monitoring client terminal 500 displays, for example, the date and time when the error occurred in the NE 100, the error message corresponding to the error information, the IP address of the NE 100 that transmitted the error information, and the like. The administrator of the IP network (a) can know the state of the NE 100 to be monitored and the abnormality that has occurred by the abnormality notification displayed on the monitoring client terminal 500, and can take appropriate measures such as early detection and recovery of the failure. It can be carried out.

次に、図5を参照して、監視サーバ200−1のNE監視部240−1が停止した場合に監視対象の再割り振りが行われる動作例を説明する。
初期状態では、監視サーバ200−1、監視サーバ200−2、監視サーバ200−3のいずれもが起動状態であり、図1に示したそれぞれの監視対象のNE100に情報取得要求を送信してポーリングによる監視を行っているとする。監視サーバ200−1のNE監視部240−1にエラーが発生し、動作が停止すると(ステップS1)、管理サーバ300の監視サーバ状態取得部330が、監視サーバ200−1のNE監視部240−1が停止したことを検知する(ステップS2)。
Next, with reference to FIG. 5, an operation example in which reallocation of monitoring targets is performed when the NE monitoring unit 240-1 of the monitoring server 200-1 is stopped will be described.
In the initial state, all of the monitoring server 200-1, the monitoring server 200-2, and the monitoring server 200-3 are activated, and polling is performed by transmitting an information acquisition request to each of the monitoring target NEs 100 illustrated in FIG. Suppose that monitoring is performed. When an error occurs in the NE monitoring unit 240-1 of the monitoring server 200-1 and the operation stops (step S1), the monitoring server state acquisition unit 330 of the management server 300 causes the NE monitoring unit 240- of the monitoring server 200-1 to operate. 1 is detected (step S2).

管理サーバ300の割り振り情報送信部350は、NE情報記憶部310から読み出したNE情報に基づいて、監視サーバ200−2と監視サーバ200−3とに対応する割り振り情報を生成して送信する(ステップS3)。ここで、割り振り情報に含まれる起動状態の監視サーバ200の台数を示す情報は2台であり、NE情報に含まれるNE識別情報は1〜9であり、監視サーバ200−2の割り振り番号は0であり、監視サーバ200−3の割り振り番号は1であるとする。   Based on the NE information read from the NE information storage unit 310, the allocation information transmission unit 350 of the management server 300 generates and transmits allocation information corresponding to the monitoring server 200-2 and the monitoring server 200-3 (step). S3). Here, the information indicating the number of activated monitoring servers 200 included in the allocation information is two, the NE identification information included in the NE information is 1 to 9, and the allocation number of the monitoring server 200-2 is 0. It is assumed that the allocation number of the monitoring server 200-3 is 1.

監視サーバ200−2は、送信された割り振り情報を受信すると、割り振り情報に含まれるNE情報をNE情報記憶部210−2に記憶させる。監視サーバ200−2の監視対象NE抽出部220−1は、管理サーバ300から受信した割り振り情報と、予め定められ自身の記憶領域に記憶された割り振り条件とに基づいて、NE情報記憶部210−2に記憶させたNE情報のうち、自身の監視対象とするNE識別情報を抽出する(ステップS4)。ここで、監視対象NE抽出部220−2が抽出する監視対象のNE識別情報は、NE情報に含まれるNE識別情報「1〜9」を、起動状態にある監視サーバ200の台数「2」で割った余りが「0」となるNE100−2、NE100−4、NE100−6、NE100−8である。NE監視部240−2は、監視対象NE抽出部220−2が抽出したNE識別情報に対応する監視対象のNE100の監視を行う(ステップS5)。   When receiving the transmitted allocation information, the monitoring server 200-2 stores the NE information included in the allocation information in the NE information storage unit 210-2. The monitoring target NE extraction unit 220-1 of the monitoring server 200-2 is based on the allocation information received from the management server 300 and the allocation conditions stored in its own storage area in advance. 2 is extracted from the NE information stored in 2 (step S4). Here, the NE identification information of the monitoring target extracted by the monitoring target NE extraction unit 220-2 is the NE identification information “1 to 9” included in the NE information by the number “2” of the monitoring servers 200 in the activated state. These are NE100-2, NE100-4, NE100-6, NE100-8 in which the remainder is "0". The NE monitoring unit 240-2 monitors the monitoring target NE 100 corresponding to the NE identification information extracted by the monitoring target NE extraction unit 220-2 (step S5).

同様に、監視サーバ200−3の監視対象NE抽出部220−3が、監視対象のNE識別情報を抽出する(ステップS6)。ここで、監視対象NE抽出部220−3が抽出する監視対象のNE識別情報は、NE情報に含まれるNE識別情報「1〜9」を、起動状態にある監視サーバ200の台数「2」で割った余りが「1」となるNE100−1、NE100−3、NE100−5、NE100−7、NE100−9である。NE監視部240−3は、監視対象NE抽出部220−3が抽出したNE識別情報に対応する監視対象のNE100の監視を行う(ステップS7)。図6は、このように監視対象の再割り振りが行われた後のネットワークシステム1の監視状態を示す図である。   Similarly, the monitoring target NE extraction unit 220-3 of the monitoring server 200-3 extracts NE identification information to be monitored (step S6). Here, the NE identification information of the monitoring target extracted by the monitoring target NE extraction unit 220-3 is the NE identification information “1 to 9” included in the NE information by the number “2” of the monitoring servers 200 in the activated state. The NE100-1, NE100-3, NE100-5, NE100-7, and NE100-9 are those whose remainder is "1". The NE monitoring unit 240-3 monitors the monitoring target NE 100 corresponding to the NE identification information extracted by the monitoring target NE extraction unit 220-3 (step S7). FIG. 6 is a diagram illustrating a monitoring state of the network system 1 after the reallocation of the monitoring target is performed as described above.

このように、大量のNE100の監視を複数台の監視サーバ200が分担して監視するネットワークシステム1において、複数台の監視サーバ200のうちのいずれかの監視サーバ200にエラーが発生して停止した場合に、停止した監視サーバ200の監視対象とするNE100の監視を他の監視サーバ200に再割り振りを行うようにすれば、監視サーバ200が故障した場合にも、監視対象とする全てのNE100に対する監視を途切れさせることなく、また予め監視サーバ200を増設しておくことなく、NE100の監視の可用性を高めることが可能となる。なお、監視サーバ200により行われる監視対象の割り振りは、管理サーバ300で行うようにしても良い。この場合、管理サーバにより生成された監視対象の割り振りを示す割り振り結果情報が各監視サーバ200に送信され、各監視サーバ200は、管理サーバ200から受信した割り振り結果情報に基づいて監視対象のNE100を監視する。   As described above, in the network system 1 in which a large number of monitoring servers 200 share and monitor a large number of NEs 100, one of the monitoring servers 200 has stopped due to an error. In this case, if the monitoring of the NE 100 that is the monitoring target of the stopped monitoring server 200 is re-allocated to another monitoring server 200, even if the monitoring server 200 breaks down, all the NEs 100 that are the monitoring target are monitored. It is possible to increase the availability of monitoring of the NE 100 without interrupting monitoring and without adding the monitoring server 200 in advance. The allocation of the monitoring target performed by the monitoring server 200 may be performed by the management server 300. In this case, the allocation result information indicating the allocation of the monitoring target generated by the management server is transmitted to each monitoring server 200, and each monitoring server 200 determines the NE 100 to be monitored based on the allocation result information received from the management server 200. Monitor.

<第2の実施形態>
次に、本発明の第2の実施形態について説明する。第1の実施形態では、複数の監視サーバ200のうちいずれかの監視サーバ200が停止状態となった場合、稼動中の監視サーバ200に管理サーバ300が割り振り情報を送信し、監視サーバ200の監視対象のNE100の再割り振りを行う例を説明した。ここで、多数の監視サーバ200がエラーの発生や工事などで停止状態となり、稼動中の監視サーバ200の台数が著しく減少した場合、稼動中の監視サーバ200に、その処理能力を超えて監視対象のNE100が割り振られることが考えられる。そこで、監視サーバ200の処理負荷が一定の閾値を超えることが推測される場合、監視サーバ200がNE100を監視する監視周期を延伸し、監視サーバ200に過剰な負荷がかからないように縮退運転を行うようにしても良い。
<Second Embodiment>
Next, a second embodiment of the present invention will be described. In the first embodiment, when any one of the plurality of monitoring servers 200 is stopped, the management server 300 transmits the allocation information to the active monitoring server 200, and the monitoring server 200 monitors the monitoring server 200. An example of performing reallocation of the target NE 100 has been described. Here, if a large number of monitoring servers 200 are stopped due to an error or construction, and the number of operating monitoring servers 200 is remarkably reduced, the monitoring servers 200 in operation exceed the processing capacity and are monitored. It is conceivable that the NE100 is allocated. Therefore, when it is estimated that the processing load of the monitoring server 200 exceeds a certain threshold value, the monitoring server 200 extends the monitoring cycle for monitoring the NE 100 and performs a degenerate operation so that the monitoring server 200 is not overloaded. You may do it.

この場合、例えば、図7に示すように、管理サーバ300に監視対象NE抽出部380と監視周期算出部390とを設ける。
監視対象NE抽出部380は、監視サーバ200が備える監視対象NE抽出部220と同様の処理を行う。すなわち、監視対象NE抽出部380は、割り振り情報送信部350によって生成される割り振り情報と、予め定められた割り振り条件とに基づいて、監視サーバ200のそれぞれが監視対象とするNE100の識別情報を抽出する。
In this case, for example, as illustrated in FIG. 7, the management server 300 includes a monitoring target NE extraction unit 380 and a monitoring cycle calculation unit 390.
The monitoring target NE extraction unit 380 performs the same processing as the monitoring target NE extraction unit 220 included in the monitoring server 200. That is, the monitoring target NE extraction unit 380 extracts the identification information of the NE 100 to be monitored by each of the monitoring servers 200 based on the allocation information generated by the allocation information transmission unit 350 and a predetermined allocation condition. To do.

監視周期算出部390は、監視サーバ200が監視対象のNE100にポーリングを行う周期を算出する。ここで、監視周期算出部390は、監視対象NE抽出部380が抽出した監視サーバ200毎の監視対象のNE100の割り振り台数と、監視サーバ情報記憶部340に記憶された監視サーバ200のマシン性能(CPU使用率、メモリ容量など)とに基づいて監視サーバ200の処理負荷を算出する。監視周期算出部390は、算出した監視サーバ200の処理負荷が予め定められた閾値を超える場合、処理負荷が閾値を下回る監視サーバ200の監視周期を算出する。監視周期算出部390が算出した監視周期は、通信部320を介して監視サーバ200に送信される。監視サーバ200のNE監視部240は、管理サーバ300から送信される監視周期に応じた周期で、監視対象のNE100にポーリングを行う。   The monitoring cycle calculation unit 390 calculates a cycle in which the monitoring server 200 polls the NE 100 to be monitored. Here, the monitoring cycle calculation unit 390 allocates the number of monitoring target NEs 100 for each monitoring server 200 extracted by the monitoring target NE extraction unit 380 and the machine performance of the monitoring server 200 stored in the monitoring server information storage unit 340 ( The processing load of the monitoring server 200 is calculated based on the CPU usage rate, the memory capacity, and the like. When the calculated processing load of the monitoring server 200 exceeds a predetermined threshold, the monitoring cycle calculation unit 390 calculates the monitoring cycle of the monitoring server 200 where the processing load falls below the threshold. The monitoring period calculated by the monitoring period calculation unit 390 is transmitted to the monitoring server 200 via the communication unit 320. The NE monitoring unit 240 of the monitoring server 200 polls the NE 100 to be monitored at a cycle corresponding to the monitoring cycle transmitted from the management server 300.

<第3の実施形態>
次に、本発明の第3の実施形態について説明する。第2の実施形態では、監視対象の再割り振りを行うと、監視サーバ200の処理負荷が予め定められた閾値を超える場合に、監視サーバ200のマシン性能に応じてNE100の監視周期を延伸して縮退運転を行う例を説明した。ここで、監視サーバ200がNE100を監視する監視周期は、監視サーバ情報記憶部340に記憶される監視サーバ情報に含まれるポーリング所要時間に基づき、安全率を考慮して算出するようにしても良い。例えば、監視周期算出部390は、特定の監視サーバ200の監視対象のNE100の台数とポーリング所要時間との比に応じて、再割り振りによって増加する監視対象の台数に応じたポーリング所要時間を推測して算出し、ポーリング時間の推測値に安全率(例えば、1.5倍)を乗じた時間を、NE100を監視する監視周期として算出するようにしても良い。
<Third Embodiment>
Next, a third embodiment of the present invention will be described. In the second embodiment, when reallocation of a monitoring target is performed, if the processing load of the monitoring server 200 exceeds a predetermined threshold, the monitoring cycle of the NE 100 is extended according to the machine performance of the monitoring server 200. The example which performs degenerate operation was demonstrated. Here, the monitoring cycle in which the monitoring server 200 monitors the NE 100 may be calculated in consideration of the safety factor based on the polling required time included in the monitoring server information stored in the monitoring server information storage unit 340. . For example, the monitoring cycle calculation unit 390 estimates the polling required time according to the number of monitoring targets increased by the reallocation according to the ratio of the number of monitoring target NEs 100 of the specific monitoring server 200 and the required polling time. The time obtained by multiplying the estimated polling time by a safety factor (for example, 1.5 times) may be calculated as a monitoring cycle for monitoring the NE 100.

<第4の実施形態>
次に、本発明の第4の実施形態について説明する。第1の実施形態では、複数の監視サーバ200のうちいずれかの監視サーバ200が停止状態となった場合、稼動中の監視サーバ200の全てに管理サーバ300が割り振り情報を送信し、監視サーバ200の監視対象のNE100の再割り振りを行う例を説明した。ここで、監視対象NE100の再割り振りは、停止した監視サーバ200が監視対象としていたNE100のみを、稼動中の監視サーバ200に割り振るようにしても良い。例えば、図8に示すように、図1において監視サーバ200−1の監視対象であったNE100−3を監視サーバ200−2の監視対象として割り振り、監視サーバ200−1の監視対象であったNE100−6、NE100−9を監視サーバ200−3の監視対象に割り振る。これにより、全ての監視サーバ200の監視対象の再割り振りを行うことに比べて、監視対象の割り振りに変動のあるNE100の数が少なくなり、効率よく監視対象の再割り振りを行うことができる。
<Fourth Embodiment>
Next, a fourth embodiment of the present invention will be described. In the first embodiment, when any one of the plurality of monitoring servers 200 is stopped, the management server 300 transmits the allocation information to all of the active monitoring servers 200, and the monitoring server 200 An example of performing reallocation of the NE 100 to be monitored has been described. Here, the reallocation of the monitoring target NE100 may be performed by allocating only the NE100 that is the monitoring target of the stopped monitoring server 200 to the active monitoring server 200. For example, as shown in FIG. 8, the NE 100-3 that is the monitoring target of the monitoring server 200-1 in FIG. 1 is allocated as the monitoring target of the monitoring server 200-2, and the NE 100 that is the monitoring target of the monitoring server 200-1 is allocated. -6, NE100-9 is allocated to the monitoring target of the monitoring server 200-3. As a result, the number of NEs 100 that vary in the allocation of monitoring targets is reduced compared to performing the reallocation of monitoring targets of all the monitoring servers 200, and the monitoring targets can be efficiently reassigned.

なお、上述の実施形態では、稼動中の監視サーバ200の台数に応じて、監視対象のNE100を割り振るようにしたが、稼動中の監視サーバ200のマシン性能に応じて監視対象のNE100を割り振るようにしても良い。ここで、マシン性能は、例えば、監視サーバ情報記憶部340に記憶される監視サーバ情報に含まれるCPU使用率やメモリ容量などを用いることができる。例えば、監視サーバ200−2のメモリ量が監視サーバ200−2のメモリ量の倍であれば、倍の数のNE100を監視対象として割り振ることが考えられる。   In the above-described embodiment, the monitoring target NE 100 is allocated according to the number of operating monitoring servers 200. However, the monitoring target NE 100 is allocated according to the machine performance of the operating monitoring server 200. Anyway. Here, as the machine performance, for example, a CPU usage rate or a memory capacity included in the monitoring server information stored in the monitoring server information storage unit 340 can be used. For example, if the amount of memory of the monitoring server 200-2 is twice the amount of memory of the monitoring server 200-2, it is possible to allocate twice as many NEs 100 as monitoring targets.

また、監視サーバ情報記憶部340に記憶された監視サーバ200のHDD空き容量に応じて監視対象のNE100を割り振るようにしても良い。特に、NE100から送信されるエラー情報が監視サーバ200に一時的に蓄積される場合には、HDD空き容量がより多い監視サーバ200により多くのNE100を監視対象として割り振ることで、複数台の監視サーバ200を有効に利用することができる。
また、予め1台または複数台の待機系の監視サーバ200を停止状態でネットワークシステム1に接続しておき、停止した監視サーバ200が監視対象としていたNE100の監視を、待機系の監視サーバ200に割り振るようにしても良い。
Further, the monitoring target NE 100 may be allocated according to the HDD free space of the monitoring server 200 stored in the monitoring server information storage unit 340. In particular, when error information transmitted from the NE 100 is temporarily stored in the monitoring server 200, a plurality of monitoring servers can be allocated by allocating more NEs 100 as monitoring targets to the monitoring server 200 with more HDD free space. 200 can be used effectively.
In addition, one or more standby monitoring servers 200 are connected to the network system 1 in a stopped state in advance, and monitoring of the NE 100 that is the monitoring target of the stopped monitoring server 200 is sent to the standby monitoring server 200. You may make it allocate.

また、上述の実施形態では、監視サーバ200のマシン性能、またはポーリング所要時間に応じて監視サーバ200がNE100を監視する監視周期を延伸して縮退運転を行うこととしたが、例えば、一定の台数を超えて監視サーバ200が停止した場合、監視対象のNE100の割り振りを行う稼動中の監視サーバ200がNE100を監視する監視周期を予め定められた一定倍(例えば、2倍)にすることにより縮退運転を行うようにしても良い。また、同様に、1台あたりの監視サーバ200が監視するNE100の数が一定の台数を超えた場合、監視対象のNE100の割り振りを行う稼働中の監視サーバ200の監視周期を予め定められた一定倍(例えば、2倍)にすることにより縮退運転を行うようにしても良い。   In the above-described embodiment, the monitoring server 200 performs the degenerate operation by extending the monitoring cycle for monitoring the NE 100 according to the machine performance of the monitoring server 200 or the required polling time. When the monitoring server 200 stops exceeding the limit, the monitoring server 200 in operation that allocates the NE 100 to be monitored degenerates by multiplying the monitoring cycle for monitoring the NE 100 by a predetermined fixed time (for example, 2 times). You may make it drive | work. Similarly, when the number of NEs 100 monitored by one monitoring server 200 exceeds a certain number, the monitoring period of the active monitoring server 200 that allocates the monitoring target NEs 100 is set to a predetermined constant. You may make it perform degenerate operation by making it double (for example, 2 times).

なお、本発明における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによりネットワークの監視を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。   The program for realizing the function of the processing unit in the present invention is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into the computer system and executed to monitor the network. You may go. The “computer system” here includes an OS and hardware such as peripheral devices. The “computer system” includes a WWW system having a homepage providing environment (or display environment). The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Further, the “computer-readable recording medium” refers to a volatile memory (RAM) in a computer system that becomes a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. In addition, those holding programs for a certain period of time are also included.

また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。   The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.

本発明の一実施形態によるネットワークシステムの構成を示す図である。It is a figure which shows the structure of the network system by one Embodiment of this invention. 本発明の一実施形態による管理サーバと監視サーバとの構成を示すブロック図である。It is a block diagram which shows the structure of the management server and monitoring server by one Embodiment of this invention. 本発明の一実施形態によるNE情報のデータ例を示す図である。It is a figure which shows the example of data of NE information by one Embodiment of this invention. 本発明の一実施形態による監視サーバ状態情報のデータ例を示す図である。It is a figure which shows the example of data of the monitoring server status information by one Embodiment of this invention. 本発明の一実施形態によるネットワークシステムの動作例を示す図である。It is a figure which shows the operation example of the network system by one Embodiment of this invention. 本発明の一実施形態により監視対象の再割り振りが行われたネットワークシステムの構成を示す図である。It is a figure which shows the structure of the network system by which reallocation of the monitoring object was performed by one Embodiment of this invention. 本発明の一実施形態による管理サーバと監視サーバとの構成を示すブロック図である。It is a block diagram which shows the structure of the management server and monitoring server by one Embodiment of this invention. 本発明の一実施形態により監視対象の再割り振りが行われたネットワークシステムの構成を示す図である。It is a figure which shows the structure of the network system by which reallocation of the monitoring object was performed by one Embodiment of this invention. 従来技術によるネットワークシステムの構成を示す図である。It is a figure which shows the structure of the network system by a prior art. 従来技術によるネットワークシステムの構成を示す図である。It is a figure which shows the structure of the network system by a prior art.

符号の説明Explanation of symbols

1 ネットワークシステム
100 NE
200 監視サーバ
210 NE情報記憶部
220 監視対象NE抽出部
230 通信部
240 NE監視部
250 OS
300 管理サーバ
310 NE情報記憶部
320 通信部
330 監視サーバ状態取得部
340 監視サーバ情報記憶部
350 割り振り情報送信部
360 エラー情報記憶部
370 OS
380 監視対象NE抽出部
390 監視周期算出部
400 APサーバ
500 監視用クライアント端末
600 NE
700 監視サーバ
1 Network system 100 NE
200 Monitoring Server 210 NE Information Storage Unit 220 Monitoring Target NE Extraction Unit 230 Communication Unit 240 NE Monitoring Unit 250 OS
300 Management Server 310 NE Information Storage Unit 320 Communication Unit 330 Monitoring Server Status Acquisition Unit 340 Monitoring Server Information Storage Unit 350 Allocation Information Transmission Unit 360 Error Information Storage Unit 370 OS
380 Monitoring target NE extraction unit 390 Monitoring cycle calculation unit 400 AP server 500 Monitoring client terminal 600 NE
700 Monitoring server

Claims (6)

通信ネットワークを構成する複数のネットワークエレメントのうち、予め定められた監視対象の前記ネットワークエレメントを監視し、当該ネットワークエレメントから送信されるエラー情報を受信する複数の監視サーバと、前記複数の監視サーバのそれぞれから送信される前記エラー情報が記憶される管理サーバとを備えたネットワーク監視システムであって、
前記監視サーバは、
前記管理サーバから、前記複数のネットワークエレメントから自身の監視対象のネットワークエレメントを抽出する割り振り情報を受信する受信部と、
前記受信部が受信した前記割り振り情報に応じた前記監視対象のネットワークエレメントを監視するネットワークエレメント監視部と、を備え、
前記管理サーバは、
前記複数の監視サーバのうち、いずれかの前記監視サーバによる前記ネットワークエレメントの監視処理が停止したことを検知する検知部と、
前記検知部が前記ネットワークエレメントの監視処理が停止したことを検知すると、前記監視処理を停止した前記監視サーバ以外の監視サーバに、前記監視処理を停止した前記監視サーバが監視対象としていた前記ネットワークエレメントを含むネットワークエレメントを監視対象として抽出する割り振り情報を送信する割り振り情報送信部と、
を備えることを特徴とするネットワーク監視システム。
Among a plurality of network elements constituting a communication network, a plurality of monitoring servers that monitor a predetermined network element to be monitored and receive error information transmitted from the network element, and a plurality of monitoring servers A network monitoring system comprising: a management server for storing the error information transmitted from each;
The monitoring server is
A receiving unit that receives allocation information for extracting a network element to be monitored from the plurality of network elements from the management server;
A network element monitoring unit that monitors the network element to be monitored according to the allocation information received by the receiving unit,
The management server
A detection unit for detecting that the monitoring process of the network element by any one of the plurality of monitoring servers is stopped;
When the detection unit detects that the monitoring process of the network element is stopped, the network element that is the monitoring target of the monitoring server that stopped the monitoring process is sent to a monitoring server other than the monitoring server that stopped the monitoring process. An allocation information transmission unit for transmitting allocation information for extracting a network element including a monitoring target;
A network monitoring system comprising:
前記管理サーバの前記割り振り情報送信部が送信する前記割り振り情報は、前記通信ネットワークを構成する複数のネットワークエレメントの全てから、前記監視サーバ以外の監視サーバのそれぞれが監視対象とするネットワークエレメントを抽出する割り振り情報である
ことを特徴とする請求項1に記載のネットワーク監視システム。
The allocation information transmitted by the allocation information transmission unit of the management server extracts network elements to be monitored by each of the monitoring servers other than the monitoring server from all of the plurality of network elements constituting the communication network. The network monitoring system according to claim 1, wherein the network monitoring system is allocation information.
前記管理サーバの前記割り振り情報送信部が送信する前記割り振り情報は、前記監視処理を停止した前記監視サーバが監視対象としていたネットワークエレメントのみを、前記監視サーバ以外の監視サーバが追加の監視対象として抽出する割り振り情報である
ことを特徴とする請求項1に記載のネットワーク監視システム。
The allocation information transmitted by the allocation information transmission unit of the management server extracts only the network elements that are monitored by the monitoring server that stopped the monitoring process, and the monitoring servers other than the monitoring server extract as additional monitoring targets The network monitoring system according to claim 1, wherein the network monitoring system is assigned information.
前記監視サーバは、
予め定められた監視周期ごとに前記監視対象のネットワークエレメントの監視処理を行い、
前記管理サーバは、
前記監視サーバの処理能力を示す監視サーバ情報が記憶される監視サーバ情報記憶部と、
前記割り振り情報送信部によって送信される前記割り振り情報により前記監視サーバに監視対象として割り振られる前記ネットワークエレメントと、当該監視サーバに対応する前記監視サーバ情報とに基づく当該監視サーバの監視処理の処理負荷が、予め定められた閾値を超える場合、前記監視サーバに、前記監視周期を延伸することを示す情報を送信する
ことを特徴とする請求項1から請求項3までのいずれか1項に記載のネットワーク監視システム。
The monitoring server is
The monitoring process of the network element to be monitored is performed every predetermined monitoring cycle,
The management server
A monitoring server information storage unit that stores monitoring server information indicating the processing capability of the monitoring server;
The processing load of the monitoring process of the monitoring server based on the network element allocated as a monitoring target to the monitoring server by the allocation information transmitted by the allocation information transmitting unit and the monitoring server information corresponding to the monitoring server is The network according to any one of claims 1 to 3, wherein when the predetermined threshold value is exceeded, information indicating that the monitoring period is extended is transmitted to the monitoring server. Monitoring system.
前記管理サーバの前記監視サーバ情報記憶部に記憶される前記監視サーバ情報には、前記監視サーバのCPU使用率とメモリ量とによって前記監視サーバの処理能力を示す情報が含まれる
ことを特徴とする請求項4に記載のネットワーク監視システム。
The monitoring server information stored in the monitoring server information storage unit of the management server includes information indicating the processing capability of the monitoring server according to a CPU usage rate and a memory amount of the monitoring server. The network monitoring system according to claim 4.
前記管理サーバの前記監視サーバ情報記憶部に記憶される前記監視サーバ情報には、前記監視サーバによるネットワークエレメントの監視処理の所要時間によって前記監視サーバの処理能力を示す情報が含まれる
ことを特徴とする請求項4または請求項5に記載のネットワーク監視システム。
The monitoring server information stored in the monitoring server information storage unit of the management server includes information indicating the processing capability of the monitoring server according to the time required for the monitoring process of the network element by the monitoring server. The network monitoring system according to claim 4 or 5.
JP2008254567A 2008-09-30 2008-09-30 Network monitoring system Pending JP2010087834A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008254567A JP2010087834A (en) 2008-09-30 2008-09-30 Network monitoring system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008254567A JP2010087834A (en) 2008-09-30 2008-09-30 Network monitoring system

Publications (1)

Publication Number Publication Date
JP2010087834A true JP2010087834A (en) 2010-04-15

Family

ID=42251339

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008254567A Pending JP2010087834A (en) 2008-09-30 2008-09-30 Network monitoring system

Country Status (1)

Country Link
JP (1) JP2010087834A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011250033A (en) * 2010-05-25 2011-12-08 Toshiba Corp Monitoring system and server changeover method
JP2012134628A (en) * 2010-12-20 2012-07-12 Nippon Telegraph & Telephone West Corp Monitoring object setting change device
WO2017094194A1 (en) * 2015-12-04 2017-06-08 株式会社日立製作所 Computer system and device management method

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07177164A (en) * 1993-12-20 1995-07-14 Fujitsu Ltd Frame communication equipment
JPH0897782A (en) * 1994-09-22 1996-04-12 Matsushita Electric Ind Co Ltd Line monitor method for communication line allocation device
JPH0955737A (en) * 1995-08-10 1997-02-25 Nec Corp Network control system
JPH09247150A (en) * 1996-03-12 1997-09-19 Fujitsu Ltd Network monitoring system and central monitoring device and vicarious monitoring device used for the system
JP2000099424A (en) * 1997-08-12 2000-04-07 Lucent Technol Inc Method for controlling network element on communication network
JP2001331469A (en) * 2000-05-23 2001-11-30 Ntt Comware Corp Method for sharing data, terminal equipment and recording medium
WO2002005489A1 (en) * 2000-07-10 2002-01-17 Fujitsu Limited Integrated network management system
JP2002164893A (en) * 2000-09-06 2002-06-07 Toshiba Corp Control method of information transmitting network system
JP2006203276A (en) * 2005-01-18 2006-08-03 Fujitsu Ltd Traffic monitoring system

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07177164A (en) * 1993-12-20 1995-07-14 Fujitsu Ltd Frame communication equipment
JPH0897782A (en) * 1994-09-22 1996-04-12 Matsushita Electric Ind Co Ltd Line monitor method for communication line allocation device
JPH0955737A (en) * 1995-08-10 1997-02-25 Nec Corp Network control system
JPH09247150A (en) * 1996-03-12 1997-09-19 Fujitsu Ltd Network monitoring system and central monitoring device and vicarious monitoring device used for the system
JP2000099424A (en) * 1997-08-12 2000-04-07 Lucent Technol Inc Method for controlling network element on communication network
JP2001331469A (en) * 2000-05-23 2001-11-30 Ntt Comware Corp Method for sharing data, terminal equipment and recording medium
WO2002005489A1 (en) * 2000-07-10 2002-01-17 Fujitsu Limited Integrated network management system
JP2002164893A (en) * 2000-09-06 2002-06-07 Toshiba Corp Control method of information transmitting network system
JP2006203276A (en) * 2005-01-18 2006-08-03 Fujitsu Ltd Traffic monitoring system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011250033A (en) * 2010-05-25 2011-12-08 Toshiba Corp Monitoring system and server changeover method
JP2012134628A (en) * 2010-12-20 2012-07-12 Nippon Telegraph & Telephone West Corp Monitoring object setting change device
WO2017094194A1 (en) * 2015-12-04 2017-06-08 株式会社日立製作所 Computer system and device management method

Similar Documents

Publication Publication Date Title
US10609159B2 (en) Providing higher workload resiliency in clustered systems based on health heuristics
US7225356B2 (en) System for managing operational failure occurrences in processing devices
CN108923992B (en) High-availability method and system for NAS cluster, electronic equipment and storage medium
WO2014087850A1 (en) Automatic-fault-handling cache system, fault-handling processing method for cache server, and cache manager
US9264337B2 (en) Service monitoring system, service monitoring method, and non-transitory computer-readable recording medium
US9135078B2 (en) Configuration information management server, configuration information management method and configuration management program
JP2014522052A (en) Reduce hardware failure
JP5427504B2 (en) Service execution apparatus and service execution method
JP2010103695A (en) Cluster system, cluster server and cluster control method
WO2018024139A1 (en) Hard disk management method and system
JP2015069384A (en) Information processing system, control method for information processing system, and control program for information processor
JP2010087834A (en) Network monitoring system
EP3680780B1 (en) Cluster system, control method, and corresponding computer program
JP5549374B2 (en) Load balancing apparatus and load balancing control method
JP2018010441A (en) Log collection system, log collection server, and log collection method
JP5483784B1 (en) CONTROL DEVICE, COMPUTER RESOURCE MANAGEMENT METHOD, AND COMPUTER RESOURCE MANAGEMENT PROGRAM
JP7107789B2 (en) Information processing system, information processing method, and program
JP6269199B2 (en) Management server, failure recovery method, and computer program
JP2015082131A (en) Monitoring system, monitoring method, monitoring program, and monitoring device
CN109462639B (en) Port expansion equipment management method and device
CN103001832A (en) Detection method and device for nodes in distributed file system
JP6380774B1 (en) Computer system, server device, program, and failure detection method
JP2015161954A (en) Monitoring server for monitoring operation state of system, and control method in monitoring server
JP2008129828A (en) Dynamic allocation method of blade server
JP5513940B2 (en) Application switching system and application switching method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101019

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101217

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110906