JP4900358B2 - Server management system, server management method, and server management program - Google Patents

Server management system, server management method, and server management program Download PDF

Info

Publication number
JP4900358B2
JP4900358B2 JP2008263653A JP2008263653A JP4900358B2 JP 4900358 B2 JP4900358 B2 JP 4900358B2 JP 2008263653 A JP2008263653 A JP 2008263653A JP 2008263653 A JP2008263653 A JP 2008263653A JP 4900358 B2 JP4900358 B2 JP 4900358B2
Authority
JP
Japan
Prior art keywords
server
monitoring
monitoring information
inquiry
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008263653A
Other languages
Japanese (ja)
Other versions
JP2010092395A (en
Inventor
真登 水江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008263653A priority Critical patent/JP4900358B2/en
Publication of JP2010092395A publication Critical patent/JP2010092395A/en
Application granted granted Critical
Publication of JP4900358B2 publication Critical patent/JP4900358B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Description

本発明は、複数のサーバの稼動状況を監視するサーバ管理システム,サーバ管理方法及びサーバ管理用プログラムに関する。   The present invention relates to a server management system, a server management method, and a server management program for monitoring the operating status of a plurality of servers.

データセンタなど、複数台のサーバが設けられている場所においては、その複数台のサーバを統括的に管理するためのサーバ管理システムが構築されている。通常のサーバ管理システムは、複数台のサーバとサーバ管理装置とが互いに回線接続して構成されており、サーバ管理装置が、各サーバに対して一定周期で個別に通信を行い、各サーバの死活監視や性能監視を行っていた。すなわち、サーバは、サーバ管理装置へ一定周期で、死活監視として生存通知を送信し、性能監視として自機の負荷状況といった性能情報を送信していた。   In a place where a plurality of servers are provided such as a data center, a server management system for comprehensively managing the plurality of servers is constructed. An ordinary server management system is configured by connecting a plurality of servers and a server management apparatus to each other via a line, and the server management apparatus communicates with each server individually at a fixed period, and each server is activated or deactivated. Monitoring and performance monitoring were performed. That is, the server transmits a life notification as life and death monitoring to the server management apparatus at a fixed period, and transmits performance information such as its own load state as performance monitoring.

サーバとサーバ管理装置の間での情報の送受信方式には、各サーバに送信権(トークン)を巡回させてその送信権を持つサーバのみが性能情報をサーバ管理装置へ送信する方式や、サーバが各々の判断によりサーバ管理装置へ性能情報を送信する方式があった。   Information transmission / reception methods between the server and the server management device include a method in which each server transmits a transmission right (token) and only the server having the transmission right transmits performance information to the server management device. There is a method of transmitting performance information to the server management apparatus based on each determination.

このような方式を、数千台かそれ以上の膨大な台数のサーバからなる大規模システムに適用した場合、前者の方式では、全てのサーバへ送信権が行き渡るまでに時間がかかるため、サーバ管理装置の個々のサーバに対する通信の周期が長くなってしまいサーバの異常を早期に検知できなくなってしまう。後者の方式であっても、サーバ管理装置が一定時間内で処理が可能な通信回数には限りがあり、サーバ管理装置が大量のサーバ全てから情報を受信するためにはかなりの時間が必要であり、前者の方式と同様に個々のサーバに対する通信の間隔を長くする必要があった。   When such a method is applied to a large-scale system consisting of thousands of servers or more, the former method takes time until the transmission right is distributed to all servers. The communication cycle for each server of the apparatus becomes longer, and it becomes impossible to detect an abnormality of the server at an early stage. Even with the latter method, the server management device has a limited number of communications that can be processed within a certain time, and it takes a considerable amount of time for the server management device to receive information from all of the large number of servers. In the same way as the former method, it is necessary to increase the communication interval for each server.

これに関して、特許文献1及び2に関連技術が開示されている。特許文献1には、サーバ同士が相互に監視を行い、木構造の論理的なネットワークを利用して障害の検出結果をルートへ収集する計算機監視方式が開示されている。この方式は、サーバ同士が相互監視を行うので、管理装置の通信は障害の検出結果の取得時のみとなり、サーバの台数が膨大な数になっても、個々のサーバに対する監視周期を短くしたままでサーバの障害検知が可能であった。   In this regard, related techniques are disclosed in Patent Documents 1 and 2. Patent Document 1 discloses a computer monitoring method in which servers monitor each other and collect failure detection results on a route using a tree-structured logical network. In this method, the servers perform mutual monitoring, so the communication of the management device is only at the time of acquisition of the failure detection result. Even if the number of servers becomes enormous, the monitoring cycle for each server remains short. It was possible to detect server failure.

また、特許文献2には、サーバ(相互監視装置)同士が相互に監視を行い、障害の検出結果を管理サーバへ通知し、障害の発生を検知したサーバが障害の発生したサーバの監視対象サーバを引き継ぐシステムが開示されている。   Further, in Patent Document 2, servers (mutual monitoring devices) monitor each other, notify a management server of a failure detection result, and a server that detects the failure is a monitoring target server of the failed server. A system for taking over is disclosed.

特開2003−271471号公報JP 2003-271471 A 特開2007−114941号公報JP 2007-114941 A

しかしながら、上述した特許文献1及び2に開示された関連技術では、サーバ同士が相互に稼働状況を監視することで、サーバ監視処理が分散されて、各サーバを有効な周期で監視することはできるが、本来複数のサーバを統括的に管理するはずの管理コンソール(管理サーバ)が、サーバの障害発生を検知するだけで、各サーバの性能情報(稼働状況)を一括して管理する性能監視を行うことができなかった。各サーバの性能情報を周期的に取得し管理することは、システムの運用管理に不可欠であり、各サーバの性能監視を実行できないと、負荷分散制御などを行うこともできないという不都合があった。   However, in the related technologies disclosed in Patent Documents 1 and 2 described above, the servers can monitor each other at an effective cycle by distributing the server monitoring processing by monitoring the operating status between the servers. However, the management console (management server), which should manage all the servers in an integrated manner, can detect the occurrence of a server failure and perform performance monitoring to manage the performance information (operation status) of each server collectively. Could not do. Obtaining and managing the performance information of each server periodically is indispensable for system operation management, and there is a disadvantage that load distribution control cannot be performed unless performance monitoring of each server can be performed.

仮に、特許文献1に開示された関連技術を性能監視に応用しても、性能情報の収集に木構造のトポロジを採用するので、ルート付近のグループに属するサーバは恒常的に大量のサーバの性能情報を扱うことになってしまう。データセンタにおけるサーバは、通常、業務システムとして動作しており、常に特定のサーバに負荷が集中してしまうと業務システムに支障をきたしてしまう。   Even if the related technique disclosed in Patent Document 1 is applied to performance monitoring, a tree-structure topology is adopted for collecting performance information, so that servers belonging to groups near the root always have the performance of a large number of servers. Information will be handled. A server in a data center normally operates as a business system. If the load is always concentrated on a specific server, the business system is hindered.

そこで、本発明は、上記関連技術の不都合を改善し、複数のサーバを有する大規模システムに対して、適切な周期で全サーバの性能情報を収集して各サーバを有効に監視できるサーバ監視システム,サーバ監視方法及びサーバ監視用プログラムを提供することを、その目的とする。   Accordingly, the present invention provides a server monitoring system that improves the disadvantages of the related art and can effectively monitor each server by collecting performance information of all servers at an appropriate period for a large-scale system having a plurality of servers. An object of the present invention is to provide a server monitoring method and a server monitoring program.

上記目的を達成するため、本発明のサーバ監視システムは、複数のサーバとサーバ管理装置とが互いに回線接続してなるサーバ監視システムにおいて、各サーバは、複数のサーバでドブリュイェングラフ構造もしくはカウツグラフ構造の監視トポロジを構成するように自サーバの接続先としてサーバ管理装置に指定されたか、もしくは予め定められた他のサーバに係る情報を記憶する監視トポロジ情報記憶手段と、この記憶された情報に係る他のサーバを監視対象サーバとし、当該監視対象サーバの性能情報を予め設定された時間間隔で繰り返し取得する監視手段と、この取得された監視対象サーバの性能情報を監視情報として蓄積する監視情報蓄積手段と、サーバ管理装置から送信された監視情報の問合せを受信してこの問合せを監視対象サーバへ転送すると共に、他のサーバから転送された問合せを受信した場合この問合せを中継して監視対象サーバへ送信し、サーバ管理装置もしくは他のサーバからの問合せに対して監視情報蓄積手段に記憶された監視情報を返信すると共に、監視対象サーバから返信された監視情報を受信した場合この監視情報を中継して問合せの送信元へ送信する監視情報問合せ返信手段とを備え、サーバ管理装置は、予め設定された時間間隔で最近収集した全サーバに係る監視情報に基づいて、複数のサーバから最も負荷が小さいサーバを順次選択してその選択したサーバへ監視情報の問合せを送信しこの問合せに対して返信された全サーバに係る監視情報を受信する監視情報収集手段と、この受信された全サーバに係る監視情報を管理する監視情報管理手段とを備えると共に、各サーバにおける監視情報問合せ返信手段は、別々の送信元から同等の問合せを受信した場合、2回目以降に受けた問合せの送信元に対して監視情報に代えて2回目以降の問合せである旨を知らせる通知を返信する機能を備えたことを特徴とする。 To achieve the above object, the server monitoring system of the present invention, a plurality of servers and server management device and a server monitoring system formed by the line connected to one another, each server, or de Brew Yan graph structure with multiple servers Kautsugurafu monitoring topology information storing means for storing information relating to the own server or specified in the server management device as a connection destination or other servers predetermined so as to constitute the monitoring topology structure, this stored information Such other server as a monitoring target server, monitoring means for repeatedly acquiring the performance information of the monitoring target server at a preset time interval, and monitoring information for accumulating the acquired performance information of the monitoring target server as monitoring information The monitoring information received from the storage means and the server management device is received and this inquiry is monitored When a query transferred from another server is received, this query is relayed and sent to the monitoring target server, and the monitoring information storage means responds to a query from the server management device or another server. The server management apparatus includes a monitoring information inquiry reply unit that replies with the stored monitoring information and relays the monitoring information when the monitoring information returned from the monitoring target server is received and transmits the monitoring information to the inquiry transmission source. Based on the monitoring information related to all the servers recently collected at a preset time interval, the server with the lowest load is sequentially selected from a plurality of servers, and the inquiry of the monitoring information is transmitted to the selected server. Monitoring information collecting means for receiving monitoring information related to all servers returned to the server, and a monitoring information management unit for managing the received monitoring information related to all servers. Together and means, monitoring information inquiry reply unit of each server, when receiving the same query from different sources, second and subsequent in place of the monitoring information to the transmission source of the query received secondly or later It is characterized in that it has a function of returning a notification notifying that it is an inquiry .

また、本発明のサーバ監視方法は、複数のサーバとサーバ管理装置とが互いに回線接続してなるサーバ監視システムにあって、各サーバが、複数のサーバでドブリュイェングラフ構造の監視トポロジを構成するよう自サーバの接続先としてサーバ管理装置に指定されたか、もしくは予め定められた他のサーバを監視対象サーバとして当該監視対象サーバの性能情報を予め設定された時間間隔で繰り返し取得し、この取得した性能情報を予め備えた監視情報蓄積手段に監視情報として蓄積すると共に、サーバ管理装置が、最近収集した全サーバに係る監視情報に基づいて、予め設定された時間間隔で複数のサーバから最も負荷が小さいサーバを順次選択してこの選択したサーバへ監視情報の問合せを送信し、サーバ管理装置から問合せを受信したサーバが、予め設定された2つの監視対象サーバへ当該問合せを送信し、この問合せを監視トポロジに沿って各サーバが中継して全サーバへ伝達し、この監視情報の問合せを監視トポロジに沿って各サーバが中継して全サーバへ伝達すると共に、サーバ監視装置もしくは他のサーバから問合せを受信したサーバが、監視情報蓄積手段に記憶された監視情報を当該問合せの送信元へ返信し、各サーバに係る監視情報を監視トポロジの逆向きに沿って各サーバが中継して伝送し、サーバ管理装置が、監視情報の問合せを直に送った先のサーバから全サーバからの監視情報を受信すると共に、2つの他のサーバから問合せを受信したサーバが、2回目の問合せの送信元へ2回目であったことを知らせる通知を返信し、2つの監視対象サーバの両方から問合せに対する返信を受けたサーバが、1回目の問合せの送信元へ監視情報蓄積手段に蓄積された監視情報を返信し、係る監視対象サーバから監視情報の返信を受けたサーバが、この監視対象サーバからの監視情報に自サーバの監視情報蓄積手段に蓄積された監視情報を加算して1回目の問合せの送信元へ送信し、各サーバに係る監視情報を監視トポロジの逆向きに沿って各サーバが累積加算しながら中継して伝送し、各サーバに係る監視情報を累積した全サーバに係る監視情報を、サーバ管理装置が監視情報の問合せを直に送った先のサーバから受信することを特徴とする。 Also, the server monitoring method of the present invention is a server monitoring system in which a plurality of servers and a server management apparatus are connected to each other via a line, and each server forms a monitoring topology of a Doubling graph structure with a plurality of servers. The server management device is designated as the connection destination of its own server, or the performance information of the monitored server is repeatedly acquired at a preset time interval using another predetermined server as the monitored server. The performance information is stored as monitoring information in the monitoring information storage means provided in advance, and the server management device loads the most load from a plurality of servers at a preset time interval based on the monitoring information relating to all recently collected servers. sequentially selects a small server sends a query monitoring information to the selected server, receives the query from the server management apparatus Server sends the inquiry to the two monitored server which is set in advance, the query is transmitted along the monitoring topology to each server relays all servers, the query in this monitoring information along the monitoring topology Each server relays and transmits to all servers, and the server that has received the inquiry from the server monitoring device or another server returns the monitoring information stored in the monitoring information storage means to the transmission source of the inquiry. monitoring information transmitted each server and relays along the reverse monitoring topology according to the server management device, receives monitoring information from all servers from directly sending the previous server queries the monitoring information with The server that received the query from two other servers returns a notification to the sender of the second query that it was the second time, and both of the two monitored servers The server that has received the reply to the inquiry returns the monitoring information stored in the monitoring information storage means to the transmission source of the first inquiry, and the server that has received the monitoring information reply from the monitoring target server The monitoring information stored in the monitoring information storage means of the own server is added to the monitoring information from the server and transmitted to the transmission source of the first inquiry, and the monitoring information related to each server is sent along the reverse direction of the monitoring topology. Receiving from the server to which the server management device sent the monitoring information query directly, the monitoring information related to all servers that the server relayed and transmitted while accumulating, and accumulated monitoring information related to each server. Features.

本発明のサーバ監視用プログラムは、複数のサーバとサーバ管理装置とが互いに回線接続してなるサーバ監視システムにおける各サーバにあって、複数のサーバでドブリュイェングラフ構造の監視トポロジを構成するように自サーバの接続先としてサーバ管理装置に指定されたか、もしくは予め定められた他のサーバを監視対象サーバとして当該監視対象サーバの性能情報を予め設定された時間間隔で繰り返し取得しこの取得された性能情報を監視情報として予め備えた監視情報蓄積手段に記憶させる監視機能と、サーバ管理装置から監視情報の問合せを受信してこの問合せを予め設定された2つの監視対象サーバに送信すると共にこの問合せを他のサーバから受信した場合監視トポロジに沿ってその問合せを中継して監視対象サーバへ送信する監視情報問合せ機能と、サーバ管理装置もしくは他のサーバからの問合せに対して監視情報蓄積手段に記憶された監視情報を問合せの送信元へ返信し、監視対象サーバから返信された監視情報を受信した場合この監視情報を中継して問合せの送信元へ送信する監視情報返信機能をコンピュータに実行させると共に、監視情報返信機能は、別々の送信元から同等の問合せを受信した場合、2回目以降に受けた問合せの送信元に対して監視情報に代えて2回目以降の問合せである旨を知らせる通知を返信する機能であることを特徴とする。 The server monitoring program according to the present invention is provided in each server in a server monitoring system in which a plurality of servers and a server management apparatus are connected to each other in a line, and the plurality of servers constitute a monitoring topology having a Doubling graph structure. The server management device is designated as the connection destination of its own server, or the performance information of the monitored server is repeatedly acquired at a preset time interval using another predetermined server as the monitored server. A monitoring function for storing performance information as monitoring information in a monitoring information storage means prepared in advance, and a query for monitoring information received from the server management apparatus, and sending this query to two preset servers to be monitored. the relays the inquiry along when monitoring topology received from other servers transmitted to the managed server The monitoring information inquiry function and the monitoring information stored in the monitoring information storage means in response to an inquiry from the server management device or other server are returned to the inquiry transmission source, and the monitoring information returned from the monitoring target server is received. In this case, the monitoring information reply function for relaying the monitoring information and transmitting it to the inquiry transmission source is executed by the computer, and the monitoring information reply function can be used for the second and subsequent times when an equivalent inquiry is received from different transmission sources. It is a function that returns a notification notifying the second and subsequent inquiries to the sender of the received inquiry instead of the monitoring information .

本発明は、以上のように構成され機能するため、これにより、複数のサーバからなる特定構造の監視トポロジを構成して、その接続関係に従ってサーバがサーバを監視するため、サーバ監視処理にかかる負荷を分散することができ、サーバ管理装置が複数のサーバのうちの任意のサーバへ監視情報の問合せを送信し、その問合せが複数のサーバからなる監視トポロジに沿って順次全サーバへ伝播され、各サーバから返信された監視情報が各サーバを中継しサーバ管理装置から直に問合せを受けたサーバを経由してサーバ管理装置へ返信されるので、特定のサーバに負荷を集中させることなく、サーバ管理装置の通信にかかる負荷が軽減され、多数のサーバの性能情報を適切な周期で一括収集し管理することができる。   Since the present invention is configured and functions as described above, this constitutes a monitoring topology having a specific structure made up of a plurality of servers, and the servers monitor the servers according to their connection relations. The server management device sends a monitoring information query to any one of a plurality of servers, and the query is sequentially propagated to all servers along a monitoring topology composed of a plurality of servers. Monitoring information returned from the server is relayed to each server and sent back to the server management device via the server directly inquired from the server management device, so that server management can be performed without concentrating the load on a specific server. The load on the communication of the apparatus is reduced, and performance information of a large number of servers can be collected and managed at an appropriate cycle.

以下、本発明における一実施形態を、図面を参照して説明する。   Hereinafter, an embodiment of the present invention will be described with reference to the drawings.

図1は、本実施形態のサーバ監視システムの構成を示す図である。図1に示すように、本実施形態のサーバ監視システムは、サーバ管理装置Mとn(nは4以上の自然数)機のサーバA1,A2,A3〜Anとがネットワーク網Lを介して相互に接続した構成である。サーバA1〜Anは、情報処理装置であり、アプリケーションソフトウェアを実装し、1台もしくは複数台で業務システムを構成する、業務サーバである。業務サーバとは、例えば、Webサーバやアプリケーションサーバ、データベースサーバなどである。   FIG. 1 is a diagram showing the configuration of the server monitoring system of this embodiment. As shown in FIG. 1, the server monitoring system of this embodiment is configured such that a server management apparatus M and n (n is a natural number of 4 or more) machines A1, A2, A3 to An are mutually connected via a network L. It is a connected configuration. The servers A1 to An are information processing apparatuses, which are business servers in which application software is installed and a business system is configured by one or a plurality of servers. The business server is, for example, a Web server, an application server, a database server, or the like.

図2は、本実施形態におけるサーバA1〜An及びサーバ管理装置Mの内部構成を示す機能ブロック図である。   FIG. 2 is a functional block diagram illustrating the internal configuration of the servers A1 to An and the server management apparatus M in the present embodiment.

ここで、本実施形態のサーバA1〜Anは、それぞれが同じ構成を有しているので、便宜上、図2には、サーバA1〜AnのうちのサーバA1の構成のみを示している。また、図2に示すサーバA2及びサーバAnは、その構成を省略して図示されており、サーバA2及びサーバAnの構成も、サーバA1と同等である。   Here, since the servers A1 to An of the present embodiment have the same configuration, FIG. 2 shows only the configuration of the server A1 among the servers A1 to An for convenience. Further, the server A2 and the server An shown in FIG. 2 are not shown in the configuration, and the configurations of the server A2 and the server An are also equivalent to the server A1.

図2に示すように、本実施形態におけるサーバA1〜Anは、サーバA1〜Anが特定のグラフ構造の監視トポロジを構成するように割り当てられた監視用IDや自サーバの接続先となる他のサーバの情報を記憶する監視トポロジ情報記憶手段11と、この記憶された情報に係る接続先の他のサーバを監視対象サーバとして当該監視対象サーバの性能情報を予め設定された時間間隔で繰り返し取得すると共にこの取得した性能情報に基づいて監視対象サーバに異常が発生したか否かを判断し異常が発生した場合にその旨をサーバ管理装置Mへ通知する監視手段12と、この取得された監視対象サーバの性能情報を監視情報として蓄積する監視情報蓄積手段13と、他のサーバへ自サーバの性能情報を送信する被監視手段14とを備えている。   As shown in FIG. 2, the servers A <b> 1 to An in this embodiment are the monitoring IDs assigned so that the servers A <b> 1 to An constitute a monitoring topology having a specific graph structure, and other connection destinations of the own server. The monitoring topology information storage unit 11 for storing server information and the other server of the connection destination related to the stored information as the monitoring target server repeatedly acquire performance information of the monitoring target server at a preset time interval. A monitoring unit 12 for determining whether or not an abnormality has occurred in the monitoring target server based on the acquired performance information and notifying the server management apparatus M of the abnormality, and the acquired monitoring target Monitoring information storage means 13 for storing server performance information as monitoring information, and monitored means 14 for transmitting the performance information of the own server to other servers are provided.

また更に、サーバA1〜Anは、サーバ管理装置Mから監視情報の問合せを受信してこの問合せを監視対象サーバへ送信すると共にこの問合せを他のサーバから受信した場合はこの問合せを中継して監視対象サーバへ転送する機能と、サーバ管理装置もしくは他のサーバから問合せを受信した際には監視情報蓄積手段13に記憶された監視情報を問合せの送信元へ返信し、監視対象サーバから返信された監視情報を受信した場合この監視情報を中継して問合せ元へ送信する機能とを有する監視情報問合せ返信手段15と、サーバ管理装置Mから自機の監視用IDや自機の接続先となるサーバの変更が通知された場合に監視トポロジ情報記憶手段11に格納された情報を更新する監視トポロジ情報更新手段16とを備えている。   Furthermore, the servers A1 to An receive a monitoring information query from the server management apparatus M, send this query to the monitoring target server, and if this query is received from another server, relay this query and monitor it. When the inquiry is received from the server management apparatus or another server, the monitoring information stored in the monitoring information storage means 13 is returned to the inquiry transmission source and returned from the monitoring target server. When monitoring information is received, monitoring information inquiry reply means 15 having a function of relaying the monitoring information and transmitting it to the inquiry source, and a server serving as a monitoring ID of the own device and a connection destination of the own device from the server management apparatus M The monitoring topology information updating unit 16 updates the information stored in the monitoring topology information storage unit 11 when the change is notified.

サーバ管理装置Mは、予め設定された時間間隔で複数のサーバA1〜Anから規定の条件に合致したサーバを順次選択してその選択したサーバへ監視情報の問合せを送信しこの問合せに対してそのサーバから返信された全サーバA1〜Anに係る監視情報を受信する監視情報収集手段21と、この受信された全サーバA1〜Anに係る監視情報を管理する監視情報管理手段22と、各サーバA1〜Anから監視対象サーバの異常を知らせる通知を受信する異常検知手段23と、異常が発生したサーバを除く複数のサーバで特定のグラフ構造の監視トポロジを再構成し、この再構成によって監視ID及び接続先サーバの設定変更があったサーバへ変更後の接続先サーバの情報を送信する監視トポロジ構成手段24とを備えている。   The server management apparatus M sequentially selects servers that meet the specified conditions from a plurality of servers A1 to An at a preset time interval, and sends a monitoring information query to the selected servers. Monitoring information collecting means 21 for receiving monitoring information relating to all servers A1 to An returned from the server, monitoring information managing means 22 for managing the received monitoring information relating to all servers A1 to An, and each server A1 An anomaly detection means 23 for receiving a notification of an abnormality of the monitored server from An, and a reconfiguration of a monitoring topology having a specific graph structure on a plurality of servers excluding the server on which the abnormality has occurred. And a monitoring topology configuration unit 24 that transmits information of the connection destination server after the change to the server in which the setting of the connection destination server has been changed.

ここで、特定のグラフ構造の監視トポロジとは、サーバA1〜Anをつなぐ論理トポロジであり、特定のグラフ構造としては、例えば、ドブリュイェン(de Bruijn)グラフ構造や、もしくはKautzグラフ構造が適している。de Bruijnグラフ,Kautzグラフ構造は、最も離れている2つのノード間の距離が小さく、かつ各ノードに接続するノードの数が少ないので、このBruijnグラフやKautzグラフ構造のトポロジは、通信効率の向上とサーバの負担軽減とを両立できるトポロジである。ここで、参考例として、ノードが8つの場合のde Bruijnグラフ構造を、図3に示す。   Here, the monitoring topology of a specific graph structure is a logical topology that connects the servers A1 to An, and for example, a de Bruijn graph structure or a Kautz graph structure is suitable as the specific graph structure. . The de Bruijn graph and Kautz graph structures have a small distance between the two most distant nodes, and the number of nodes connected to each node is small, so the topology of the Bruijn graph and Kautz graph structure improves communication efficiency. And a topology that can reduce the burden on the server. Here, as a reference example, a de Bruijn graph structure in the case of eight nodes is shown in FIG.

サーバA1〜Anにおける監視トポロジ情報記憶手段11は、複数のサーバA1〜Anのみで特定のグラフ構造の監視トポロジを構成するように各サーバに割り当てられた監視用IDと自サーバの接続先となるサーバの情報とを記憶している。   The monitoring topology information storage means 11 in the servers A1 to An is the connection destination of the own server and the monitoring ID assigned to each server so that only a plurality of servers A1 to An constitute a monitoring topology having a specific graph structure. Server information is stored.

監視手段12は、監視対象サーバに備えられた被監視手段14から一定の時間間隔またはランダムな時間間隔で当該監視対象サーバの性能情報を取得し監視情報蓄積手段13に記憶させる機能を備えている。この監視対象サーバの性能情報を取得する方式としては、一定の時間間隔またはランダムな時間間隔で繰り返し監視対象サーバへ送信依頼を送信しこの依頼に対して監視対象サーバの被監視手段14が返信した性能情報を取得する方式を採用する。ここで、図2では、サーバA1の監視対象サーバをサーバA2とし、サーバA1を監視対象サーバとしているサーバをサーバAnとしている。   The monitoring unit 12 has a function of acquiring performance information of the monitoring target server from the monitored unit 14 provided in the monitoring target server at a constant time interval or a random time interval and storing the performance information in the monitoring information storage unit 13. . As a method for acquiring the performance information of the monitoring target server, a transmission request is repeatedly transmitted to the monitoring target server at a constant time interval or a random time interval, and the monitored means 14 of the monitoring target server responds to this request. Adopt a method to acquire performance information. Here, in FIG. 2, the server A1 is the server to be monitored by the server A1, and the server An is the server having the server A1 as the server to be monitored.

更に、監視手段12は、性能情報の送信依頼に対し監視対象サーバからの返信が一定時間経過しても無かった場合もしくは監視対象サーバからの性能情報に示された数値情報が予め定められた異常値であった場合にこの監視対象サーバに異常が発生したと判断し、監視対象サーバに異常が発生したことをサーバ管理装置Mへ通知する機能を備えている。   Further, the monitoring unit 12 determines that the numerical information indicated in the performance information from the monitoring target server is abnormal when the response from the monitoring target server has not been replied to the performance information transmission request for a certain period of time. If the value is a value, it is determined that an abnormality has occurred in the monitoring target server, and a function of notifying the server management apparatus M that an abnormality has occurred in the monitoring target server is provided.

ここで、サーバA1〜Anの性能情報とは、例えば、現状のCPU使用率やメモリの消費量,HDDの空き容量といった測定された数値情報やそれを基に判断されたサーバの状態に関する情報であり、監視手段12は、CPU使用率が長時間100%のままであることを検知した場合にその監視対象サーバに異常が発生したと判断するようにしてもよい。   Here, the performance information of the servers A1 to An is, for example, measured numerical information such as the current CPU usage rate, memory consumption, HDD free capacity, or information on the server status determined based on the information. Yes, the monitoring unit 12 may determine that an abnormality has occurred in the monitoring target server when detecting that the CPU usage rate remains 100% for a long time.

サーバA1〜Anにおける被監視手段14は、他のサーバから性能情報の送信依頼を受信した場合に、CPU使用率やメモリの消費量,HDDの空き容量など、自サーバの内部で測定された内部情報eである性能情報を当該他のサーバへ返信する機能を備えている。このようにサーバA1〜Anは、監視手段12と被監視手段14を備えており、サーバ同士で動作の監視を行うことができる。   When the monitored means 14 in the servers A1 to An receives a performance information transmission request from another server, the monitored means 14 includes an internal measurement such as CPU usage rate, memory consumption, HDD free space, etc. A function of returning performance information as information e to the other server is provided. As described above, the servers A1 to An each include the monitoring unit 12 and the monitored unit 14, and can monitor the operations of the servers.

監視情報問合せ返信手段15は、サーバ管理装置Mから監視情報の問合せを受信してこの問合せを監視対象サーバへ転送すると共に他のサーバから転送された問合せを受信した場合この問合せを監視対象サーバへ送信する機能と、別々の送信元から問合せを受信した場合に2回目以降の問合せの送信元に対して2回目以降の問合せである旨を知らせる通知を返信する機能と、全ての監視対象サーバから問合せに対する何かしらの返信を確認した時点で1回目の問合せの送信元へ監視情報蓄積手段13に記憶された監視情報を返信すると共に監視対象サーバからの返信が監視情報であった場合その監視情報を監視情報蓄積手段13内の監視情報に加算して1回目の問合せの送信元へ送信する機能とを備えている。   The monitoring information inquiry reply means 15 receives the inquiry of the monitoring information from the server management apparatus M, transfers this inquiry to the monitoring target server, and receives the inquiry transferred from another server, this inquiry is sent to the monitoring target server. A function to send, a function to send back a notification notifying the second and subsequent inquiries to the transmission source of the second and subsequent inquiries when receiving a query from different transmission sources, and from all monitored servers When the reply to the inquiry is confirmed, the monitoring information stored in the monitoring information storage means 13 is returned to the transmission source of the first inquiry, and when the reply from the monitoring target server is the monitoring information, the monitoring information is A function of adding to the monitoring information in the monitoring information storage means 13 and transmitting it to the transmission source of the first inquiry.

ここで、「監視対象サーバから問合せに対する何かしらの返信」とは、2回目以降の問合せであった旨の通知か、もしくは監視情報である。   Here, “some reply to the inquiry from the monitoring target server” is a notification that the inquiry has been made for the second time or later, or monitoring information.

例えば、サーバA1〜Anでde Bruijnグラフ構造のトポロジを構成した場合、図3に示すように、1つのサーバが2つの監視対象サーバを監視する構成となるので、監視情報問合せ返信手段15は、サーバ管理装置Mからの問合せを受信したらこの問合せを2つの監視対象サーバへ送信する機能と、他のサーバから問合せを受信したらこの問合せを2つの監視対象サーバへ送信する機能と、2つの他のサーバから問合せを受信し2回目の問合せに対しては問合せ元に2回目である旨の通知を返信する機能と、2つの監視対象サーバの両方から何かしらの返信を受信したら1回目の問合せ元へ監視情報蓄積手段13に記憶された監視情報を返信する機能と、監視対象サーバからの返信が監視情報であった場合その監視情報を監視情報蓄積手段13に記憶された監視情報に加算する機能を備えている。このような構成により、最初に監視情報の返信を開始するサーバの監視情報問合せ返信手段15は、2つの監視対象サーバの両方から問合せが2回目であった旨の返信を受信して、監視情報の送出を開始する。   For example, when the topology of the de Bruijn graph structure is configured by the servers A1 to An, since one server monitors two monitored servers as shown in FIG. When a query from the server management apparatus M is received, this query is transmitted to two monitored servers, when a query is received from another server, this query is transmitted to two monitored servers, and two other A function that receives a query from the server and returns a second notification to the query source, and a response from the two monitored servers to the first query source. A function for returning the monitoring information stored in the monitoring information storage means 13 and, if the reply from the monitoring target server is monitoring information, the monitoring information is stored in the monitoring information storage means 13. And a function of adding the stored monitored information. With such a configuration, the monitoring information inquiry reply unit 15 of the server that first starts sending the monitoring information receives the reply that the inquiry is the second time from both of the two monitoring target servers, and receives the monitoring information. Starts sending.

このような機能を有する監視情報問合せ返信手段15によって、サーバ管理装置Mから1つのサーバA1に送信された問合せが特定のグラフ構造の監視トポロジに沿って各サーバをリレーして伝播して行き、全てのサーバA1〜Anに問合せが行き渡る。そして、各サーバが、監視対象サーバから受信した監視情報を自機の監視情報蓄積手段13に記憶された監視情報に加算して問合せ元に返信することによって、サーバ管理装置Mから直に問合せを受けたサーバA1に、各サーバからの監視情報が累積された全サーバA1〜Anに係る監視情報が保持され、サーバ管理装置MはこのサーバA1から全サーバA1〜Anに係る監視情報を取得することができる。   By the monitoring information inquiry reply means 15 having such a function, an inquiry transmitted from the server management apparatus M to one server A1 relays and propagates each server along a monitoring topology having a specific graph structure, Queries are distributed to all servers A1 to An. Each server adds the monitoring information received from the monitoring target server to the monitoring information stored in its own monitoring information storage means 13 and sends it back to the inquiry source. The received server A1 holds monitoring information related to all the servers A1 to An in which monitoring information from each server is accumulated, and the server management apparatus M acquires the monitoring information related to all the servers A1 to An from this server A1. be able to.

ここで、本実施形態における監視手段12,被監視手段14,監視情報問合せ返信手段15,監視トポロジ情報更新手段16については、その機能内容をプログラム化してコンピュータに実行させるように構成してもよい。   Here, the monitoring means 12, the monitored means 14, the monitoring information inquiry reply means 15, and the monitoring topology information update means 16 in the present embodiment may be configured such that their function contents are programmed and executed by a computer. .

このように本実施形態におけるサーバA1〜Anは、監視手段12及び被監視手段14を備えることで、他のサーバを監視する監視側と監視される被監視側との2つの役割を持つ。また、サーバA1〜Anは、監視情報問合せ返信手段15を備えることで、サーバ管理装置Mから監視情報の問合せを受けると監視トポロジに沿って全サーバA1〜Anへ問合せを伝播させ、返信された全サーバA1〜Anの監視情報を問合せ元に対して返信する。   As described above, the servers A <b> 1 to An in the present embodiment include the monitoring unit 12 and the monitored unit 14, thereby having two roles of a monitoring side that monitors other servers and a monitored side that is monitored. Also, the servers A1 to An are provided with the monitoring information inquiry reply means 15, so that when the monitoring information inquiry is received from the server management apparatus M, the inquiry is propagated to all the servers A1 to An along the monitoring topology and returned. The monitoring information of all the servers A1 to An is returned to the inquiry source.

次に、サーバ監視装置Mにおける監視情報収集手段21は、一定の時間間隔又はランダムな時間間隔で連続的に、最近収集した全サーバA1〜Anに係る性能情報(監視情報)に基づいて各サーバの負荷状況を判断し最も負荷の少ないサーバを選出し、その選出したサーバへ監視情報の問合せを送信し、このサーバから全サーバA1〜Anに係る監視情報を取得する。   Next, the monitoring information collecting means 21 in the server monitoring apparatus M is configured so that each server is based on performance information (monitoring information) related to all recently collected servers A1 to An continuously at a constant time interval or a random time interval. The server having the least load is selected, a query for monitoring information is transmitted to the selected server, and the monitoring information relating to all the servers A1 to An is acquired from this server.

これにより、サーバ監視装置Mは、選択した1つ又は少数のサーバと通信して全サーバA1〜Anに係る監視情報(性能情報)を取得するので、各サーバと個別に通信する方式に比べて、通信にかかる負荷が軽減され、適切な周期でサーバA1〜Anに関する性能情報を収集することができる。また、通信を行うサーバを負荷状況に応じて選択するので、特定のサーバに通信負荷を集中させるようなことはない。   Thereby, since the server monitoring apparatus M communicates with the selected one or a small number of servers and acquires monitoring information (performance information) related to all the servers A1 to An, compared with a method of communicating with each server individually. The load on communication is reduced, and the performance information related to the servers A1 to An can be collected at an appropriate cycle. In addition, since the server that performs communication is selected according to the load situation, the communication load is not concentrated on a specific server.

監視情報管理手段22は、全サーバA1〜Anに係る監視情報を記憶して図示していない表示部の画面に表示させる機能を備えている。データセンタなどの運用管理者は、画面に表示された各サーバA1〜Anの性能情報を参照して複数のサーバA1〜Anの運用管理を行う。   The monitoring information management means 22 has a function of storing monitoring information related to all the servers A1 to An and displaying it on a screen of a display unit (not shown). An operation manager such as a data center refers to the performance information of each of the servers A1 to An displayed on the screen and manages the operations of the plurality of servers A1 to An.

監視トポロジ構成手段24は、ネットワーク網Lに新規に接続されたサーバから識別情報を受信した場合、その新規サーバを加えた複数のサーバで規定のグラフ構造の監視トポロジを再構成して当該新規のサーバへ接続先サーバの情報を送信し、この再構成によって監視用ID及び接続先サーバの変更があったサーバへ変更後の接続先サーバの情報及び監視用IDを送信する機能を備えている。   When receiving the identification information from the server newly connected to the network L, the monitoring topology configuration unit 24 reconfigures the monitoring topology having a specified graph structure by a plurality of servers including the new server, and adds the new topology. It has a function of transmitting connection destination server information to the server and transmitting the changed connection destination server information and monitoring ID to the server whose monitoring ID and connection destination server have been changed by this reconfiguration.

ここで、本実施形態における監視情報収集手段21,監視情報管理手段22,異常検知手段23,監視用論理監視トポロジ構成手段24については、その機能内容をプログラム化してコンピュータに実行させるように構成してもよい。   Here, the monitoring information collection unit 21, the monitoring information management unit 22, the abnormality detection unit 23, and the monitoring logical monitoring topology configuration unit 24 in the present embodiment are configured such that the function content is programmed and executed by a computer. May be.

このように本実施形態のサーバ管理装置Mは、最も負荷の少ないサーバを選んでそのサーバへ監視情報の問合せを送信しそのサーバから全サーバA1〜Anに係る監視情報を受信する監視情報収集手段21を備えているので、複数のサーバA1〜Anのそれぞれと直接通信して監視情報を取得するよりも、通信にかかる負荷が軽減される。また、監視情報の問合せを送って通信をするサーバをその都度負荷状況に基づいて選択するので、特定のサーバに通信処理の負荷を集中させることはない。   As described above, the server management apparatus M according to the present embodiment selects a server with the least load, transmits a monitoring information inquiry to the server, and receives monitoring information relating to all the servers A1 to An from the server. 21 is provided, the communication load is reduced as compared with the case where the monitoring information is acquired by directly communicating with each of the plurality of servers A1 to An. In addition, since a server that communicates by sending a query of monitoring information is selected based on the load status each time, the load of communication processing is not concentrated on a specific server.

次に、本実施形態のサーバ監視システムの全体動作について説明する。ここで、以下の動作説明は、本発明のサーバ監視方法の実施形態となる。   Next, the overall operation of the server monitoring system of this embodiment will be described. Here, the following operation description is an embodiment of the server monitoring method of the present invention.

図4は、ネットワーク網Lに新規に接続されたサーバをサーバ管理装置Mが管理対象に登録する手順を示すシーケンス図である。ここで、ネットワーク網Lに新規に接続されたサーバを仮にサーバA1とする。   FIG. 4 is a sequence diagram illustrating a procedure in which the server management apparatus M registers a server newly connected to the network L as a management target. Here, a server newly connected to the network L is assumed to be a server A1.

まず、新規のサーバA1が、ネットワーク網Lに接続した場合、サーバA1における識別情報通知手段(図示せず)が自機のIPアドレスといったサーバ識別情報をサーバ管理装置Mへ送信する(図4のステップS1)。   First, when the new server A1 is connected to the network L, the identification information notifying means (not shown) in the server A1 transmits server identification information such as its own IP address to the server management apparatus M (FIG. 4). Step S1).

サーバ管理装置Mにおける監視トポロジ構成手段25が、新規のサーバA1からサーバ識別情報を受信し登録する。続いて、監視トポロジ構成手段24が、サーバA1を含む全てのサーバA1〜Anによって規定のグラフ構造の監視トポロジが構成されるように各サーバに対して監視IDを割り当てる(図4のステップS2)。   The monitoring topology configuration unit 25 in the server management apparatus M receives and registers server identification information from the new server A1. Subsequently, the monitoring topology configuration unit 24 assigns a monitoring ID to each server so that all the servers A1 to An including the server A1 form a monitoring topology having a prescribed graph structure (step S2 in FIG. 4). .

続いて、サーバ管理装置Mにおける監視トポロジ構成手段24が、サーバA1に対して新たに割り当てた監視IDとサーバA1の接続先となるサーバの情報を送信する(図4のステップS3)。このとき、サーバ管理装置Mにおける監視トポロジ構成手段24は、サーバA1の監視トポロジへの新規参加によるトポロジの最構成によって、監視ID及び接続先サーバの変更をうけるサーバに対しても新たに監視IDを割り当てて、その監視IDと変更後の接続先となるサーバの情報を送信する。   Subsequently, the monitoring topology configuration unit 24 in the server management apparatus M transmits the monitoring ID newly assigned to the server A1 and the information of the server that is the connection destination of the server A1 (step S3 in FIG. 4). At this time, the monitoring topology configuration unit 24 in the server management apparatus M newly monitors the monitoring ID and the server to which the connection destination server is changed by the reconfiguration of the topology by newly participating in the monitoring topology of the server A1. And the monitoring ID and the server information of the connection destination after the change are transmitted.

サーバA1における監視トポロジ情報更新手段16が、サーバ管理装置Mから受信した接続先サーバの情報を自機が監視を行なう監視対象サーバの情報として監視トポロジ情報記憶手段11に登録する(図4のステップS4)。   The monitoring topology information update unit 16 in the server A1 registers the information of the connection destination server received from the server management apparatus M in the monitoring topology information storage unit 11 as the information of the monitoring target server that the own device monitors (step in FIG. 4). S4).

次に、図5は、サーバの監視と異常検知に関する動作の一例を示すシーケンス図である。ここで、監視を行なう側のサーバをサーバA1、監視をうける被監視側のサーバをサーバA2とする。   Next, FIG. 5 is a sequence diagram illustrating an example of operations related to server monitoring and abnormality detection. Here, it is assumed that the server on the monitoring side is the server A1, and the server on the monitored side to be monitored is the server A2.

まず、監視側サーバA1の監視手段12が、監視トポロジ情報記憶手段11に記憶されたアドレス情報に基づいて監視対象サーバA2に対し、性能情報(稼働状況)の送信依頼を、一定の時間間隔またはランダムな時間間隔で繰り返し送信する(図5のステップS6)。性能情報とは、サーバの稼動状況を表す数値情報であり、例えば、CPU使用率やメモリの消費量,HDDの空き容量などである。   First, the monitoring unit 12 of the monitoring server A1 sends a performance information (operation status) transmission request to the monitoring target server A2 based on the address information stored in the monitoring topology information storage unit 11 at a certain time interval or Transmission is repeated at random time intervals (step S6 in FIG. 5). The performance information is numerical information indicating the operating status of the server, and includes, for example, a CPU usage rate, a memory consumption amount, an HDD free capacity, and the like.

そして、サーバA2の被監視手段14が、サーバA1から性能情報の送信依頼を受信し、自サーバの性能情報をサーバA1へ返信する(図5のステップS7)。監視側サーバA1の監視手段12が、サーバA2から性能情報を受信し、この性能情報を監視情報蓄積手段13に蓄積させる(図5のステップS8)。   Then, the monitored means 14 of the server A2 receives the performance information transmission request from the server A1, and returns the performance information of the own server to the server A1 (step S7 in FIG. 5). The monitoring unit 12 of the monitoring server A1 receives the performance information from the server A2, and stores this performance information in the monitoring information storage unit 13 (step S8 in FIG. 5).

サーバA2に異常が発生した場合、サーバA1側からサーバA2側へ監視情報の送信依頼を送信しても(図5のステップS9)、サーバA2側は返信が行なえない。   When an abnormality occurs in the server A2, even if a monitoring information transmission request is transmitted from the server A1 side to the server A2 side (step S9 in FIG. 5), the server A2 side cannot make a reply.

サーバA1の監視手段12は、サーバA2への通信が失敗するか、もしくは一定時間が経過してもサーバA2からの返信がない場合に、サーバA1に異常が発生したと判断する(図5のステップS10)。そして、サーバA1の監視手段12は、サーバA2に異常が発生した旨の報告をサーバ管理装置Mへ送信する(図5のステップS11)。   The monitoring unit 12 of the server A1 determines that an abnormality has occurred in the server A1 when communication with the server A2 fails or when there is no reply from the server A2 even after a predetermined time has elapsed (FIG. 5). Step S10). Then, the monitoring unit 12 of the server A1 transmits a report indicating that an abnormality has occurred in the server A2 to the server management apparatus M (step S11 in FIG. 5).

サーバ管理装置Mの異常検知手段23が、サーバA1側から異常報告を受信し、監視用論理監視トポロジ構成手段24が、異常が発生したサーバA2を除外して監視トポロジを再構成し(図5のステップS12)、再構成によって監視IDや監視対象とするサーバの変更があったサーバへ変更後の監視IDと監視対象とするサーバ情報を送信する。   The abnormality detection unit 23 of the server management apparatus M receives the abnormality report from the server A1 side, and the monitoring logical monitoring topology configuration unit 24 reconfigures the monitoring topology excluding the server A2 where the abnormality has occurred (FIG. 5). Step S12), the changed monitoring ID and server information to be monitored are transmitted to the server in which the monitoring ID and the server to be monitored have been changed by reconfiguration.

次に、図6は、サーバA1〜Anの監視情報蓄積手段13に蓄積された監視情報を収集する動作を示すシーケンス図である。図6に示す動作は、複数のサーバA1〜Anでde Bruijnグラフ構造の監視トポロジを構成した場合について説明している。   Next, FIG. 6 is a sequence diagram showing an operation of collecting the monitoring information accumulated in the monitoring information accumulation means 13 of the servers A1 to An. The operation illustrated in FIG. 6 is described for the case where a monitoring topology having a de Bruijn graph structure is configured by a plurality of servers A1 to An.

まず、サーバ監視装置Mの監視情報収集手段21が、最近収集した全サーバA1〜Anに係る監視情報(性能情報)に基づいて各サーバA1〜Anの負荷状況を判断し最も負荷の少ないサーバを選出し、その選出したサーバを監視情報の問合せを最初に行なう初期問合せ先に決定する(図6のステップS13)。ここでは、初期問合せ先をサーバA1に決定したとする。   First, the monitoring information collection means 21 of the server monitoring device M determines the load status of each server A1 to An based on the monitoring information (performance information) related to all the servers A1 to An collected recently, and determines the server with the least load. The selected server is determined as an initial inquiry destination for the inquiry of monitoring information first (step S13 in FIG. 6). Here, it is assumed that the initial inquiry destination is determined as the server A1.

そして、サーバ監視装置Mの監視情報収集手段21が、初期問合せ先であるサーバA1に対し、監視情報の問合せを送信する(図6のステップS14)。   Then, the monitoring information collecting unit 21 of the server monitoring device M transmits a monitoring information inquiry to the server A1 that is the initial inquiry destination (step S14 in FIG. 6).

サーバA1の監視情報問合せ返信手段15が、サーバ監視装置Mから監視情報の問合せを受信し、de Bruijnグラフ構造の監視トポロジに基づいて設定された2つの監視対象サーバへ問合せを送信する(図6のステップS15)。   The monitoring information inquiry reply means 15 of the server A1 receives the monitoring information inquiry from the server monitoring apparatus M, and transmits the inquiry to the two monitoring target servers set based on the monitoring topology of the de Bruijn graph structure (FIG. 6). Step S15).

この問合せを受信したサーバがその問合せを対応する監視対象サーバへ転送し、問合せを監視トポロジに沿って全サーバA1〜Anに行き渡らせる。監視トポロジがde Bruijnグラフ構造であるため、全てのサーバA1〜Anは、監視情報の問合せを2回受信することになる。   The server that receives this inquiry transfers the inquiry to the corresponding monitoring target server, and distributes the inquiry to all the servers A1 to An along the monitoring topology. Since the monitoring topology has a de Bruijn graph structure, all the servers A1 to An receive the monitoring information query twice.

ここで、サーバAnの監視情報問合せ返信手段15は、1回目の問合せ(Q1)を受信したら(図6のステップS16)、2つの監視対象サーバへ問合せを転送する(図6のステップS17)。   Here, when the monitoring information inquiry reply unit 15 of the server An receives the first inquiry (Q1) (step S16 in FIG. 6), the inquiry is transferred to the two servers to be monitored (step S17 in FIG. 6).

サーバAnの監視情報問合せ返信手段15が、2つの監視対象サーバから返信(2つ共に2回目の問合せである旨の通知)を受けた時点で(図6のステップS18,S19)、監視情報蓄積手段13内の監視情報を、1回目の問合せ(Q1)の送信元へ送信する(図6のステップS20)。2回目の問合せ(Q2)を受信したら(図6のステップS21)、その問合せの送信元に対して2回目である旨の通知を返信する(図6のステップS22)。   When the monitoring information inquiry reply unit 15 of the server An receives replies from the two monitoring target servers (notification that both are the second inquiry) (steps S18 and S19 in FIG. 6), the monitoring information storage is performed. The monitoring information in the means 13 is transmitted to the transmission source of the first inquiry (Q1) (step S20 in FIG. 6). When the second inquiry (Q2) is received (step S21 in FIG. 6), a notification to the second time is returned to the inquiry transmission source (step S22 in FIG. 6).

サーバAnから送信された監視情報は、サーバA1〜Anからなる監視トポロジの逆方向に沿って各サーバの監視情報問合せ返信手段15を中継していき、中継される度に各サーバに保持された監視情報が累積加算されていく。   The monitoring information transmitted from the server An relays the monitoring information inquiry reply means 15 of each server along the reverse direction of the monitoring topology composed of the servers A1 to An, and is held in each server every time it is relayed. Monitoring information is cumulatively added.

サーバA1の監視情報問合せ返信手段15が、監視対象サーバから監視情報を受信すると(図6のステップS23)、自機の監視情報蓄積手段13に記憶された監視情報に加える(図6のステップS24)。   When the monitoring information inquiry reply unit 15 of the server A1 receives the monitoring information from the monitoring target server (step S23 in FIG. 6), it adds it to the monitoring information stored in the monitoring information storage unit 13 of the own device (step S24 in FIG. 6). ).

サーバA1の監視情報問合せ返信手段15は、もう一方の監視対象サーバからも監視情報を受信すると(図6のステップS25)、その監視情報を自機の監視情報蓄積手段13に記憶された監視情報に加えることで、全サーバに係る監視情報がこの監視情報蓄積手段13に記憶され(図6のステップS26)、この監視情報蓄積手段13に記憶された監視情報をサーバ管理装置Mへ送信する(図6のステップS27)。   When the monitoring information inquiry reply unit 15 of the server A1 receives the monitoring information from the other monitoring target server (step S25 in FIG. 6), the monitoring information stored in the monitoring information storage unit 13 of the own device is received. In addition, the monitoring information relating to all servers is stored in the monitoring information storage means 13 (step S26 in FIG. 6), and the monitoring information stored in the monitoring information storage means 13 is transmitted to the server management apparatus M ( Step S27 in FIG.

そして、サーバ管理装置Mの監視情報収集手段21が、全サーバA1〜Anに係る監視情報をサーバA1から受信し、監視情報管理手段22がその監視情報を記憶する(図6のステップS25)。   Then, the monitoring information collection unit 21 of the server management apparatus M receives the monitoring information related to all the servers A1 to An from the server A1, and the monitoring information management unit 22 stores the monitoring information (step S25 in FIG. 6).

このように、本実施形態のサーバ監視システムによれば、各サーバA1〜Anの監視手段12が他のサーバを監視することで、サーバ監視処理が分散され、サーバA1〜Anが膨大な数であっても、個々のサーバに対する監視を適切な周期で行うことができる。   As described above, according to the server monitoring system of this embodiment, the monitoring unit 12 of each server A1 to An monitors other servers, so that the server monitoring process is distributed, and the servers A1 to An are enormous. Even if it exists, the monitoring with respect to each server can be performed with a suitable period.

また、全てのサーバA1〜Anを論理的につなぐ監視トポロジを構成することで、いずれかのサーバに問合せを送れば全サーバへ問合せを伝播させることができるため、サーバ管理装置Mは、サーバA1〜Anが膨大な数であっても、1つ又は少数の任意のサーバへ監視情報の問合せを送るだけで、その任意のサーバから全サーバに関する監視情報を得ることができる。よって、サーバ管理装置Mの通信にかかる負荷を低減し、特定のサーバに対して常時負荷を与えることなく、適切な周期で全サーバA1〜Anに関する性能情報を一括して取得することができる。   In addition, by configuring a monitoring topology that logically connects all the servers A1 to An, if a query is sent to any server, the query can be propagated to all the servers. Even if .about.An is an enormous number, monitoring information relating to all servers can be obtained from any server only by sending a query for monitoring information to one or a few arbitrary servers. Therefore, it is possible to collectively collect performance information about all the servers A1 to An at an appropriate cycle without reducing the load applied to the communication of the server management apparatus M and constantly applying a load to a specific server.

本発明は、サーバが数千台を超えるようなデータセンタにおけるサーバ監視といった用途に適用できる。   The present invention can be applied to uses such as server monitoring in a data center having more than several thousand servers.

本発明にかかる一実施形態のサーバ監視システムの構成を示すブロック図である。It is a block diagram which shows the structure of the server monitoring system of one Embodiment concerning this invention. 図1に開示した実施形態におけるサーバ及びサーバ管理装置の内部構成を示す機能ブロック図である。It is a functional block diagram which shows the internal structure of the server and server management apparatus in embodiment disclosed in FIG. de Bruijnグラフ構造の具体例を示す説明図である。It is explanatory drawing which shows the specific example of a de Bruijn graph structure. 図1に開示したサーバ監視システムの全体動作の一例を示すシーケンス図である。It is a sequence diagram which shows an example of the whole operation | movement of the server monitoring system disclosed in FIG. 図1に開示したサーバ監視システムの全体動作の他の例を示すシーケンス図である。It is a sequence diagram which shows the other example of the whole operation | movement of the server monitoring system disclosed in FIG. 図1に開示したサーバ監視システムの全体動作の他の例を示すシーケンス図である。It is a sequence diagram which shows the other example of the whole operation | movement of the server monitoring system disclosed in FIG.

符号の説明Explanation of symbols

A サーバ
M サーバ管理装置
L LAN
e サーバの内部情報
11 監視トポロジ情報記憶手段
12 監視手段
13 監視情報蓄積手段
14 被監視手段
15 監視情報問合せ返信手段
16 監視トポロジ情報更新手段
21 監視情報収集手段
22 監視情報管理手段
23 異常検知手段
24 監視トポロジ構成手段
A server M server management device L LAN
e Server internal information 11 Monitoring topology information storage means 12 Monitoring means 13 Monitoring information storage means 14 Monitored means 15 Monitoring information inquiry reply means 16 Monitoring topology information update means 21 Monitoring information collection means 22 Monitoring information management means 23 Abnormality detection means 24 Monitoring topology configuration means

Claims (9)

複数のサーバとサーバ管理装置とが互いに回線接続してなるサーバ監視システムにおいて、
前記各サーバは、
前記複数のサーバでドブリュイェングラフ構造もしくはカウツグラフ構造の監視トポロジを構成するように自サーバの接続先として前記サーバ管理装置に指定されたか、もしくは予め定められた他のサーバに係る情報を記憶する監視トポロジ情報記憶手段と、
この記憶された情報に係る他のサーバを監視対象サーバとし、当該監視対象サーバの性能情報を予め設定された時間間隔で繰り返し取得する監視手段と、
この取得された前記監視対象サーバの性能情報を監視情報として蓄積する監視情報蓄積手段と、
前記サーバ管理装置から送信された監視情報の問合せを受信してこの問合せを前記監視対象サーバへ転送すると共に、他のサーバから転送された問合せを受信した場合この問合せを中継して前記監視対象サーバへ送信し、前記サーバ管理装置もしくは前記他のサーバからの問合せに対して前記監視情報蓄積手段に記憶された監視情報を返信すると共に、前記監視対象サーバから返信された監視情報を受信した場合この監視情報を中継して前記問合せの送信元へ送信する監視情報問合せ返信手段とを備え、
前記サーバ管理装置は、
予め設定された時間間隔で最近収集した全サーバに係る監視情報に基づいて、前記複数のサーバから最も負荷が小さいサーバを順次選択してその選択したサーバへ監視情報の問合せを送信しこの問合せに対して返信された全サーバに係る監視情報を受信する監視情報収集手段と、
この受信された全サーバに係る監視情報を管理する監視情報管理手段とを備えると共に、
前記各サーバにおける監視情報問合せ返信手段は、別々の送信元から同等の問合せを受信した場合、2回目以降に受けた問合せの送信元に対して前記監視情報に代えて2回目以降の問合せである旨を知らせる通知を返信する機能
を備えたことを特徴とするサーバ監視システム。
In a server monitoring system in which a plurality of servers and server management devices are connected to each other via a line,
Each of the servers
The server management device is designated as the connection destination of the own server so that the plurality of servers constitute a monitoring topology having a Doubling-Yen graph structure or a Kauts graph structure, or information related to other predetermined servers is stored. Monitoring topology information storage means;
Monitoring means for acquiring another server related to the stored information as a monitoring target server, and repeatedly acquiring performance information of the monitoring target server at a preset time interval;
Monitoring information storage means for storing the acquired performance information of the monitoring target server as monitoring information;
A monitoring information inquiry transmitted from the server management device is received and transferred to the monitoring target server. When a query transferred from another server is received, the inquiry is relayed to the monitoring target server. When the monitoring information stored in the monitoring information storage means is returned to the inquiry from the server management apparatus or the other server and the monitoring information returned from the monitoring target server is received. Monitoring information inquiry reply means for relaying the monitoring information and transmitting to the transmission source of the inquiry,
The server management device
Based on the monitoring information on all servers recently collected at a preset time interval, the server with the lowest load is sequentially selected from the plurality of servers, and an inquiry for monitoring information is sent to the selected server. Monitoring information collecting means for receiving monitoring information related to all servers returned to the server;
With monitoring information management means for managing the monitoring information related to all the received servers,
The monitoring information inquiry return means in each server is the second and subsequent queries instead of the monitoring information to the transmission source of the query received after the second time when an equivalent query is received from different transmission sources. A function to send back notifications to the effect
Server monitoring system characterized by comprising a.
前記請求項に記載のサーバ監視システムにおいて、
前記各サーバにおける監視情報問合せ返信手段は、前記問合せの送信元へ前記監視情報蓄積手段に記憶された監視情報を返信するに際して、前記問合せを転送した監視対象サーバからの返信を確認してから返信を実行するようにし、前記監視対象サーバからの返信が前記監視情報であった場合にはこの監視情報を前記監視情報蓄積手段に蓄積された監視情報に加算して前記問合せの送信元に送信することを特徴とするサーバ監視システム。
In the server monitoring system according to claim 1 ,
The monitoring information inquiry reply means in each server confirms the reply from the monitoring target server that transferred the inquiry when returning the monitoring information stored in the monitoring information storage means to the inquiry transmission source. When the response from the monitoring target server is the monitoring information, the monitoring information is added to the monitoring information stored in the monitoring information storage means and transmitted to the inquiry transmission source. A server monitoring system characterized by that.
前記請求項に記載のサーバ監視システムにおいて、
前記各サーバにおける前記監視手段は、前記監視対象サーバの性能情報の取得結果に基づいて当該監視対象サーバに異常が発生したか否かを判断し、前記監視対象サーバに異常が発生したと判断した場合に当該監視対象サーバに異常が発生した旨を前記サーバ管理装置へ通知する機能を備え、
前記サーバ管理装置は、
前記各サーバから対応する監視対象サーバの異常を知らせる通知を受信した場合に、この異常が発生したサーバを除く複数のサーバで前記監視トポロジを再構成し、この再構成によって接続先のサーバに変更があったサーバに対して変更後の接続先サーバの情報を送信する監視トポロジ構成手段を備えたことを特徴とするサーバ監視システム。
In the server monitoring system according to claim 1 ,
The monitoring means in each server determines whether an abnormality has occurred in the monitoring target server based on the performance information acquisition result of the monitoring target server, and determines that an abnormality has occurred in the monitoring target server A function to notify the server management device that an abnormality has occurred in the monitored server
The server management device
When a notification notifying the abnormality of the corresponding monitored server is received from each of the servers, the monitoring topology is reconfigured on a plurality of servers other than the server on which the abnormality has occurred, and the reconfigured server is changed to a connection destination server. A server monitoring system comprising monitoring topology configuration means for transmitting information of a connection destination server after change to a server having a problem.
前記請求項に記載のサーバ監視システムにおいて、
前記サーバ管理装置における前記監視トポロジ構成手段は、新規に回線接続されたサーバから送信された識別情報を受信した場合、この新規のサーバを加えた複数のサーバで前記監視トポロジを再構成して当該新規のサーバへ対応する接続先サーバの情報を送信し、この再構成によって接続先サーバの変更があったサーバへ変更後の接続先サーバの情報を送信する機能を備えたことを特徴とするサーバ監視システム。
In the server monitoring system according to claim 3 ,
When the monitoring topology configuration means in the server management device receives identification information transmitted from a server connected to a new line, the monitoring topology configuration unit reconfigures the monitoring topology with a plurality of servers including the new server, and A server having a function of transmitting information of a connection destination server corresponding to a new server, and transmitting information of the connection destination server after the change to a server whose connection destination server has been changed by this reconfiguration Monitoring system.
複数のサーバとサーバ管理装置とが互いに回線接続してなるサーバ監視システムにおけるサーバであって、
前記複数のサーバでドブリュイェングラフ構造もしくはカウツグラフ構造の監視トポロジを構成するように自サーバの接続先として前記サーバ管理装置に指定されたか、もしくは予め定められた他のサーバに係る情報を記憶する監視トポロジ情報記憶手段と、
この記憶された情報に係る他のサーバを監視対象サーバとし、当該監視対象サーバの性能情報を予め設定された時間間隔で繰り返し取得する監視手段と、
この取得された前記監視対象サーバの性能情報を監視情報として蓄積する監視情報蓄積手段と、
前記サーバ管理装置から送信された監視情報の問合せを受信してこの問合せを前記監視対象サーバへ転送すると共に、他のサーバから転送された問合せを受信した場合この問合せを中継して前記監視対象サーバへ送信し、前記サーバ管理装置もしくは前記他のサーバからの問合せに対して前記監視情報蓄積手段に記憶された監視情報を返信すると共に、前記監視対象サーバから返信された監視情報を受信した場合この監視情報を中継して前記問合せの送信元へ送信する監視情報問合せ返信手段とを備えると共に、
前記監視情報問合せ返信手段は、別々の送信元から同等の問合せを受信した場合、2回目以降に受けた問合せの送信元に対して前記監視情報に代えて2回目以降の問合せである旨を知らせる通知を返信する機能
を備えたことを特徴とするサーバ。
A server in a server monitoring system in which a plurality of servers and a server management device are connected to each other via a line,
The server management device is designated as the connection destination of the own server so that the plurality of servers constitute a monitoring topology having a Doubling-Yen graph structure or a Kauts graph structure, or information related to other predetermined servers is stored. Monitoring topology information storage means;
Monitoring means for acquiring another server related to the stored information as a monitoring target server, and repeatedly acquiring performance information of the monitoring target server at a preset time interval;
Monitoring information storage means for storing the acquired performance information of the monitoring target server as monitoring information;
A monitoring information inquiry transmitted from the server management device is received and transferred to the monitoring target server. When a query transferred from another server is received, the inquiry is relayed to the monitoring target server. When the monitoring information stored in the monitoring information storage means is returned to the inquiry from the server management apparatus or the other server and the monitoring information returned from the monitoring target server is received. Monitoring information inquiry reply means for relaying the monitoring information and transmitting to the transmission source of the inquiry,
When the monitoring information inquiry reply means receives an equivalent inquiry from different transmission sources, the monitoring information inquiry reply means informs the transmission source of the inquiry received after the second time that the inquiry is the second time or later instead of the monitoring information. Ability to reply notifications
Servers comprising the.
前記請求項に記載のサーバにおいて、
前記監視情報問合せ返信手段は、前記問合せの送信元に対して前記監視情報蓄積手段に記憶された監視情報を返信するに際して、前記問合せを転送した監視対象サーバからの返信を確認してから返信を実行するようにし、前記監視対象サーバからの返信が前記監視情報であった場合にはこの監視情報を前記監視情報蓄積手段に蓄積された監視情報に加算して前記問合せの送信元に送信することを特徴とするサーバ。
The server according to claim 5 , wherein:
The monitoring information inquiry reply means, when returning the monitoring information stored in the monitoring information storage means to the inquiry transmission source, confirms the reply from the monitoring target server to which the inquiry has been transferred, and returns the reply. When the reply from the monitoring target server is the monitoring information, the monitoring information is added to the monitoring information stored in the monitoring information storage means and transmitted to the transmission source of the inquiry. A server characterized by
複数のサーバとサーバ管理装置とが互いに回線接続してなるサーバ監視システムにあって、
前記各サーバが、前記複数のサーバでドブリュイェングラフ構造の監視トポロジを構成するよう自サーバの接続先として前記サーバ管理装置に指定されたか、もしくは予め定められた他のサーバを監視対象サーバとして当該監視対象サーバの性能情報を予め設定された時間間隔で繰り返し取得し、この取得した性能情報を予め備えた監視情報蓄積手段に監視情報として蓄積すると共に、
前記サーバ管理装置が、最近収集した全サーバに係る監視情報に基づいて、予め設定された時間間隔で前記複数のサーバから最も負荷が小さいサーバを順次選択してこの選択したサーバへ監視情報の問合せを送信し、
前記サーバ管理装置から問合せを受信したサーバが、予め設定された2つの監視対象サーバへ当該問合せを送信し、この問合せを前記監視トポロジに沿って各サーバが中継して全サーバへ伝達し、
この監視情報の問合せを前記監視トポロジに沿って各サーバが中継して全サーバへ伝達すると共に、
前記サーバ監視装置もしくは他のサーバから問合せを受信したサーバが、前記監視情報蓄積手段に記憶された監視情報を当該問合せの送信元へ返信し、
各サーバに係る監視情報を前記監視トポロジの逆向きに沿って各サーバが中継して伝送し、
前記サーバ管理装置が、前記監視情報の問合せを直に送った先のサーバから全サーバからの監視情報を受信すると共に、
2つの他のサーバから前記問合せを受信したサーバが、2回目の問合せの送信元へ2回目であったことを知らせる通知を返信し、
2つの監視対象サーバの両方から問合せに対する返信を受けたサーバが、1回目の問合せの送信元へ前記監視情報蓄積手段に蓄積された監視情報を返信し、
前記係る監視対象サーバから監視情報の返信を受けたサーバが、この監視対象サーバからの監視情報に自サーバの前記監視情報蓄積手段に蓄積された監視情報を加算して1回目の問合せの送信元へ送信し、各サーバに係る監視情報を監視トポロジの逆向きに沿って各サーバが累積加算しながら中継して伝送し、
各サーバに係る監視情報を累積した全サーバに係る監視情報を、前記サーバ管理装置が前記監視情報の問合せを直に送った先のサーバから受信することを特徴とするサーバ監視方法。
In a server monitoring system in which a plurality of servers and server management devices are connected to each other via a line,
Each of the servers is designated as the server management device as a connection destination of its own server so that a plurality of servers form a monitoring topology of a Doubling graph structure , or another predetermined server is set as a monitoring target server The performance information of the monitoring target server is repeatedly acquired at a preset time interval, and the acquired performance information is stored as monitoring information in a monitoring information storage unit provided in advance,
The server management device sequentially selects the server with the lightest load from the plurality of servers at a preset time interval based on recently collected monitoring information about all servers, and queries the selected server for monitoring information Send
The server that receives the query from the server management device transmits the query to two preset monitoring target servers, and relays this query to all servers by relaying the query along the monitoring topology.
Each server relays this inquiry of monitoring information along the monitoring topology and transmits it to all servers,
The server that has received the inquiry from the server monitoring device or another server returns the monitoring information stored in the monitoring information storage means to the transmission source of the inquiry,
Each server relays and transmits the monitoring information related to each server along the reverse direction of the monitoring topology,
The server management device receives monitoring information from all servers from the server that sent the monitoring information inquiry directly , and
The server that received the inquiry from two other servers returns a notification to the sender of the second inquiry that it was the second time,
A server that has received a reply to the inquiry from both of the two monitoring target servers returns the monitoring information stored in the monitoring information storage means to the transmission source of the first inquiry,
The server that received the monitoring information reply from the monitoring target server adds the monitoring information stored in the monitoring information storage means of the own server to the monitoring information from the monitoring target server, and sends the first inquiry To the monitoring information related to each server, and relaying the transmission information while accumulating each server along the reverse direction of the monitoring topology,
A server monitoring method, comprising: receiving monitoring information related to all servers accumulating monitoring information related to each server from a server to which the server management apparatus directly sends an inquiry for the monitoring information .
複数のサーバとサーバ管理装置とが互いに回線接続してなるサーバ監視システムにおける各サーバにあって、
前記複数のサーバでドブリュイェングラフ構造の監視トポロジを構成するように自サーバの接続先として前記サーバ管理装置に指定されたか、もしくは予め定められた他のサーバを監視対象サーバとして当該監視対象サーバの性能情報を予め設定された時間間隔で繰り返し取得しこの取得された性能情報を監視情報として予め備えた監視情報蓄積手段に記憶させる監視機能と、
前記サーバ管理装置から監視情報の問合せを受信してこの問合せを予め設定された2つの監視対象サーバに送信すると共にこの問合せを他のサーバから受信した場合前記監視トポロジに沿ってその問合せを中継して前記監視対象サーバへ送信する監視情報問合せ機能と、
前記サーバ管理装置もしくは前記他のサーバからの問合せに対して前記監視情報蓄積手段に記憶された前記監視情報を問合せの送信元へ返信し、前記監視対象サーバから返信された監視情報を受信した場合この監視情報を中継して前記問合せの送信元へ送信する監視情報返信機能をコンピュータに実行させると共に、
前記監視情報返信機能は、別々の送信元から同等の問合せを受信した場合、2回目以降に受けた問合せの送信元に対して前記監視情報に代えて2回目以降の問合せである旨を知らせる通知を返信する機能であることを特徴とするサーバ監視用プログラム。
In each server in a server monitoring system in which a plurality of servers and server management devices are connected to each other via a line,
The server management apparatus is designated as the connection destination of its own server so as to configure a monitoring topology having a Dobrien graph structure with the plurality of servers, or another predetermined server is set as the monitoring target server A monitoring function for repeatedly acquiring the performance information at a preset time interval and storing the acquired performance information in the monitoring information storage means provided in advance as monitoring information;
A monitoring information query is received from the server management device, and this query is transmitted to two preset monitoring target servers. When this query is received from another server , the query is relayed according to the monitoring topology. Monitoring information inquiry function to be sent to the monitoring target server,
In response to an inquiry from the server management apparatus or the other server, the monitoring information stored in the monitoring information storage unit is returned to the inquiry transmission source, and the monitoring information returned from the monitoring target server is received. While causing the computer to execute a monitoring information reply function that relays this monitoring information to the inquiry transmission source ,
When the monitoring information reply function receives an equivalent inquiry from different transmission sources, the notification that informs the transmission source of the inquiry received after the second time that the inquiry is the second time or later instead of the monitoring information A server monitoring program characterized by having a function of returning a message .
前記請求項に記載のサーバ監視用プログラムにおいて、
前記監視情報返信機能は、前記問合せの送信元に対して前記監視情報蓄積手段に記憶された監視情報を返信するに際して、前記問合せを転送した監視対象サーバからの返信を確認してから返信を実行するようにし、前記監視対象サーバからの返信が前記監視情報であった場合にはこの監視情報を前記監視情報蓄積手段に蓄積された監視情報に加算して前記問合せの送信元に送信する機能であることを特徴とするサーバ監視用プログラム。
In the server monitoring program according to claim 8 ,
The monitoring information reply function executes a reply after confirming a reply from the monitoring target server that has transferred the inquiry when returning the monitoring information stored in the monitoring information storage means to the inquiry transmission source. When the reply from the monitoring target server is the monitoring information, the monitoring information is added to the monitoring information accumulated in the monitoring information accumulating means and transmitted to the inquiry transmission source. A server monitoring program characterized by being.
JP2008263653A 2008-10-10 2008-10-10 Server management system, server management method, and server management program Expired - Fee Related JP4900358B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008263653A JP4900358B2 (en) 2008-10-10 2008-10-10 Server management system, server management method, and server management program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008263653A JP4900358B2 (en) 2008-10-10 2008-10-10 Server management system, server management method, and server management program

Publications (2)

Publication Number Publication Date
JP2010092395A JP2010092395A (en) 2010-04-22
JP4900358B2 true JP4900358B2 (en) 2012-03-21

Family

ID=42255020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008263653A Expired - Fee Related JP4900358B2 (en) 2008-10-10 2008-10-10 Server management system, server management method, and server management program

Country Status (1)

Country Link
JP (1) JP4900358B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012004891A1 (en) * 2010-07-09 2012-01-12 富士通株式会社 Monitoring program, monitoring method and monitoring device of computer
JP2012190378A (en) * 2011-03-14 2012-10-04 Kddi Corp Server system
KR101271916B1 (en) 2011-11-08 2013-06-05 주식회사 포스코 Engineering knowledge-based engineering products management system and method thereof
CN105809314A (en) * 2014-12-31 2016-07-27 中兴通讯股份有限公司 Method and system for asset management
EP3554018A4 (en) * 2016-12-06 2019-12-18 Panasonic Intellectual Property Corporation of America Information processing device and information processing method
JP6490879B2 (en) * 2016-12-06 2019-03-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America Information processing apparatus and information processing method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003046550A (en) * 2001-07-31 2003-02-14 Nippon Telegr & Teleph Corp <Ntt> Method and apparatus for no information routing
JP4313978B2 (en) * 2002-03-19 2009-08-12 日本電気株式会社 Computer monitoring method, computer monitoring method, and computer monitoring program

Also Published As

Publication number Publication date
JP2010092395A (en) 2010-04-22

Similar Documents

Publication Publication Date Title
JP4900358B2 (en) Server management system, server management method, and server management program
CN103117901B (en) A kind of distributed heartbeat detection method, Apparatus and system
JP5033856B2 (en) Devices and systems for network configuration assumptions
CN112073265B (en) Internet of things monitoring method and system based on distributed edge computing
CN101588265B (en) Method and device for obtaining network information
US20120310599A1 (en) Sensor data collection system
CN112333249B (en) Business service system and method
US10797896B1 (en) Determining the status of a node based on a distributed system
CN109039795B (en) Cloud server resource monitoring method and system
CN104115526A (en) Efficient proxy table management in communication networks
CN108600040A (en) A kind of distributed system node failure detection method based on High Availabitity detection node
CN103825759A (en) Method and system for acquiring network topological information
JP2003525558A (en) Method of monitoring messaging and VOIP network availability
JP2010098591A (en) Fault monitoring system, server device, and node device
CN114553867A (en) Cloud-native cross-cloud network monitoring method and device and storage medium
JP4919935B2 (en) Security system
JP2006195554A (en) Integrated supervision system
JP2005250521A (en) Data processing system, data processor, and data processing method
JP5475130B2 (en) Monitoring program, monitoring system, and monitoring method
JP2009171476A (en) Server management system and its construction method
CN113890850B (en) Route disaster recovery system and method
CN105721531B (en) message synchronization method and device
JP2004336658A (en) Network monitoring method and network monitoring apparatus
CN102567470A (en) System-level performance data processing method and equipment utilizing same
JP2000148539A (en) Fault detecting method, computer system, constitutional device, and recording medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111206

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111219

R150 Certificate of patent or registration of utility model

Ref document number: 4900358

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150113

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees