JP2012249115A - Apparatus monitoring system - Google Patents

Apparatus monitoring system Download PDF

Info

Publication number
JP2012249115A
JP2012249115A JP2011119866A JP2011119866A JP2012249115A JP 2012249115 A JP2012249115 A JP 2012249115A JP 2011119866 A JP2011119866 A JP 2011119866A JP 2011119866 A JP2011119866 A JP 2011119866A JP 2012249115 A JP2012249115 A JP 2012249115A
Authority
JP
Japan
Prior art keywords
server
information
monitoring
operation state
transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011119866A
Other languages
Japanese (ja)
Other versions
JP5653295B2 (en
Inventor
Masanori Kimura
正憲 木村
Hiroshi Yoshino
博志 吉野
Shigetoshi Nakanishi
茂利 中西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2011119866A priority Critical patent/JP5653295B2/en
Publication of JP2012249115A publication Critical patent/JP2012249115A/en
Application granted granted Critical
Publication of JP5653295B2 publication Critical patent/JP5653295B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

PROBLEM TO BE SOLVED: To obtain an apparatus monitoring system capable of improving availability of a system.SOLUTION: Each server comprises: an information collection unit 10 which transmits a transmission request signal A to an apparatus allocated in a layer under that of its own apparatus in a predetermined period, and collects operation state information B from the apparatus allocated in the layer under that of its own apparatus; an operation state information transmission unit 11 which transmits the operation state information B to the information collection unit 10, every time when receiving the transmission request signal A from an apparatus allocated in a layer immediately above that of its own apparatus; and a monitoring request information transmission unit 14 which selects an apparatus having a large excess capability value or a small load factor from apparatuses allocated in the same layer as an apparatus that is a transmission source of the transmission request signal A and apparatuses allocated in the layer immediately under that of the apparatus that is the transmission source of the transmission request signal A, on the basis of resource information included in the operation state information B, and transmits monitoring request information (D1 and D2) for making the selected apparatus transmit the transmission request signal A.

Description

本発明は、機器監視システムに関する。   The present invention relates to a device monitoring system.

IP網などのネットワークに接続された複数の機器(例えばパソコンやサーバなど)を有して構成された機器監視システムでは、各機器が監視機能(自機器が他の機器の動作状態を監視する機能)を有しており、この監視機能を動作させたときにおける各機器の中央演算処理部(以下「演算部」)の負荷を軽減する観点から、各機器がネットワーク上に階層的に配置されているのが一般的である。例えば、所定階層(n階層)に配設された監視機能を持つ機器は、自機器の1つ下の階層(n−1階層)に配設された機器を監視し、n−1階層に配設された監視機能を持つ各機器は、自機器の1つ下の階層(n−2階層)に配設された機器を監視する。ただし、例えばn−1階層の機器の一部に異常等が発生した場合、異常等を生じた機器(以下「第1の機器」)に監視されていたn−2階層の機器の監視が困難となる。なお、異常等とは、例えば故障によって機器が停止した状態や、リソース不足によって機器が停止する蓋然性が高い状態などである。   In a device monitoring system configured with a plurality of devices (for example, personal computers and servers) connected to a network such as an IP network, each device has a monitoring function (a function in which the own device monitors the operating status of other devices). From the viewpoint of reducing the load on the central processing unit (hereinafter referred to as “calculation unit”) of each device when this monitoring function is operated, the devices are arranged hierarchically on the network. It is common. For example, a device having a monitoring function arranged in a predetermined layer (n-th layer) monitors a device arranged in a layer (n-1 layer) one level lower than its own device, and distributes it to the n-1 layer. Each installed device having a monitoring function monitors a device arranged in a layer (n-2 layer) one level lower than its own device. However, for example, when an abnormality or the like occurs in a part of the n-1 layer device, it is difficult to monitor the n-2 layer device that is being monitored by the device in which the abnormality has occurred (hereinafter, “first device”). It becomes. An abnormality or the like is, for example, a state in which the device is stopped due to a failure or a state in which there is a high probability that the device is stopped due to a resource shortage.

このような問題を解決するため下記特許文献1に示される従来技術では、第1の機器の監視機能を他の機器(以下「第2の機器」)に代行させるため、第2の機器が予めn階層の機器に登録されている。従って、n階層の機器は、第1の機器の異常等を検知した場合、第2の機器を指定することによって、n−2階層に配設された機器の監視を継続することが可能である。   In order to solve such a problem, in the prior art disclosed in Patent Document 1 below, the second device is preliminarily installed in order to substitute the monitoring function of the first device with another device (hereinafter, “second device”). It is registered in the n-level device. Therefore, when the device in the nth layer detects an abnormality or the like of the first device, the device arranged in the n-2th layer can be continuously monitored by designating the second device. .

特開2007−183714号公報JP 2007-183714 A

しかしながら、上記特許文献1に示される従来技術では、異常等が生じた場合に指定される第2の機器が固定であるため、n階層の機器に登録されている全ての第2の機器にも異常等が生じている場合、n−2階層に配設された機器の監視を行うことができず、システムの可用性(システムを継続して稼動できること)の低下を招くという課題があった。   However, in the prior art disclosed in Patent Document 1, since the second device designated when an abnormality or the like occurs is fixed, all the second devices registered in the n-layer devices are also included. When an abnormality or the like has occurred, there is a problem that it is not possible to monitor the devices arranged in the n-2 hierarchy, leading to a decrease in system availability (that the system can be operated continuously).

本発明は、上記に鑑みてなされたものであって、システムの可用性を高めることが可能な機器監視システムを得ることを目的とする。   The present invention has been made in view of the above, and an object thereof is to obtain a device monitoring system capable of increasing the availability of the system.

上述した課題を解決し、目的を達成するために、本発明は、動作状態を監視する機能を有する複数の機器がネットワーク上に階層的に配置されて成る機器監視システムであって、前記各機器は、自機器の下の階層に配設された機器に対して、機器の動作状態を示す動作状態情報の送信を要求する送信要求信号を、所定周期で送信すると共に、自機器の下の階層に配設された機器からの前記動作状態情報を収集する情報収集部と、自機器の1つ上の階層に配設された機器からの前記送信要求信号を受信する毎に、前記情報収集部に前記動作状態情報を送信する動作状態情報送信部と、自機器の1つ上の階層に配設された機器から送信される前記送信要求信号の受信周期と、前記動作状態情報に含まれるリソース情報とに基づいて、前記送信要求信号の送信元の機器と同階層に配設された機器群および前記送信要求信号の送信元の機器の1つ下の階層に配設された機器群の中から、余剰能力の値が大きい機器または負荷率が小さい機器を選出すると共に、選出された機器に前記送信要求信号の送信を行わせる要求情報を送信する要求情報送信部と、を備えたことを特徴とする。   In order to solve the above-described problems and achieve the object, the present invention provides a device monitoring system in which a plurality of devices having a function of monitoring an operation state are arranged hierarchically on a network, Transmits a transmission request signal for requesting transmission of operation state information indicating the operation state of the device to a device arranged in a layer below the own device at a predetermined cycle, and The information collecting unit that collects the operation state information from the device arranged in the device, and the information collecting unit every time the transmission request signal is received from the device arranged in the hierarchy one level higher than the own device An operation state information transmitting unit for transmitting the operation state information to the device, a reception cycle of the transmission request signal transmitted from a device arranged in a layer one higher than the own device, and a resource included in the operation state information Based on the information and the transmission request A device having a large surplus capacity from among a device group arranged in the same hierarchy as the transmission source device of the signal and a device group arranged in the hierarchy one level lower than the transmission source device of the transmission request signal Alternatively, the apparatus includes a request information transmission unit that selects a device having a small load factor and transmits request information that causes the selected device to transmit the transmission request signal.

この発明によれば、異常等を生じている機器の1つ下の階層に配設された機器が異常等を検知し、周囲の機器に対して自機器の監視元の変更を要求するようにしたので、システムの可用性を高めることができる、という効果を奏する。   According to the present invention, the device arranged in the hierarchy one level lower than the device causing the abnormality or the like detects the abnormality or the like, and requests the surrounding device to change the monitoring source of the own device. As a result, the system availability can be increased.

図1は、本発明の実施の形態1にかかる機器監視システムの構成を示す図である。FIG. 1 is a diagram illustrating a configuration of a device monitoring system according to the first embodiment of the present invention. 図2は、図1に示される各サーバ内の機能ブロックを示す図である。FIG. 2 is a diagram showing functional blocks in each server shown in FIG. 図3は、図2に示される各機能ブロックの詳細を示す図である。FIG. 3 is a diagram showing details of each functional block shown in FIG. 図4は、n−1階層に配設された各サーバがn−2階層に配設された各サーバからの動作状態情報Bに基づいて優先順位情報を作成する場合の動作を模式的に示す図である。FIG. 4 schematically shows an operation in the case where each server arranged in the n-1 hierarchy creates priority order information based on the operation state information B from each server arranged in the n-2 hierarchy. FIG. 図5は、図3に示される監視要求情報送信部の動作を示すフローチャートである。FIG. 5 is a flowchart showing the operation of the monitoring request information transmission unit shown in FIG. 図6は、第1の監視要求情報が出力されるときのサーバの動作を示す図である。FIG. 6 is a diagram illustrating the operation of the server when the first monitoring request information is output. 図7は、第2の監視要求情報が出力されるときのサーバの動作を示す図である。FIG. 7 is a diagram illustrating the operation of the server when the second monitoring request information is output. 図8は、本発明の実施の形態2にかかる各サーバ内の機能ブロックを示す図である。FIG. 8 is a diagram showing functional blocks in each server according to the second embodiment of the present invention. 図9は、本発明の実施の形態3にかかる各サーバ内の機能ブロックを示す図である。FIG. 9 is a diagram showing functional blocks in each server according to the third embodiment of the present invention.

以下に、本発明にかかる機器監視システムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。   Embodiments of a device monitoring system according to the present invention will be described below in detail with reference to the drawings. Note that the present invention is not limited to the embodiments.

実施の形態1.
図1は、本発明の実施の形態1にかかる機器監視システム100の構成を示す図である。図1に示される機器監視システム100は、IP網などのネットワーク30に接続された機器の一例として、複数のサーバn〜n24を有して構成されている。これらのサーバは、例えばデータベースサーバ、WEBサーバ、およびメールサーバなどである。
Embodiment 1 FIG.
FIG. 1 is a diagram showing a configuration of a device monitoring system 100 according to the first embodiment of the present invention. A device monitoring system 100 illustrated in FIG. 1 includes a plurality of servers n to n24 as an example of a device connected to a network 30 such as an IP network. These servers are, for example, a database server, a WEB server, and a mail server.

図1には、所定階層(n階層)に配設されたサーバnと、n階層の1つ下の階層(n−1階層)に配設されると共にサーバnに監視されるサーバn11およびサーバn12と、n−1階層の1つ下の階層(n−2階層)に配設されると共にサーバn11に監視されるサーバn21およびサーバn22と、n−2階層に配設されると共にサーバn12に監視されるサーバn23およびサーバn24とが示されている。n−1階層に配設されたサーバn11およびサーバn12は、サーバ群G1を構成し、n−2階層に配設されたサーバn21、サーバn22、サーバn23、およびサーバn24は、サーバ群G2を構成する。また、各階層に配設されるサーバ数は、図1に示される数に限定されるものではなく、例えば、サーバ群G0には1または2以上のサーバが配設され、サーバ群G1には3台以上のサーバが配設されるように構成してもよい。   FIG. 1 shows a server n arranged in a predetermined hierarchy (n hierarchy), a server n11 and a server arranged in a hierarchy (n-1 hierarchy) immediately below the n hierarchy and monitored by the server n. n12, a server n21 and a server n22 that are arranged in a hierarchy (n-2 hierarchy) immediately below the n-1 hierarchy and monitored by the server n11, and a server n12 arranged in the n-2 hierarchy The server n23 and the server n24 monitored are shown in FIG. The server n11 and the server n12 arranged in the n-1 hierarchy constitute the server group G1, and the server n21, the server n22, the server n23, and the server n24 arranged in the n-2 hierarchy constitute the server group G2. Constitute. Further, the number of servers arranged in each layer is not limited to the number shown in FIG. 1. For example, one or two or more servers are arranged in the server group G0, and the server group G1 is arranged in the server group G1. You may comprise so that three or more servers may be arrange | positioned.

各サーバn〜n24は、自サーバの下の階層に配設された複数のサーバの動作状態を監視する監視機能(後述する情報収集部10)を有しており、例えば、サーバnは、サーバn11およびサーバn12の動作状態を監視し、サーバn11は、サーバn21およびサーバn22の動作状態を監視する。このように、機器監視システム100は、ネットワーク30に接続された各サーバn〜n24の監視機能が階層構造化されて構成されている。この構成によって、1台のサーバが監視するサーバ台数が減り、監視に伴う各サーバn〜n24の処理負荷が軽減される。ただし、所定のサーバ(例えばサーバn11)に、異常等が生じた場合、そのサーバに監視されているサーバ(例えばサーバn21、n22)の動作状態を監視することが困難となる。実施の形態1にかかる機器監視システム100は、異常等を生じているサーバ(第1のサーバ)の1つ下の階層に配設されたサーバが、第1のサーバの異常等を検知すると共に、第1のサーバと同階層に配設されたサーバ群内のサーバ(第2のサーバ)に対して監視元の変更を要求する第1の監視要求情報D1を送信し、または第1のサーバの1つ下の階層に配設されたサーバ群内のサーバ(第3のサーバ)に対して監視元の変更を要求する第2の監視要求情報D2を送信するように構成されている。   Each of the servers n to n24 has a monitoring function (information collecting unit 10 to be described later) for monitoring the operating state of a plurality of servers arranged in a hierarchy below the own server. For example, the server n is a server The operating states of n11 and server n12 are monitored, and server n11 monitors the operating states of server n21 and server n22. As described above, the device monitoring system 100 is configured by hierarchizing the monitoring functions of the servers n to n24 connected to the network 30. With this configuration, the number of servers monitored by one server is reduced, and the processing load on each of the servers n to n24 accompanying monitoring is reduced. However, when an abnormality or the like occurs in a predetermined server (for example, server n11), it becomes difficult to monitor the operation state of the servers (for example, servers n21 and n22) monitored by the server. In the device monitoring system 100 according to the first embodiment, a server disposed in a hierarchy immediately below a server (first server) in which an abnormality or the like has occurred detects an abnormality or the like of the first server. The first monitoring request information D1 for requesting the change of the monitoring source is transmitted to a server (second server) in the server group arranged in the same hierarchy as the first server, or the first server The second monitoring request information D2 for requesting the change of the monitoring source is transmitted to the server (third server) in the server group arranged in the next lower layer.

図2は、図1に示される各サーバn〜n24内の機能ブロックを示す図である。図2に示されるサーバnは、図1に示されるサーバnに対応し、図2に示されるサーバn11およびサーバn12は、図1に示されるサーバn11およびサーバn12に対応し、図2に示されるサーバn21、サーバn22、サーバn23、およびサーバn24は、図1に示されるサーバn21、サーバn22、サーバn23、およびサーバn24に対応する。これらの各サーバn〜n24は、情報収集部10、動作状態情報送信部11、情報記憶部12、および監視要求情報送信部14を有して構成されている。   FIG. 2 is a diagram showing functional blocks in each of the servers n to n24 shown in FIG. The server n shown in FIG. 2 corresponds to the server n shown in FIG. 1, and the server n11 and the server n12 shown in FIG. 2 correspond to the server n11 and the server n12 shown in FIG. Server n21, server n22, server n23, and server n24 correspond to server n21, server n22, server n23, and server n24 shown in FIG. Each of these servers n to n24 includes an information collecting unit 10, an operation state information transmitting unit 11, an information storing unit 12, and a monitoring request information transmitting unit 14.

図3は、図2に示される各機能ブロックの詳細を示す図である。図3に示される情報収集部10は、自サーバの下の階層に配設された各サーバに対して、各サーバの動作状態を示す情報(動作状態情報B)の送信を要求する送信要求信号Aを所定周期(例えば59〜61秒に1回など)毎に送信すると共に、自サーバの下の階層に配設されたサーバからの動作状態情報Bを収集する。なお、動作状態情報Bは、サーバの故障を知らせる情報やリソース情報などであり、リソース情報は、例えば、各サーバn〜n24に内蔵される演算部(図示せず)の負荷率および余剰能力などである。また、図3に示される動作状態情報Bは、自サーバの1つ下の階層に配設されたサーバから送信される動作状態情報である第1の動作状態情報B1と、自サーバの2つ下の階層に配設されたサーバから送信される動作状態情報である第2の動作状態情報B2を表し、各サーバn〜n24内の情報収集部10では、第1の動作状態情報B1および第2の動作状態情報B2が収集される。   FIG. 3 is a diagram showing details of each functional block shown in FIG. The information collection unit 10 shown in FIG. 3 sends a transmission request signal for requesting transmission of information (operation state information B) indicating the operation state of each server to each server arranged in a layer below the server itself. A is transmitted every predetermined period (for example, once every 59 to 61 seconds), and operation state information B is collected from servers arranged in a hierarchy below the server itself. The operating state information B is information or resource information for notifying a server failure, and the resource information is, for example, the load factor and surplus capacity of a calculation unit (not shown) built in each of the servers n to n24. It is. Further, the operation state information B shown in FIG. 3 includes two pieces of information, that is, first operation state information B1 which is operation state information transmitted from a server arranged in a layer one level lower than the own server, and the own server. The second operation state information B2 that is the operation state information transmitted from the server arranged in the lower hierarchy is represented, and the information collecting unit 10 in each of the servers n to n24 includes the first operation state information B1 and the first operation state information B1. Two pieces of operation state information B2 are collected.

また、情報収集部10は、第1の監視要求情報D1を受信した場合、この第1の監視要求情報D1の送信元のサーバに対して送信要求信号Aを送信し、第2の監視要求情報D2を受信した場合、この第2の監視要求情報D2の送信元のサーバに対して送信要求信号Aを送信するように構成されている。この送信要求信号Aを受信したサーバn〜n24は、送信要求信号Aの送信のサーバn〜n24へ動作状態情報Bを送信することによって、送信要求信号Aの送信のサーバn〜n24に監視される。   Further, when the information collection unit 10 receives the first monitoring request information D1, the information collecting unit 10 transmits a transmission request signal A to the server that is the transmission source of the first monitoring request information D1, and the second monitoring request information D1. When D2 is received, a transmission request signal A is transmitted to the server that is the transmission source of the second monitoring request information D2. The servers n to n24 that have received the transmission request signal A are monitored by the servers n to n24 that transmit the transmission request signal A by transmitting the operation state information B to the servers n to n24 that transmit the transmission request signal A. The

図3に示される情報記憶部12は、動作状態情報記憶部12aおよび優先順位情報記憶部12bを有して構成されている。動作状態情報記憶部12aには、情報収集部10で収集された第1の動作状態情報B1および第2の動作状態情報B2が記録される。優先順位情報記憶部12bには、優先順位情報作成部15bから出力された優先順位情報Cが記録される。   The information storage unit 12 shown in FIG. 3 includes an operation state information storage unit 12a and a priority information storage unit 12b. The operating state information storage unit 12a records the first operating state information B1 and the second operating state information B2 collected by the information collecting unit 10. The priority information C outputted from the priority information creation unit 15b is recorded in the priority information storage unit 12b.

図3に示される優先順位情報受信部15aは、自サーバの1つ上の階層に配設されたサーバから送信された第1の優先順位情報C1と、自サーバの2つ上の階層に配設されたサーバから送信された第2の優先順位情報C2とを受信する。優先順位情報受信部15aで受信された第1の優先順位情報C1および第2の優先順位情報C2は、優先順位情報Cとして優先順位情報記憶部12bに記録される。   The priority order information receiving unit 15a shown in FIG. 3 is arranged in the first priority order information C1 transmitted from the server arranged in the hierarchy one level higher than the local server and in the hierarchy two levels higher than the local server. The second priority information C2 transmitted from the installed server is received. The first priority information C1 and the second priority information C2 received by the priority information receiving unit 15a are recorded as priority information C in the priority information storage unit 12b.

図3に示される優先順位情報送信部15cは、優先順位情報記憶部12bに記録された優先順位情報Cを読み出し、読み出された優先順位情報Cは、自サーバの1つ下の階層に配設されたサーバに対しては第1の優先順位情報C1として送信され、自サーバの2つ下の階層に配設されたサーバに対しては第2の優先順位情報C2として送信される。   The priority order information transmission unit 15c shown in FIG. 3 reads the priority order information C recorded in the priority order information storage unit 12b, and the read priority order information C is arranged in the hierarchy one level lower than its own server. It is transmitted as the first priority information C1 to the installed server, and is transmitted as the second priority information C2 to the server arranged in the hierarchy two levels lower than its own server.

図3に示される優先順位情報作成部15bは、動作状態情報記憶部12aに記録された第1の動作状態情報B1および第2の動作状態情報B2内のリソース情報を読み込み、このリソース情報に含まれる負荷率および余剰能力を用いて、以下のような処理を行う。   The priority order information creating unit 15b shown in FIG. 3 reads the resource information in the first operation state information B1 and the second operation state information B2 recorded in the operation state information storage unit 12a and includes them in this resource information. The following processing is performed using the load factor and surplus capacity.

例えば、図1に示されるサーバn12に内蔵される図示しない演算部(A)の処理速度が100MIPSであり、サーバn23に内蔵される図示しない演算部(B)の処理速度が110MIPSであり、サーバn24に内蔵される図示しない演算部(C)の処理速度が120MIPSであると仮定し、さらに、これら各演算部(A)〜(C)の負荷率が各々70%であると仮定する。このとき、演算部(A)の余剰能力は30MIPSとなり、演算部(B)の余剰能力は33MIPSとなり、演算部(C)の余剰能力は36MIPSとなる。ここで、各サーバに内蔵される各演算部のスペックが全て同一であることは希であるため、負荷率が同じであっても、各々の余剰能力の値には差が生じることとなる。優先順位情報作成部15bは、各サーバのハードウェア(演算部)の処理速度が各々異なる場合、演算部の余剰能力の値が大きい方から順に、各サーバの順位付けを行う。上記例であれば、優先順位情報作成部15bは、余剰能力が36MIPSのサーバn24の優先順位を1番、余剰能力が33MIPSのサーバn23の優先順位を2番、余剰能力が30MIPSのサーバn12の優先順位を3番とする。順位付けの結果である優先順位は、優先順位情報Cとして優先順位情報記憶部12bに記録される。   For example, the processing speed of the arithmetic unit (A) (not shown) built in the server n12 shown in FIG. 1 is 100 MIPS, and the processing speed of the arithmetic unit (B) (not shown) built in the server n23 is 110 MIPS. It is assumed that the processing speed of the arithmetic unit (C) (not shown) incorporated in n24 is 120 MIPS, and further that the load factor of each of the arithmetic units (A) to (C) is 70%. At this time, the surplus capability of the calculation unit (A) is 30 MIPS, the surplus capability of the calculation unit (B) is 33 MIPS, and the surplus capability of the calculation unit (C) is 36 MIPS. Here, since it is rare that the specifications of the calculation units built in each server are all the same, even if the load factor is the same, a difference occurs in the value of each surplus capacity. When the processing speeds of the hardware (calculation units) of the servers are different from each other, the priority order information creation unit 15b ranks the servers in descending order of the surplus capacity value of the calculation units. In the above example, the priority information creating unit 15b sets the priority of the server n24 with the surplus capacity of 36 MIPS as the first, the priority of the server n23 with the surplus capacity of 33 MIPS as the second, and the server n12 with the surplus capacity of 30 MIPS. The priority is set to No. 3. The priority as a result of ranking is recorded as priority information C in the priority information storage unit 12b.

図3に示される動作状態情報送信部11は、自サーバの1つ上の階層に配設されたサーバからの送信要求信号Aを受信したとき、動作状態情報記憶部12aに記録された動作状態情報Bを読み出し、動作状態情報Bは、自サーバの1つ上の階層に配設されたサーバに対しては第1の動作状態情報B1として送信され、自サーバの2つ上の階層に配設されたサーバに対しては第2の動作状態情報B2として送信される。   The operation state information transmission unit 11 shown in FIG. 3 receives the transmission request signal A from the server arranged in the hierarchy one level higher than its own server, and the operation state recorded in the operation state information storage unit 12a. The information B is read, and the operation status information B is transmitted as the first operation status information B1 to the server arranged in the hierarchy one level higher than the own server, and is distributed to the hierarchy two levels higher than the own server. It is transmitted as second operation state information B2 to the installed server.

図3に示される監視要求情報送信部14は、異常監視部13、選出部18、監視要求情報生成部19、優先順位情報受信部15a、優先順位情報作成部15b、および優先順位情報送信部15cを有して構成されている。   The monitoring request information transmission unit 14 shown in FIG. 3 includes an abnormality monitoring unit 13, a selection unit 18, a monitoring request information generation unit 19, a priority information reception unit 15a, a priority information generation unit 15b, and a priority information transmission unit 15c. It is comprised.

異常監視部13は、動作状態情報送信部11が送信要求信号Aを所定周期(例えば59〜61秒に1回など)毎に受信しているか否か監視する。送信要求信号Aが第1の所定周期内に受信されていないとき、異常監視部13は、この送信要求信号Aの送信元のサーバに異常等が生じたと判断してアラートを出力する。   The abnormality monitoring unit 13 monitors whether the operation state information transmitting unit 11 receives the transmission request signal A every predetermined period (for example, once every 59 to 61 seconds). When the transmission request signal A is not received within the first predetermined period, the abnormality monitoring unit 13 determines that an abnormality or the like has occurred in the transmission source server of the transmission request signal A and outputs an alert.

第1の所定周期に関して補足すると、例えば、図1に示されるサーバn11の負荷率が上昇して処理速度が著しく低下した場合、このサーバn11に監視されていたサーバn22には、所定周期が経過しても送信要求信号Aが伝送されないこととなる。従って、第1の所定周期には送信要求信号Aの送信遅延時間を加味する必要がある。例えば、所定周期が59〜61秒であり、送信要求信号Aの送信遅延時間の最大値が5秒である場合、所定周期に送信遅延時間を加算した時間(64〜66秒)が第1の所定周期となる。従って、送信要求信号Aが最後に受信されてから約66秒経過するまでに、次の送信要求信号Aが受信されない場合、異常監視部13からアラートが出力される。   Supplementing the first predetermined cycle, for example, when the load factor of the server n11 shown in FIG. 1 is increased and the processing speed is significantly reduced, the server n22 monitored by the server n11 has passed the predetermined cycle. Even so, the transmission request signal A is not transmitted. Therefore, it is necessary to consider the transmission delay time of the transmission request signal A in the first predetermined cycle. For example, when the predetermined cycle is 59 to 61 seconds and the maximum value of the transmission delay time of the transmission request signal A is 5 seconds, the time (64 to 66 seconds) obtained by adding the transmission delay time to the predetermined cycle is the first. It becomes a predetermined cycle. Therefore, if the next transmission request signal A is not received before about 66 seconds have passed since the transmission request signal A was last received, an alert is output from the abnormality monitoring unit 13.

図3に示される選出部18は、異常監視部13からアラートを受信したとき、優先順位情報記憶部12bに記録された優先順位情報Cを読み出し、読み出された優先順位情報Cの中で最も優先順位が高いサーバを選出する。   When the selection unit 18 shown in FIG. 3 receives the alert from the abnormality monitoring unit 13, the selection unit 18 reads the priority order information C recorded in the priority order information storage unit 12b, and the highest priority information C is read out. Select a server with a higher priority.

監視要求情報生成部19は、選出部18で選出されたサーバが第2のサーバである場合、第1の監視要求情報D1を生成する。例えば、第1のサーバが図1に示されるサーバn11であり、サーバn11に監視されていたサーバがサーバn22であり、第2のサーバがサーバn12である場合、サーバn22内の監視要求情報送信部14は、監視要求情報生成部19で生成された第1の監視要求情報D1をサーバn12に送信する。   When the server selected by the selection unit 18 is the second server, the monitoring request information generation unit 19 generates the first monitoring request information D1. For example, when the first server is the server n11 shown in FIG. 1, the server monitored by the server n11 is the server n22, and the second server is the server n12, the monitoring request information in the server n22 is transmitted. The unit 14 transmits the first monitoring request information D1 generated by the monitoring request information generation unit 19 to the server n12.

また、監視要求情報生成部19は、選出部18で選出されたサーバが第3のサーバである場合、第2の監視要求情報D2を生成する。例えば、第1のサーバが図1に示されるサーバn11であり、サーバn11に監視されていたサーバがサーバn22であり、第3のサーバがサーバn23である場合、サーバn22内の監視要求情報送信部14は、監視要求情報生成部19で生成された第2の監視要求情報D2をサーバn23に送信する。   Moreover, the monitoring request information generation part 19 produces | generates the 2nd monitoring request information D2, when the server elected by the selection part 18 is a 3rd server. For example, when the first server is the server n11 shown in FIG. 1, the server monitored by the server n11 is the server n22, and the third server is the server n23, the monitoring request information in the server n22 is transmitted. The unit 14 transmits the second monitoring request information D2 generated by the monitoring request information generation unit 19 to the server n23.

第2の監視要求情報D2を受信した第3のサーバの階層は、仮想的に第1のサーバと同じ階層に変更される。上記例の場合、サーバn23の階層が、n−2階層からn−1階層に変更される。第3のサーバの階層が、第1のサーバと同じ階層に変更されることによって、各サーバの監視機能の階層構造に影響を与えることなくサーバn22の監視を継続することが可能である。なお、第3のサーバの階層が変更されたことによって、第3のサーバに監視されていたサーバ(例えば図示しないn−3階層に配設されたサーバ)の監視元がなくなるようにも思われるが、例えば、第2の監視要求情報D2を受信したサーバn23が第1のサーバとみなされるため、このサーバn23の1つ下の階層(図示しないn−3階層)に配設されたサーバの内部でアラートが出力される。そして、アラートが出力されたとき、このサーバ内の監視要求情報送信部14から第1の監視要求情報D1または第2の監視要求情報D2が出力される。このような動作が、n−3階層以下の各階層に配設されたサーバで順次行われるため、各サーバの監視機能の階層構造が維持される。   The hierarchy of the third server that has received the second monitoring request information D2 is virtually changed to the same hierarchy as the first server. In the case of the above example, the hierarchy of the server n23 is changed from the n-2 hierarchy to the n-1 hierarchy. By changing the hierarchy of the third server to the same hierarchy as the first server, it is possible to continue monitoring the server n22 without affecting the hierarchical structure of the monitoring function of each server. In addition, it seems that the monitoring source of the servers monitored by the third server (for example, servers arranged in the n-3 hierarchy not shown) disappears due to the change of the hierarchy of the third server. However, for example, since the server n23 that has received the second monitoring request information D2 is regarded as the first server, the server arranged in the hierarchy one level below this server n23 (the n-3 hierarchy not shown) An alert is output internally. When an alert is output, the first monitoring request information D1 or the second monitoring request information D2 is output from the monitoring request information transmission unit 14 in the server. Since such an operation is sequentially performed by the servers arranged in each of the n-3 and lower layers, the hierarchical structure of the monitoring function of each server is maintained.

ここで、情報収集部10で第1の動作状態情報B1および第2の動作状態情報B2が収集される理由と、優先順位情報受信部15aで第1の優先順位情報C1および第2の優先順位情報C2が受信される理由を補足する。   Here, the reason why the first operation state information B1 and the second operation state information B2 are collected by the information collecting unit 10, and the first priority information C1 and the second priority order by the priority information receiving unit 15a. The reason why the information C2 is received will be supplemented.

図4は、n−1階層に配設された各サーバn11、n12がn−2階層に配設された各サーバn21〜n24からの動作状態情報Bに基づいて優先順位情報Cを作成する場合の動作を模式的に示す図である。   FIG. 4 shows a case where the priority information C is created based on the operation state information B from the servers n21 to n24 arranged in the n-2 hierarchy. It is a figure which shows typically operation | movement.

(1)図4の左側に示されるサーバn21およびサーバn22から出力された動作状態情報Bはサーバn11へ送信され、サーバn11は、これらの動作状態情報Bに含まれるリソース情報に基づいてサーバn21およびサーバn22の順位付けを行なう。このときの優先順位は、サーバn21、サーバn22の順で1番、2番である仮定する。(2)作成された優先順位情報Cは、サーバn21およびサーバn22に送信される。(3)図4の右側に示されるサーバn23およびサーバn24から出力された動作状態情報Bは、サーバn12へ送信される。サーバn12は、これらの動作状態情報Bに基づいてサーバn23およびサーバn24の順位付けを行う。このときの優先順位は、サーバn23、サーバn24の順で1番、2番である仮定する。(4)そして、作成された優先順位情報Cは、サーバn23およびサーバn24に送信される。ここで、機器監視システム100全体で見た場合、サーバn23の余剰能力がサーバn21の余剰能力より大きい場合もあるわけであるが、図4に示す動作例では、(5)サーバn11およびサーバn12からの動作状態情報Bがサーバnに送信されないため、サーバnではサーバn21〜n24の順位付けを行うことができない。仮にサーバn11およびサーバn12からの動作状態情報Bがサーバnに送信された場合でも、(6)サーバn11〜n24の順位付けの結果である優先順位情報Cがサーバn22に送信されない場合、サーバn22では、サーバn23とサーバn21との順位付けを行うことができない。そのため、サーバn23の余剰能力がサーバn21の余剰能力より大きいにもかかわらず、サーバn22内の監視要求情報送信部14は、サーバn11からの優先順位情報Cの中で最も優先順位が高いサーバとしてサーバn21を選出し、このサーバn21に対して第2の監視要求情報D2を送信する。   (1) The operation state information B output from the server n21 and the server n22 shown on the left side of FIG. 4 is transmitted to the server n11, and the server n11 receives the server n21 based on the resource information included in the operation state information B. The server n22 is ranked. The priority order at this time is assumed to be No. 1 and No. 2 in the order of the server n21 and the server n22. (2) The created priority information C is transmitted to the server n21 and the server n22. (3) The operation state information B output from the server n23 and the server n24 shown on the right side of FIG. 4 is transmitted to the server n12. The server n12 ranks the server n23 and the server n24 based on the operation state information B. The priority order at this time is assumed to be No. 1 and No. 2 in the order of the server n23 and the server n24. (4) Then, the created priority order information C is transmitted to the server n23 and the server n24. Here, when viewed from the device monitoring system 100 as a whole, the surplus capacity of the server n23 may be larger than the surplus capacity of the server n21. However, in the operation example shown in FIG. 4, (5) the server n11 and the server n12. Since the operation state information B from the server n is not transmitted to the server n, the server n cannot rank the servers n21 to n24. Even if the operation state information B from the server n11 and the server n12 is transmitted to the server n, (6) when the priority information C as a result of ranking of the servers n11 to n24 is not transmitted to the server n22, the server n22 Then, the server n23 and the server n21 cannot be ranked. Therefore, although the surplus capacity of the server n23 is larger than the surplus capacity of the server n21, the monitoring request information transmitting unit 14 in the server n22 is the server with the highest priority among the priority order information C from the server n11. The server n21 is selected, and the second monitoring request information D2 is transmitted to the server n21.

実施の形態1にかかる機器監視システム100は、各サーバn〜n24が、自サーバの1つ下の階層に配設されたサーバから送信された第1の動作状態情報B1だけでなく、自サーバの2つ下の階層に配設されたサーバから送信された第2の動作状態情報B2も受信可能に構成されている。従って、図4に示されるサーバnでは、例えばサーバn23の余剰能力がサーバn21の余剰能力より大きい場合でも、これらの余剰能力を考慮して各サーバn11〜n24の順位付けを行うことができる。より具体的には、例えばサーバnは、サーバn11およびサーバn12から送信された第1の動作状態情報B1と、サーバn21、サーバn22、サーバn23、およびサーバn24から送信された第2の動作状態情報B2とに基づいて、サーバn11〜n24の順位付けを行う。そして、この優先順位は、優先順位情報C1としてサーバn11およびサーバn12へ送信されると共に、優先順位情報C2としてサーバn21、サーバn22、サーバn23、およびサーバn24に送信される。このような動作がサーバn11でも行われるため、図4に示されるサーバn22には、サーバn11からの第1の優先順位情報C1(サーバn21およびサーバn22の優先順位)だけでなく、サーバnからの第2の優先順位情報C2(サーバn23およびサーバn24の優先順位)も送信される。例えばサーバn11に異常等が発生した場合、サーバn22は、第1の優先順位情報C1および第2の優先順位情報C2の中で最も優先順位が高いサーバを選出する。すなわち、サーバn22は、第1の動作状態情報B1および第2の動作状態情報B2に含まれるリソース情報に基づいて、送信要求信号Aの送信元のサーバn11(第1の機器)と同階層に配設されたサーバ群G1および第1の機器の1つ下の階層に配設されたサーバ群G2の中から、余剰能力の値が大きいサーバまたは負荷率が小さいサーバを選出する。さらにサーバn22は、選出されたサーバに、送信要求信号Aの送信を行わせる要求情報(第1の監視要求情報D1または第2の監視要求情報D2)を送信する。   In the device monitoring system 100 according to the first embodiment, each of the servers n to n24 includes not only the first operation state information B1 transmitted from the server arranged in the hierarchy one level lower than the own server, but also the own server The second operation state information B2 transmitted from the server arranged at the next lower level is also configured to be receivable. Therefore, in the server n shown in FIG. 4, even when the surplus capacity of the server n23 is larger than the surplus capacity of the server n21, the servers n11 to n24 can be ranked in consideration of these surplus capacity. More specifically, for example, the server n receives the first operation state information B1 transmitted from the server n11 and the server n12, and the second operation state transmitted from the server n21, the server n22, the server n23, and the server n24. Based on the information B2, the servers n11 to n24 are ranked. This priority order is transmitted to the servers n11 and n12 as the priority order information C1, and is transmitted to the servers n21, n22, n23, and server n24 as the priority order information C2. Since such an operation is also performed by the server n11, the server n22 shown in FIG. 4 includes not only the first priority information C1 from the server n11 (priorities of the servers n21 and n22) but also the server n11. The second priority order information C2 (priorities of the server n23 and the server n24) is also transmitted. For example, when an abnormality or the like occurs in the server n11, the server n22 selects a server having the highest priority among the first priority information C1 and the second priority information C2. That is, the server n22 is on the same level as the server n11 (first device) that is the transmission source of the transmission request signal A based on the resource information included in the first operation state information B1 and the second operation state information B2. A server having a large surplus capacity value or a server having a small load factor is selected from the server group G1 and the server group G2 disposed at the next lower level than the first device. Furthermore, the server n22 transmits request information (first monitoring request information D1 or second monitoring request information D2) that causes the selected server to transmit the transmission request signal A.

図5は、図3に示される監視要求情報送信部14の動作を示すフローチャートである。選出部18は、異常監視部13からのアラートを待受け(ステップS1)、アラートを受信したか否かを判断する(ステップS2)。アラートを受信した場合(ステップS2,Yes)、選出部18は、優先順位情報記憶部12bに記録された優先順位情報Cを読み出し、読み出された優先順位情報Cの中で最も優先順位が高いサーバを選出する(ステップS3)。なお、アラートを受信していない場合(ステップS2,No)、選出部18は、アラートの受信待機状態となる。   FIG. 5 is a flowchart showing the operation of the monitoring request information transmitter 14 shown in FIG. The selection unit 18 waits for an alert from the abnormality monitoring unit 13 (step S1), and determines whether an alert has been received (step S2). When the alert is received (step S2, Yes), the selection unit 18 reads the priority information C recorded in the priority information storage unit 12b, and has the highest priority among the read priority information C. A server is selected (step S3). If no alert is received (step S2, No), the selection unit 18 enters an alert reception standby state.

次に、選出部18で選出されたサーバが第2のサーバである場合(ステップS4,Yes)、監視要求情報生成部19は、第1の監視要求情報D1を生成する。そして、監視要求情報送信部14は、監視要求情報生成部19で生成された第1の監視要求情報D1を第2のサーバへ送信する(ステップS5)。選出部18で選出されたサーバが第2のサーバでない場合(ステップS4,No)、すなわち選出されたサーバが第3のサーバである場合、監視要求情報生成部19は、第2の監視要求情報D2を生成する。そして、監視要求情報送信部14は、監視要求情報生成部19で生成された第2の監視要求情報D2を第3のサーバへ送信する(ステップS6)。   Next, when the server selected by the selection unit 18 is the second server (step S4, Yes), the monitoring request information generation unit 19 generates the first monitoring request information D1. Then, the monitoring request information transmission unit 14 transmits the first monitoring request information D1 generated by the monitoring request information generation unit 19 to the second server (step S5). When the server selected by the selection unit 18 is not the second server (step S4, No), that is, when the selected server is the third server, the monitoring request information generation unit 19 uses the second monitoring request information. D2 is generated. Then, the monitoring request information transmission unit 14 transmits the second monitoring request information D2 generated by the monitoring request information generation unit 19 to the third server (Step S6).

次に、図6および図7を用いて、第1の監視要求情報D1または第2の監視要求情報D2が出力されるときの各サーバの動作を具体的に説明する。   Next, the operation of each server when the first monitoring request information D1 or the second monitoring request information D2 is output will be specifically described with reference to FIGS.

図6は、第1の監視要求情報D1が出力されるときのサーバの動作を示す図であり、図6には、サーバnに監視されるサーバn11およびサーバn12と、n−2階層に配設されたサーバn22とが示されている。(1)サーバn22は、サーバn11からの送信要求信号Aを受信しているが、(2)サーバn11からの送信要求信号Aが最後に受信されてから第1の所定周期経過するまでに次の送信要求信号Aが受信されない場合、サーバn11に異常等が発生したと判定し、サーバn22に記録された優先順位情報Cの中で最も優先順位が高いサーバn12に、第1の監視要求情報D1を送信する。(3)第1の監視要求情報D1を受信したサーバn12は、第1の監視要求情報D1の送信元であるサーバn22に対して送信要求信号Aを送信する。(4)サーバn22にはサーバn12からの送信要求信号Aが所定周期で伝送されるため、サーバn22は、この送信要求信号Aが送信される度に動作状態情報Bを出力し、サーバn22からの動作状態情報Bは、サーバn12に収集される。このように、実施の形態1にかかる機器監視システム100は、サーバn11に異常等が生じ、かつ、最も優先順位が高いサーバがサーバn11と同階層のサーバn12である場合でも、各サーバの監視機能の階層構造に影響を与えることなく、サーバn22の監視を継続することが可能である。   FIG. 6 is a diagram showing the operation of the server when the first monitoring request information D1 is output. In FIG. 6, the servers n11 and n12 monitored by the server n are arranged in the n-2 hierarchy. The installed server n22 is shown. (1) The server n22 has received the transmission request signal A from the server n11, but (2) the next time from when the transmission request signal A from the server n11 is last received until the first predetermined period elapses. If the transmission request signal A is not received, it is determined that an abnormality or the like has occurred in the server n11, and the first monitoring request information is sent to the server n12 having the highest priority among the priority information C recorded in the server n22. D1 is transmitted. (3) The server n12 that has received the first monitoring request information D1 transmits a transmission request signal A to the server n22 that is the transmission source of the first monitoring request information D1. (4) Since the transmission request signal A from the server n12 is transmitted to the server n22 at a predetermined cycle, the server n22 outputs the operation state information B every time the transmission request signal A is transmitted. The operation state information B is collected by the server n12. As described above, the device monitoring system 100 according to the first embodiment monitors each server even when an abnormality or the like occurs in the server n11 and the server with the highest priority is the server n12 in the same hierarchy as the server n11. It is possible to continue monitoring the server n22 without affecting the function hierarchy.

図7は、第2の監視要求情報D2が出力されるときの各サーバの動作を示す図である。図7(a)には、n階層のサーバnに監視されるサーバn11およびサーバn12と、n−2階層に配設されたサーバn22およびサーバn23とが示されている。また図7(b)には、図7(a)に示されるサーバn23がn−2階層からn−1階層に変更された状態が示されている。図7(a)において、(1)サーバn22は、サーバn11からの送信要求信号Aを受信しているが、(2)サーバn11からの送信要求信号Aが最後に受信されてから第1の所定周期経過するまでに次の送信要求信号Aが受信されない場合、サーバn11に異常等が発生したと判定し、サーバn22に記録された優先順位情報Cの中で最も優先順位が高いサーバn23に第2の監視要求情報D2を送信すると共に、サーバnにも第2の監視要求情報D2を出力する。第2の監視要求情報D2がサーバnにも送信される理由は、サーバnが、階層が変更された後のサーバn23(サーバn23a)の監視を継続して行うためである。次に図7(b)において、(3)第2の監視要求情報D2を受信したサーバn23の階層は、仮想的にサーバn11の階層と同じ階層に変更される。(4)階層が変更されたサーバn23aには、サーバnからの送信要求信号Aが所定周期で伝送されるため、(5)サーバn23aは、この送信要求信号Aが送信される度に動作状態情報Bを出力し、サーバn23aからの動作状態情報Bは、サーバn内の情報収集部10に収集される。(6)また、階層が変更されたサーバn23aは、第2の監視要求情報D2の送信元であるサーバn22に対して送信要求信号Aを送信する。(7)サーバn22にはサーバn23aからの送信要求信号Aが所定周期で伝送されるため、サーバn22は、この送信要求信号Aが送信される度に動作状態情報Bを出力し、サーバn22からの動作状態情報Bは、サーバn23aに収集される。このように、実施の形態1にかかる機器監視システム100は、サーバn11に異常等が生じ、かつ、最も優先順位が高いサーバがサーバn11の1つ下の階層に配設されたサーバ群G2内のサーバn23である場合でも、各サーバの監視機能の階層構造に影響を与えることなく、サーバn22の監視を継続することが可能である。   FIG. 7 is a diagram illustrating the operation of each server when the second monitoring request information D2 is output. FIG. 7A shows a server n11 and a server n12 monitored by a server n in the nth hierarchy, and a server n22 and a server n23 arranged in the n-2th hierarchy. FIG. 7B shows a state where the server n23 shown in FIG. 7A is changed from the n-2 hierarchy to the n-1 hierarchy. 7A, (1) the server n22 receives the transmission request signal A from the server n11, but (2) the first time since the transmission request signal A from the server n11 is last received. When the next transmission request signal A is not received before the predetermined period elapses, it is determined that an abnormality or the like has occurred in the server n11, and the server n23 having the highest priority among the priority information C recorded in the server n22. The second monitoring request information D2 is transmitted, and the second monitoring request information D2 is also output to the server n. The reason why the second monitoring request information D2 is also transmitted to the server n is that the server n continues to monitor the server n23 (server n23a) after the hierarchy is changed. Next, in FIG. 7B, (3) the hierarchy of the server n23 that has received the second monitoring request information D2 is virtually changed to the hierarchy of the server n11. (4) Since the transmission request signal A from the server n is transmitted at a predetermined cycle to the server n23a whose hierarchy has been changed, (5) the server n23a is in an operating state each time this transmission request signal A is transmitted. The information B is output, and the operation state information B from the server n23a is collected by the information collecting unit 10 in the server n. (6) Further, the server n23a whose hierarchy has been changed transmits a transmission request signal A to the server n22 that is the transmission source of the second monitoring request information D2. (7) Since the transmission request signal A from the server n23a is transmitted to the server n22 at a predetermined cycle, the server n22 outputs the operation state information B every time the transmission request signal A is transmitted. The operation state information B is collected by the server n23a. As described above, in the device monitoring system 100 according to the first embodiment, an abnormality or the like occurs in the server n11, and the server with the highest priority is located in the server group G2 arranged in the hierarchy immediately below the server n11. Even in the case of the server n23, it is possible to continue monitoring the server n22 without affecting the hierarchical structure of the monitoring function of each server.

なお、上記説明では、優先順位情報作成部15bにおける順位付けは、余剰能力の値を比較することで行われているが、これに限定されるものではなく、例えば各サーバのハードウェア能力が各々同等である場合、各ハードウェアの負荷率の値を比較することによって順位付けを行うように構成してもよい。   In the above description, the ranking in the priority order information creating unit 15b is performed by comparing the values of surplus capacity, but is not limited to this. For example, the hardware capacity of each server is If they are equal, the ranking may be performed by comparing the load factor values of the hardware.

また、上記説明では、異常監視部13からのアラートが選出部18に入力される構成例を示したが、異常監視部13を用いずに、選出部18が、動作状態情報送信部11を直接監視し、かつ、送信要求信号Aが第1の所定周期内に受信されないことを検出したとき、優先順位情報Cの中で最も優先順位が高いサーバを選出するように構成してもよい。   In the above description, an example in which an alert from the abnormality monitoring unit 13 is input to the selection unit 18 has been described. However, the selection unit 18 directly connects the operation state information transmission unit 11 without using the abnormality monitoring unit 13. It may be configured that the server having the highest priority in the priority information C is selected when monitoring and detecting that the transmission request signal A is not received within the first predetermined period.

以上に説明したように、本発明の実施の形態1にかかる機器監視システム100は、各機器(各サーバn〜n24)が、自機器(サーバn11)の下の階層に配設された機器(サーバn22)に対して、機器(サーバn22)の動作状態を示す動作状態情報Bの送信を要求する送信要求信号Aを所定周期で送信すると共に、自機器(サーバn)の下の階層(n−1階層、n−2階層)に配設された機器からの動作状態情報Bを収集する情報収集部10と、自機器(サーバn22)の1つ上の階層に配設された機器(サーバn11)からの送信要求信号Aを受信する毎に、情報収集部10に動作状態情報Bを送信する動作状態情報送信部11と、自機器(サーバn22)の1つ上の階層に配設された機器(サーバn11)からの送信要求信号Aの受信周期と、動作状態情報Bに含まれるリソース情報とに基づいて、送信要求信号Aの送信元の機器(サーバn11)と同階層に配設された機器群(サーバ群G1)および送信要求信号Aの送信元の機器(サーバn11)の1つ下の階層に配設された機器群(サーバ群G2)の中から、余剰能力の値が大きい機器または負荷率が小さい機器を選出すると共に、選出された機器に送信要求信号Aの送信を行わせる要求情報(第1の監視要求情報D1、第2の監視要求情報D2)を送信する要求情報送信部(監視要求情報送信部14)と、を備えるようにしたので、高速に電流零を検出でき、復帰時間を高速化することができる。上記特許文献1に示される従来技術は、例えば図1に示されるサーバn11に異常等が生じた場合、サーバnがサーバn12を指定するように構成されているため、この指定動作によりサーバnの処理負荷が増加することとなる。さらに、この従来技術では、サーバn11に異常等が生じた場合に指定されるサーバ(例えば図1に示されるn12)が、固定であるため、サーバn12にも異常等が生じている場合、サーバn21、サーバn22の監視を行うことができず、システムの可用性の低下を招くという問題があった。さらに、従来技術の中には、異常等が発生したサーバの機能を代行するための待機サーバを備えるものも存在するが、このように構成した場合、システムのコスト増加を招くという問題があった。実施の形態1にかかる機器監視システム100は、異常等を生じている第1のサーバ(例えば図1に示されるサーバn11)の1つ下の階層に配設されたサーバ(例えばサーバn22)が、サーバn11の異常等を検知すると共に、第2のサーバ(例えばサーバn12)に第1の監視要求情報D1を送信し、または第3のサーバ(例えばサーバn23)に第2の監視要求情報D2を送信するように構成されている。そのため、第1のサーバを監視しているサーバ(例えばサーバn)の処理負荷が増加することがない。また、異常等が生じた場合に指定されるサーバの設定が不要なため、監視を継続することができる。また、待機サーバも不要である。従って、本発明の実施の形態1にかかる機器監視システム100は、システムの可用性の低下やシステムのコスト増加を招くことなく、各サーバの監視機能の階層構造に影響を与えずにサーバの監視を継続することが可能である。   As described above, the device monitoring system 100 according to the first exemplary embodiment of the present invention is configured such that each device (each server n to n24) is arranged in a hierarchy below its own device (server n11) ( A transmission request signal A for requesting transmission of operation state information B indicating the operation state of the device (server n22) is transmitted to the server n22) at a predetermined period, and the hierarchy (n The information collection unit 10 that collects the operation state information B from the devices arranged in the −1 hierarchy and the n−2 hierarchy, and the device (server) arranged in the hierarchy one level higher than the own device (server n22) n11), each time the transmission request signal A is received, the operating state information transmitting unit 11 that transmits the operating state information B to the information collecting unit 10 and the one level higher than the own device (server n22). Request signal A from the device (server n11) Based on the reception cycle and the resource information included in the operation state information B, the device group (server group G1) and the transmission request signal arranged in the same hierarchy as the device (server n11) that is the transmission source of the transmission request signal A A device with a large surplus capacity value or a device with a small load factor is selected from the device group (server group G2) arranged in the hierarchy immediately below the device (server n11) that is the transmission source of A, A request information transmitting unit (monitoring request information transmitting unit 14) for transmitting request information (first monitoring request information D1, second monitoring request information D2) for causing the selected device to transmit the transmission request signal A; Thus, zero current can be detected at high speed, and the recovery time can be increased. The prior art disclosed in Patent Document 1 is configured such that, for example, when an abnormality or the like occurs in the server n11 illustrated in FIG. 1, the server n designates the server n12. The processing load will increase. Further, in this prior art, since the server (for example, n12 shown in FIG. 1) designated when an abnormality or the like occurs in the server n11 is fixed, the server n12 has an abnormality or the like. There is a problem that monitoring of n21 and server n22 cannot be performed, leading to a reduction in system availability. Furthermore, some of the conventional technologies include a standby server for acting as a function of a server in which an abnormality or the like occurs. However, when configured in this manner, there is a problem in that the cost of the system is increased. . In the device monitoring system 100 according to the first embodiment, a server (for example, the server n22) disposed in a hierarchy one level lower than the first server (for example, the server n11 illustrated in FIG. 1) in which an abnormality or the like has occurred. In addition to detecting an abnormality in the server n11, the first monitoring request information D1 is transmitted to the second server (for example, the server n12), or the second monitoring request information D2 is transmitted to the third server (for example, the server n23). Is configured to send. Therefore, the processing load of the server (for example, server n) monitoring the first server does not increase. In addition, since it is not necessary to set the server specified when an abnormality or the like occurs, monitoring can be continued. Also, no standby server is required. Therefore, the device monitoring system 100 according to the first embodiment of the present invention monitors the server without affecting the hierarchical structure of the monitoring function of each server without causing a decrease in system availability or an increase in system cost. It is possible to continue.

また、実施の形態1にかかる監視要求情報送信部14は、自機器(サーバn22)の1つ上の階層に配設された機器(サーバn11)からの送信要求信号Aの受信周期と、自機器の1つ下の階層に配設された機器からの第1の動作状態情報B1に含まれるリソース情報と、自機器の2つ下の階層に配設された機器からの第2の動作状態情報B2に含まれるリソース情報とに基づいて、送信要求信号Aの送信元の機器(サーバn11)と同階層に配設された機器群(サーバ群G1)および送信要求信号Aの送信元の機器(サーバn11)の1つ下の階層に配設された機器群(サーバ群G2)の中から、余剰能力の値が大きい機器または負荷率が小さい機器を選出すると共に、選出された機器に送信要求信号Aの送信を行わせる要求情報(第1の監視要求情報D1、第2の監視要求情報D2)を送信する要求情報送信部(監視要求情報送信部14)と、を備えるようにしたので、自サーバの1つ下の階層に配設されたサーバの余剰能力と、自サーバの2つ下の階層に配設されたサーバの余剰能力とを考慮して、各サーバn11〜n24の順位付けを行うことができる。   In addition, the monitoring request information transmission unit 14 according to the first embodiment includes the reception cycle of the transmission request signal A from the device (server n11) arranged in the hierarchy one level higher than the own device (server n22), Resource information included in the first operation state information B1 from the device arranged in the layer one level lower than the device, and the second operation state from the device arranged in the layer two levels lower than the own device Based on the resource information included in the information B2, a device group (server group G1) arranged in the same hierarchy as the transmission source device (server n11) of the transmission request signal A and a transmission source device of the transmission request signal A A device with a large surplus value or a device with a small load factor is selected from the device group (server group G2) arranged in the hierarchy immediately below (server n11) and transmitted to the selected device. Request information for transmitting the request signal A (first And a request information transmitting unit (monitoring request information transmitting unit 14) for transmitting the viewing request information D1 and the second monitoring request information D2). The servers n11 to n24 can be ranked in consideration of the surplus capacity of the server and the surplus capacity of the servers arranged in the hierarchy two levels below the own server.

実施の形態2.
実施の形態1にかかる機器監視システム100は、各サーバが送信要求信号Aを所定周期毎(例えば60秒に1回など)に受信しているかを監視して、送信要求信号Aを所定周期で受信していない場合、アラートを出力するように構成されているが、実施の形態2にかかる機器監視システム100は、送信要求信号Aの受信周期にかかわらず、任意のタイミングで所定のサーバに異常等が発生しているかを検知するように構成されている。以下、実施の形態1と同一部分には同一符号を付してその説明を省略し、ここでは異なる部分についてのみ述べる。
Embodiment 2. FIG.
The device monitoring system 100 according to the first embodiment monitors whether each server receives the transmission request signal A every predetermined cycle (for example, once every 60 seconds), and sends the transmission request signal A at a predetermined cycle. Although not configured to output an alert when not received, the device monitoring system 100 according to the second embodiment is abnormal in a predetermined server at an arbitrary timing regardless of the reception cycle of the transmission request signal A. Or the like is detected. Hereinafter, the same parts as those of the first embodiment are denoted by the same reference numerals, and the description thereof is omitted. Only different parts will be described here.

図8は、本発明の実施の形態2にかかる各サーバ内の機能ブロックを示す図である。図8に示されるサーバn〜n24は、情報収集部10、動作状態情報送信部11、情報記憶部12、および監視要求情報送信部14aを有して構成されている。実施の形態1のサーバn〜n24と異なる点は、監視要求情報送信部14aに監視確認情報送信部16が含まれる点である。この監視確認情報送信部16は、送信要求信号Aを受信するサーバ(例えばサーバn22が、送信要求信号Aの送信元のサーバ(例えばサーバn11)によって監視されていることを確認する監視確認情報Eを送信すると共に、監視確認情報Eを送信してから第2の所定周期が経過するまでに、サーバn11から応答信号F(サーバn11がサーバn22を監視していることを示す信号)が到達しない場合、選出部18へアラートを出力するように構成されている。なお、第2の所定周期に関して補足すると、例えば、図1に示されるサーバn11の負荷率が上昇して処理速度が著しく低下した場合、このサーバn11に監視されていたサーバn22には、所定周期が経過しても送信要求信号Aが伝送されないこととなる。従って、第2の所定周期は、送信要求信号Aの送信遅延時間の最大値(例えば5秒)となる。   FIG. 8 is a diagram showing functional blocks in each server according to the second embodiment of the present invention. The servers n to n24 shown in FIG. 8 are configured to include an information collection unit 10, an operation state information transmission unit 11, an information storage unit 12, and a monitoring request information transmission unit 14a. The difference from the servers n to n24 of the first embodiment is that the monitoring request information transmitting unit 14a includes a monitoring confirmation information transmitting unit 16. The monitoring confirmation information transmitting unit 16 monitors monitoring information E for confirming that the server that receives the transmission request signal A (for example, the server n22 is monitored by the server that has transmitted the transmission request signal A (for example, the server n11)). And a response signal F (a signal indicating that the server n11 is monitoring the server n22) does not arrive from the server n11 until the second predetermined period elapses after the monitoring confirmation information E is transmitted. In this case, an alert is output to the selection unit 18. Note that when supplementing the second predetermined cycle, for example, the load factor of the server n11 shown in FIG. In this case, the transmission request signal A is not transmitted to the server n22 monitored by the server n11 even after a predetermined period has elapsed. Period, the maximum value of the transmission delay time of the transmission request signal A (e.g., 5 seconds).

以下動作を説明する。サーバn22内の監視確認情報送信部16は、サーバn11内の情報収集部10へ監視確認情報Eを送信する。この監視確認情報Eを受信したサーバn11内の情報収集部10は、サーバn22を監視している場合(送信要求信号Aを所定周期毎に出力可能な状態にある場合)、応答信号Fを出力する。サーバn11内の情報収集部10から出力された応答信号Fは、サーバn22内の監視確認情報送信部16に取り込まれる。   The operation will be described below. The monitoring confirmation information transmitting unit 16 in the server n22 transmits the monitoring confirmation information E to the information collecting unit 10 in the server n11. The information collection unit 10 in the server n11 that has received the monitoring confirmation information E outputs a response signal F when monitoring the server n22 (when the transmission request signal A is ready to be output at predetermined intervals). To do. The response signal F output from the information collection unit 10 in the server n11 is taken into the monitoring confirmation information transmission unit 16 in the server n22.

サーバn22内の監視確認情報送信部16は、監視確認情報Eを送信したにもかかわらず、この監視確認情報Eを送信してから第2の所定周期が経過するまでに、サーバn11からの応答信号Fが到達しない場合、サーバn11に異常等が生じたと判断してアラートを出力する。サーバn22内の監視確認情報送信部16から出力されたアラートは、選出部18に取り込まれる。なお、異常監視部13、選出部18、優先順位情報受信部15a、優先順位情報作成部15b、および優先順位情報送信部15cの動作は、実施の形態1と同様であるため、以下説明を省略する。   The monitoring confirmation information transmitting unit 16 in the server n22 transmits a response from the server n11 until the second predetermined period elapses after the monitoring confirmation information E is transmitted even though the monitoring confirmation information E is transmitted. If the signal F does not arrive, it is determined that an abnormality or the like has occurred in the server n11 and an alert is output. The alert output from the monitoring confirmation information transmission unit 16 in the server n22 is taken into the selection unit 18. The operations of the abnormality monitoring unit 13, the selection unit 18, the priority order information receiving unit 15a, the priority order information creating unit 15b, and the priority order information transmitting unit 15c are the same as those in the first embodiment, and thus the description thereof will be omitted. To do.

実施の形態1にかかる機器監視システム100は、送信要求信号Aが最後に受信されてから第1の所定時間(例えば64〜66秒)が経過するまでに、次の送信要求信号Aが受信されない場合、アラートを出力するように構成されている。ただし、送信要求信号Aが最後に受信されてから、例えば20秒経過した時点でサーバn11に異常等が発生している可能性もある。実施の形態2にかかる機器監視システム100は、任意のタイミングでサーバn11に異常等が発生しているか否かを検知することができるように構成されている。例えば送信要求信号Aが最後に受信されてから20秒経過した時点でサーバn11に異常等が発生したと仮定する。さらに、送信要求信号Aが最後に受信されてから30秒経過したときに監視確認情報Eが送信されたと仮定する。この場合、監視確認情報Eが送信されてから第2の所定時間(例えば5秒)が経過するまでにサーバn11からの応答信号Fが到達しない場合、監視確認情報送信部16からのアラートが出力される。すなわち、送信要求信号Aが最後に受信されてから約35秒後に、監視確認情報送信部16からアラートが出力される。   The device monitoring system 100 according to the first embodiment does not receive the next transmission request signal A until the first predetermined time (for example, 64 to 66 seconds) has elapsed since the transmission request signal A was last received. If configured to output alerts. However, there is a possibility that an abnormality or the like has occurred in the server n11 when, for example, 20 seconds have elapsed since the transmission request signal A was last received. The device monitoring system 100 according to the second embodiment is configured to be able to detect whether an abnormality or the like has occurred in the server n11 at an arbitrary timing. For example, it is assumed that an abnormality or the like has occurred in the server n11 when 20 seconds have elapsed since the transmission request signal A was last received. Further, it is assumed that the monitoring confirmation information E is transmitted when 30 seconds have elapsed since the transmission request signal A was last received. In this case, if the response signal F from the server n11 does not reach the second predetermined time (for example, 5 seconds) after the monitoring confirmation information E is transmitted, an alert from the monitoring confirmation information transmission unit 16 is output. Is done. That is, about 35 seconds after the transmission request signal A is last received, an alert is output from the monitoring confirmation information transmission unit 16.

以上に説明したように、実施の形態2にかかる機器監視システム100は、要求情報送信部(監視要求情報送信部14a)が、送信要求信号Aを受信する機器(サーバn22)が送信要求信号Aの送信元の機器(サーバn11)によって監視されていることを確認する監視確認情報Eを送信する監視確認情報送信部16を備え、情報収集部10が、自機器(サーバn11)の1つ下の階層に配設された機器(サーバn22)から送信された監視確認情報Eを受信したとき、自機器(サーバn11)の1つ下の階層に配設された機器(サーバn22)を監視していることを示す応答信号Fの出力を行い、監視要求情報送信部14aが、監視確認情報Eを送信してから第2の所定時間が経過するまでに、自機器(サーバn22)の1つ上の階層に配設された機器(サーバn11)からの応答信号Fが到達しない場合、送信要求信号Aの送信を行うようにしたので、実施の形態1にかかる機器監視システム100よりも早く第1の監視要求情報D1または第2の監視要求情報D2を出力することも可能である。従って、例えばサーバn11が故障などで停止した場合でも、サーバn11が停止してから僅かの時間で、サーバn11に監視されていたサーバ(例えばサーバn22)の監視を再開することが可能となる。その結果、機器監視システム100の予期せぬ停止を予防することができると共に、システムの可用性をより一層高めることが可能である。   As described above, in the device monitoring system 100 according to the second embodiment, the request information transmitting unit (monitoring request information transmitting unit 14a) is configured such that the device (server n22) that receives the transmission request signal A is the transmission request signal A. A monitoring confirmation information transmitting unit 16 that transmits monitoring confirmation information E for confirming that the device is monitored by the transmission source device (server n11), and the information collecting unit 10 is one level lower than the own device (server n11). When the monitoring confirmation information E transmitted from the device (server n22) arranged in the previous hierarchy is received, the device (server n22) arranged in the hierarchy one level lower than the own device (server n11) is monitored. One of the own devices (server n22) until the second predetermined time elapses after the monitoring request information transmission unit 14a transmits the monitoring confirmation information E. Up Since the transmission request signal A is transmitted when the response signal F from the installed device (server n11) does not arrive, the first monitoring request information is earlier than the device monitoring system 100 according to the first embodiment. It is also possible to output D1 or second monitoring request information D2. Therefore, for example, even when the server n11 is stopped due to a failure or the like, monitoring of the server (for example, the server n22) monitored by the server n11 can be resumed in a short time after the server n11 stops. As a result, it is possible to prevent an unexpected stop of the device monitoring system 100 and further increase the availability of the system.

実施の形態3.
実施の形態1にかかる機器監視システム100は、各サーバが送信要求信号Aを所定周期毎(例えば60秒に1回など)に受信しているかを監視して、送信要求信号Aを所定周期で受信していない場合、アラートを出力するように構成されているが、実施の形態3にかかる機器監視システム100は、所定階層には配設されたサーバ(以下「非監視サーバ」)の余剰能力が所定値以下となったとき、非監視サーバを監視しているサーバ(以下「監視サーバ」)が、非監視サーバに対して送信要求信号Aの出力を停止させるように構成されている。以下、実施の形態1と同一部分には同一符号を付してその説明を省略し、ここでは異なる部分についてのみ述べる。
Embodiment 3 FIG.
The device monitoring system 100 according to the first embodiment monitors whether each server receives the transmission request signal A every predetermined cycle (for example, once every 60 seconds), and sends the transmission request signal A at a predetermined cycle. When not received, the device monitoring system 100 according to the third embodiment is configured to output an alert. However, the device monitoring system 100 according to the third embodiment has a surplus capability of a server (hereinafter, “non-monitoring server”) arranged in a predetermined hierarchy. Is configured to stop the output of the transmission request signal A to the non-monitoring server when the non-monitoring server is monitored (hereinafter referred to as “monitoring server”). Hereinafter, the same parts as those of the first embodiment are denoted by the same reference numerals, and the description thereof is omitted. Only different parts will be described here.

図9は、本発明の実施の形態3にかかる各サーバ内の機能ブロックを示す図である。図9に示されるサーバn〜n24は、情報収集部10、動作状態情報送信部11、情報記憶部12、監視要求情報送信部14、および停止指示部17を有して構成されている。実施の形態1のサーバn〜n24と異なる点は、停止指示部17を備える点である。停止指示部17は、動作状態情報記憶部12aに記録された動作状態情報の中から非監視サーバの余剰能力を読み出し、その余剰能力が所定値以下となったとき、送信要求信号Aの送信の停止を指示する停止指示信号Gを、非監視サーバに対して出力する。   FIG. 9 is a diagram showing functional blocks in each server according to the third embodiment of the present invention. The servers n to n24 shown in FIG. 9 include an information collecting unit 10, an operation state information transmitting unit 11, an information storage unit 12, a monitoring request information transmitting unit 14, and a stop instruction unit 17. The difference from the servers n to n24 of the first embodiment is that a stop instruction unit 17 is provided. The stop instruction unit 17 reads the surplus capability of the non-monitoring server from the operation state information recorded in the operation state information storage unit 12a, and when the surplus capability becomes equal to or less than a predetermined value, the stop instruction unit 17 transmits the transmission request signal A. A stop instruction signal G for instructing stop is output to the non-monitoring server.

以下動作を説明する。例えばサーバn内の停止指示部17は、動作状態情報記憶部12aに記録された動作状態情報の中から、非監視サーバ(例えばサーバn11)の余剰能力を読み出し、その余剰能力が所定値(例えば30MIPS)以下となったとき、サーバn11に対して停止指示信号Gを出力する。サーバn11内の情報収集部10は、この停止指示信号Gを受信したとき、次に送信する予定の送信要求信号Aの出力を停止する。なお、動作状態情報送信部11、情報記憶部12、および監視要求情報送信部14の動作は、実施の形態1にかかる機器監視システム100と同様であるため、以下説明を省略する。   The operation will be described below. For example, the stop instruction unit 17 in the server n reads the surplus capacity of the non-monitoring server (for example, the server n11) from the operation state information recorded in the operation state information storage unit 12a, and the surplus capacity is determined to be a predetermined value (for example, 30 MIPS), the stop instruction signal G is output to the server n11. When receiving the stop instruction signal G, the information collecting unit 10 in the server n11 stops the output of the transmission request signal A scheduled to be transmitted next. In addition, since operation | movement of the operation state information transmission part 11, the information storage part 12, and the monitoring request information transmission part 14 is the same as that of the equipment monitoring system 100 concerning Embodiment 1, description is abbreviate | omitted below.

実施の形態1にかかる機器監視システム100を対比して説明すると以下の通りである。実施の形態1にかかる機器監視システム100は、動作状態情報送信部11において送信要求信号Aが最後に受信されてから第1の所定時間が経過するまでに、次の送信要求信号Aが受信されない場合、アラートを出力するように構成されている。ただし、実施の形態1にかかる機器監視システム100では、例えばサーバn11の余剰能力が、上述した所定値よりも低い値(例えば20MIPS)にまで低下した場合でも、サーバn22の監視を継続している(送信要求信号Aの出力が所定周期毎に出力される)。従って、サーバn11の負荷率が高い値のままとなる。実施の形態3にかかる機器監視システム100は、サーバn22を監視しているサーバn11の余剰能力が30MIPS以下となったとき、サーバn11の監視対象であったサーバn22を他のサーバに監視させるように構成されている。具体的に説明すると、サーバnからの停止指示信号Gを受信したサーバn11が送信要求信号Aの送信を停止するため、サーバn11に監視されていたサーバn22は、所定周期毎に送信要求信号Aが送信されていないことを検知し、第1の監視要求情報D1または第2の監視要求情報D2を出力する。そのため、サーバn22は、図6で説明したように、第1の監視要求情報D1を受信したサーバn12によって監視され、または図7(b)で説明したように、第2の監視要求情報D2を受信したサーバn23aによって監視される。換言すると、サーバn22は、余剰能力に余裕があるサーバに監視されることとなる。その結果、サーバn11が監視するサーバ台数が減り、監視に伴うサーバn11の処理負荷が軽減される。さらに、余剰能力に余裕があるサーバを有効利用することができ、機器監視システム100内の各サーバの負荷が平準化される。   The device monitoring system 100 according to the first embodiment will be described in comparison with the following. In the device monitoring system 100 according to the first embodiment, the next transmission request signal A is not received before the first predetermined time has elapsed since the transmission request signal A was last received by the operation state information transmission unit 11. If configured to output alerts. However, in the device monitoring system 100 according to the first embodiment, for example, even when the surplus capacity of the server n11 is reduced to a value (for example, 20 MIPS) lower than the predetermined value described above, the monitoring of the server n22 is continued. (The output of the transmission request signal A is output every predetermined period). Therefore, the load factor of the server n11 remains a high value. When the surplus capacity of the server n11 monitoring the server n22 becomes 30 MIPS or less, the device monitoring system 100 according to the third embodiment causes the other server to monitor the server n22 that is the monitoring target of the server n11. It is configured. More specifically, since the server n11 that has received the stop instruction signal G from the server n stops the transmission of the transmission request signal A, the server n22 monitored by the server n11 receives the transmission request signal A every predetermined cycle. Is not transmitted, and the first monitoring request information D1 or the second monitoring request information D2 is output. Therefore, the server n22 is monitored by the server n12 that has received the first monitoring request information D1 as described in FIG. 6, or the second monitoring request information D2 as described in FIG. 7B. Monitored by the received server n23a. In other words, the server n22 is monitored by a server having a surplus capacity. As a result, the number of servers monitored by the server n11 decreases, and the processing load on the server n11 associated with the monitoring is reduced. Furthermore, a server with surplus capacity can be used effectively, and the load on each server in the device monitoring system 100 is leveled.

なお、実施の形態3にかかる停止指示部17は、実施の形態2にかかる機器監視システム100に組み込むことも可能である。このように構成した場合、実施の形態1にかかる機器監視システム100よりも早く第1の監視要求情報D1または第2の監視要求情報D2を出力することができると共に、各サーバの負荷を平準化することも可能である。   Note that the stop instruction unit 17 according to the third embodiment can be incorporated in the device monitoring system 100 according to the second embodiment. When configured in this way, the first monitoring request information D1 or the second monitoring request information D2 can be output earlier than the device monitoring system 100 according to the first embodiment, and the load on each server is leveled. It is also possible to do.

以上に説明したように、実施の形態3にかかる機器監視システム100は、各機器(各サーバn〜n24)が、自機器(サーバn)の1つ下の階層に配設された機器(サーバn11)の余剰能力が所定値以下となったとき、この機器(サーバn11)に対して、送信要求信号Aの送信停止を指示する停止指示信号Gを出力する停止指示部17を備え、情報収集部10が、自機器(サーバn11)の1つ上の階層に配設された機器(サーバn)から停止指示信号Gを受信した場合、次に送信される予定の送信要求信号Aを停止するようにしたので、例えばサーバn11が完全に停止する前に、サーバn11の監視をサーバn23などに行わせることが可能である。その結果、各サーバの負荷の平準化を図ることができると共に、システムの可用性をより一層高めることが可能である。   As described above, in the device monitoring system 100 according to the third embodiment, each device (each server n to n24) is a device (server) arranged in a hierarchy one level lower than its own device (server n). When the surplus capacity of n11) is equal to or less than a predetermined value, the device (server n11) is provided with a stop instruction unit 17 that outputs a stop instruction signal G instructing to stop transmission of the transmission request signal A, and collects information When the unit 10 receives a stop instruction signal G from a device (server n) arranged in a layer one level higher than the own device (server n11), the unit 10 stops the transmission request signal A scheduled to be transmitted next. Since it did in this way, before the server n11 stops completely, for example, it is possible to make the server n11 monitor the server n11. As a result, the load on each server can be leveled and the system availability can be further increased.

なお、実施の形態3にかかる機器監視システム100は、以下のように構成してもよい。例えば、図9に示される情報収集部10は、自機器(サーバn11)の1つ上の階層に配設された機器(サーバn)から停止指示信号Gを受信した場合、自機器(サーバn11)の1つ下の階層に配設された機器(サーバn22)に対して、要求情報(第1の監視要求情報D1、第2の監視要求情報D2)を強制的に送信させる信号を出力し、要求情報送信部(監視要求情報送信部14)は、自機器(サーバn22)の1つ上の階層に配設された機器(サーバn11)から要求情報を強制的に送信させる信号を受信したとき、要求情報(第1の監視要求情報D1、第2の監視要求情報D2)を送信するように構成してもよい。このように構成した場合の効果を説明すると、サーバnからの停止指示信号Gを受信したサーバn11は、次に送信される予定の送信要求信号Aを停止するが、この送信要求信号Aは、送信要求信号Aが前回送信されてから約60秒後に送信されるものである。従って、サーバn11が停止指示信号Gを受信したタイミングが、送信要求信号Aが前回送信された直後である場合、サーバn11に監視されていたサーバn22において、次に送信される予定の送信要求信号Aが停止したことを検知するまでに、数十秒程度のタイムラグが生じる場合もある。そこで、サーバn11がサーバnからの停止指示信号Gを受信した際、サーバn22に対して要求情報(第1の監視要求情報D1、第2の監視要求情報D2)を強制的に送信させる信号を出力し、かつ、この信号を受信したサーバn22が要求情報を送信するように構成すれば、上述したタイムラグを抑制することが可能である。その結果、監視に伴うサーバn11の処理負荷をより早く軽減することが可能となる。   The device monitoring system 100 according to the third embodiment may be configured as follows. For example, when the information collection unit 10 illustrated in FIG. 9 receives a stop instruction signal G from a device (server n) arranged in a hierarchy one level higher than the own device (server n11), the information collecting unit 10 ) Outputs a signal for forcibly transmitting request information (first monitoring request information D1, second monitoring request information D2) to a device (server n22) arranged in the hierarchy one level below. The request information transmission unit (monitoring request information transmission unit 14) has received a signal for forcibly transmitting the request information from a device (server n11) arranged in a hierarchy one level higher than the own device (server n22). The request information (the first monitoring request information D1 and the second monitoring request information D2) may be transmitted. The effect of such a configuration will be described. The server n11 that has received the stop instruction signal G from the server n stops the transmission request signal A that is scheduled to be transmitted next. The transmission request signal A is transmitted about 60 seconds after the previous transmission. Therefore, when the timing at which the server n11 receives the stop instruction signal G is immediately after the transmission request signal A is transmitted last time, the server n22 that has been monitored by the server n11 will transmit the next transmission request signal. There may be a time lag of about several tens of seconds before detecting that A has stopped. Therefore, when the server n11 receives the stop instruction signal G from the server n, a signal for forcibly transmitting request information (first monitoring request information D1 and second monitoring request information D2) to the server n22. If the server n22 that outputs and receives this signal is configured to transmit the request information, the time lag described above can be suppressed. As a result, it is possible to reduce the processing load on the server n11 associated with monitoring more quickly.

なお、実施の形態1〜3にかかる機器監視システム100は、本発明の内容の一例を示すものであり、更なる別の公知の技術と組み合わせることも可能であるし、本発明の要旨を逸脱しない範囲で、一部を省略する等、変更して構成することも可能であることは無論である。   Note that the device monitoring system 100 according to the first to third embodiments shows an example of the content of the present invention, and can be combined with another known technique, and departs from the gist of the present invention. Of course, it is possible to change and configure such as omitting a part within the range.

以上のように、本発明は、空気調和機に適用可能であり、特に、号機設定が一致する空気調和機と号機設定が一致しない空気調和機とが共存する場合において、号機設定違いの報知の煩わしさからユーザを解放することが可能な発明として有用である。   As described above, the present invention can be applied to an air conditioner, and in particular, in the case where an air conditioner with a matching unit setting coincides with an air conditioner with a unit number setting that does not match, a notification of a difference in unit setting is made. This is useful as an invention that can release the user from annoyance.

n、n11、n12、n21、n22、n23、n23a、n24、n24a サーバ(機器)
10 情報収集部
11 動作状態情報送信部
12 情報記憶部
12a 動作状態情報記憶部
12b 優先順位情報記憶部
13 異常監視部
14、14a 監視要求情報送信部(要求情報送信部)
15a 優先順位情報受信部
15b 優先順位情報作成部
15c 優先順位情報送信部
16 監視確認情報送信部
17 停止指示部
18 選出部
19 監視要求情報生成部
30 ネットワーク
100 機器監視システム
A 送信要求信号
B 動作状態情報
B1 第1の動作状態情報
B2 第2の動作状態情報
C 優先順位情報
C1 第1の優先順位情報
C2 第2の優先順位情報
D1 第1の監視要求情報
D2 第2の監視要求情報
E 監視確認情報
F 応答信号
G 停止指示信号
G0、G1、G2 サーバ群
n, n11, n12, n21, n22, n23, n23a, n24, n24a Server (device)
DESCRIPTION OF SYMBOLS 10 Information collection part 11 Operation state information transmission part 12 Information storage part 12a Operation state information storage part 12b Priority information storage part 13 Abnormality monitoring part 14, 14a Monitoring request information transmission part (request information transmission part)
15a priority information receiving unit 15b priority information creating unit 15c priority information transmitting unit 16 monitoring confirmation information transmitting unit 17 stop instructing unit 18 selecting unit 19 monitoring request information generating unit
30 network 100 device monitoring system A transmission request signal B operation state information B1 first operation state information B2 second operation state information C priority information C1 first priority information C2 second priority information D1 first Monitoring request information D2 Second monitoring request information E Monitoring confirmation information F Response signal G Stop instruction signal G0, G1, G2 Server group

Claims (5)

動作状態を監視する機能を有する複数の機器がネットワーク上に階層的に配置されて成る機器監視システムであって、
前記各機器は、
自機器の下の階層に配設された機器に対して、機器の動作状態を示す動作状態情報の送信を要求する送信要求信号を、所定周期で送信すると共に、自機器の下の階層に配設された機器からの前記動作状態情報を収集する情報収集部と、
自機器の1つ上の階層に配設された機器からの前記送信要求信号を受信する毎に、前記情報収集部に前記動作状態情報を送信する動作状態情報送信部と、
自機器の1つ上の階層に配設された機器から送信される前記送信要求信号の受信周期と、前記動作状態情報に含まれるリソース情報とに基づいて、前記送信要求信号の送信元の機器と同階層に配設された機器群および前記送信要求信号の送信元の機器の1つ下の階層に配設された機器群の中から、余剰能力の値が大きい機器または負荷率が小さい機器を選出すると共に、選出された機器に前記送信要求信号の送信を行わせる要求情報を送信する要求情報送信部と、
を備えたことを特徴とする機器監視システム。
A device monitoring system in which a plurality of devices having a function of monitoring an operation state are arranged hierarchically on a network,
Each device is
A transmission request signal for requesting transmission of operation state information indicating the operation state of the device is transmitted to a device arranged in a lower layer of the own device at a predetermined cycle and distributed to the lower layer of the own device. An information collection unit for collecting the operation state information from the installed device;
An operation state information transmitting unit that transmits the operation state information to the information collecting unit each time the transmission request signal is received from a device arranged in a hierarchy one higher than the own device;
Based on the reception cycle of the transmission request signal transmitted from a device arranged in a hierarchy one level higher than the own device, and the resource information included in the operation state information, the transmission source device of the transmission request signal A device with a large surplus capacity value or a device with a small load factor, from among a device group arranged in the same hierarchy as the device group and a device group arranged in a hierarchy one level lower than the transmission source device of the transmission request signal A request information transmitting unit that transmits request information for causing the selected device to transmit the transmission request signal, and
A device monitoring system comprising:
動作状態を監視する機能を有する複数の機器がネットワーク上に階層的に配置されて成る機器監視システムであって、
前記各機器は、
自機器の下の階層に配設された機器に対して、機器の動作状態を示す動作状態情報の送信を要求する送信要求信号を、所定周期で送信すると共に、自機器の下の階層に配設された機器からの前記動作状態情報を収集する情報収集部と、
自機器の1つ上の階層に配設された機器からの前記送信要求信号を受信する毎に、前記情報収集部に前記動作状態情報を送信する動作状態情報送信部と、
自機器の1つ上の階層に配設された機器から送信される前記送信要求信号の受信周期と、自機器の1つ下の階層に配設された機器からの前記動作状態情報に含まれるリソース情報と、自機器の2つ下の階層に配設された機器からの前記動作状態情報に含まれるリソース情報とに基づいて、前記送信要求信号の送信元の機器と同階層に配設された機器群および前記送信要求信号の送信元の機器の1つ下の階層に配設された機器群の中から、余剰能力の値が大きい機器または負荷率が小さい機器を選出すると共に、選出された機器に前記送信要求信号の送信を行わせる要求情報を送信する要求情報送信部と、
を備えたことを特徴とする機器監視システム。
A device monitoring system in which a plurality of devices having a function of monitoring an operation state are arranged hierarchically on a network,
Each device is
A transmission request signal for requesting transmission of operation state information indicating the operation state of the device is transmitted to a device arranged in a lower layer of the own device at a predetermined cycle and distributed to the lower layer of the own device. An information collection unit for collecting the operation state information from the installed device;
An operation state information transmitting unit that transmits the operation state information to the information collecting unit each time the transmission request signal is received from a device arranged in a hierarchy one higher than the own device;
Included in the reception cycle of the transmission request signal transmitted from the device arranged in the hierarchy one level higher than the own device and the operation state information from the device arranged in the hierarchy one level lower than the own device Based on the resource information and the resource information included in the operation state information from the device arranged in the hierarchy two levels lower than the own device, it is arranged in the same layer as the transmission source device of the transmission request signal. A device having a large surplus capacity value or a device having a low load factor is selected from the device group arranged in the hierarchy one level lower than the device group and the transmission source signal transmission device. A request information transmitting unit for transmitting request information for causing the device to transmit the transmission request signal;
A device monitoring system comprising:
前記要求情報送信部は、
前記送信要求信号を受信する機器が、前記送信要求信号の送信元の機器によって監視されていることを確認する監視確認情報を送信する監視確認情報送信部を備え、
前記情報収集部は、
自機器の1つ下の階層に配設された機器から送信された前記監視確認情報を受信したとき、自機器の1つ下の階層に配設された機器を監視していることを示す応答信号の出力を行い、
前記監視要求情報送信部は、
前記監視確認情報を送信してから第2の所定時間が経過するまでに、自機器の1つ上の階層に配設された機器からの前記応答信号が到達しない場合、前記要求情報の送信を行うことを特徴とする請求項1または2に記載の機器監視システム。
The request information transmitter is
A device that receives the transmission request signal includes a monitoring confirmation information transmission unit that transmits monitoring confirmation information for confirming that the device that is the transmission source of the transmission request signal is monitored,
The information collecting unit
When the monitoring confirmation information transmitted from the device arranged in the layer one level lower than the own device is received, the response indicating that the device arranged in the layer one level lower than the own device is monitored Output the signal,
The monitoring request information transmitting unit
If the response signal from the device arranged in the hierarchy one level higher than the own device does not reach the second predetermined time after the monitoring confirmation information is transmitted, the request information is transmitted. The device monitoring system according to claim 1, wherein the device monitoring system is performed.
前記各機器は、
自機器の1つ下の階層に配設された機器の余剰能力が所定値以下となったとき、この機器に対して、前記送信要求信号の送信停止を指示する停止指示信号を出力する停止指示部を備え、
前記情報収集部は、
自機器の1つ上の階層に配設された機器から前記停止指示信号を受信した場合、次に送信される予定の前記送信要求信号を停止することを特徴とする請求項1〜3の何れか1つに記載の機器監視システム。
Each device is
Stop instruction to output a stop instruction signal for instructing to stop transmission of the transmission request signal to the apparatus when the surplus capacity of the apparatus arranged in the hierarchy one level lower than the own apparatus becomes a predetermined value or less Part
The information collecting unit
4. The transmission request signal scheduled to be transmitted next is stopped when the stop instruction signal is received from a device arranged at a level above the own device. The apparatus monitoring system as described in any one.
前記情報収集部は、
自機器の1つ上の階層に配設された機器から前記停止指示信号を受信した場合、自機器の1つ下の階層に配設された機器に対して、前記要求情報を強制的に送信させる信号を出力し、
前記要求情報送信部は、
自機器の1つ上の階層に配設された機器から前記要求情報を強制的に送信させる信号を受信したとき、前記要求情報を送信することを特徴とする請求項4に記載の機器監視システム。
The information collecting unit
When the stop instruction signal is received from a device arranged in a hierarchy one level higher than the own device, the request information is forcibly transmitted to a device arranged in a hierarchy one level lower than the own device. Output a signal to
The request information transmitter is
5. The device monitoring system according to claim 4, wherein the request information is transmitted when a signal for forcibly transmitting the request information is received from a device arranged in a hierarchy one level higher than the own device. .
JP2011119866A 2011-05-30 2011-05-30 Device monitoring system and monitoring device Expired - Fee Related JP5653295B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011119866A JP5653295B2 (en) 2011-05-30 2011-05-30 Device monitoring system and monitoring device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011119866A JP5653295B2 (en) 2011-05-30 2011-05-30 Device monitoring system and monitoring device

Publications (2)

Publication Number Publication Date
JP2012249115A true JP2012249115A (en) 2012-12-13
JP5653295B2 JP5653295B2 (en) 2015-01-14

Family

ID=47469134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011119866A Expired - Fee Related JP5653295B2 (en) 2011-05-30 2011-05-30 Device monitoring system and monitoring device

Country Status (1)

Country Link
JP (1) JP5653295B2 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002026950A (en) * 2000-07-07 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> Method and system for building up server tree structure, server, and recording medium
JP2002186056A (en) * 2000-12-19 2002-06-28 Nec Corp Measurement data collection system
JP2007201984A (en) * 2006-01-30 2007-08-09 Matsushita Electric Ind Co Ltd Network system
JP2010232781A (en) * 2009-03-26 2010-10-14 Brother Ind Ltd Content distribution system, node device, leaving process delay method, and leaving process delay control program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002026950A (en) * 2000-07-07 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> Method and system for building up server tree structure, server, and recording medium
JP2002186056A (en) * 2000-12-19 2002-06-28 Nec Corp Measurement data collection system
JP2007201984A (en) * 2006-01-30 2007-08-09 Matsushita Electric Ind Co Ltd Network system
JP2010232781A (en) * 2009-03-26 2010-10-14 Brother Ind Ltd Content distribution system, node device, leaving process delay method, and leaving process delay control program

Also Published As

Publication number Publication date
JP5653295B2 (en) 2015-01-14

Similar Documents

Publication Publication Date Title
US10552745B2 (en) Predictive auto scaling engine
EP2692088B1 (en) Providing a witness service
CN107959705B (en) Distribution method of streaming computing task and control server
US10175737B1 (en) Managing electrical resiliency in a datacenter
JP4725724B2 (en) Cluster failure estimation system
JP4695705B2 (en) Cluster system and node switching method
US20120084788A1 (en) Complex event distributing apparatus, complex event distributing method, and complex event distributing program
WO2016183967A1 (en) Failure alarm method and apparatus for key component, and big data management system
CN103313031A (en) Dynamic dispatching video recording system and method
JP6595861B2 (en) Information processing apparatus, log acquisition method, and log acquisition program
US20150192936A1 (en) Datacenter And Cooling Control Fault-Tolerance Using Compute Resources
JP2006195554A (en) Integrated supervision system
US9164825B2 (en) Computing unit, method of managing computing unit, and computing unit management program
JP2009086741A (en) Distributed processing control method in heterogeneous node existing distributed environment and its system and its program
JP5653295B2 (en) Device monitoring system and monitoring device
KR101447024B1 (en) Error restoration method of distributed multi-layer system for weapon based on service-scale
JP5526748B2 (en) Packet processing device, packet distribution device, control program, and packet distribution method
JP5594000B2 (en) Surveillance network, program, recording medium
JP4743904B2 (en) Resource over-distribution prevention system
KR100832543B1 (en) High availability cluster system having hierarchical multiple backup structure and method performing high availability using the same
JP2008226153A (en) Redundant computer system
JP5631285B2 (en) Fault monitoring system and fault monitoring method
JP5378847B2 (en) Monitoring device
JP2011253475A (en) Computing system
JP2013208043A (en) Power system monitoring device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140722

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140919

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141021

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141118

R150 Certificate of patent or registration of utility model

Ref document number: 5653295

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees