JP2012068729A - Information processor and management device and program - Google Patents

Information processor and management device and program Download PDF

Info

Publication number
JP2012068729A
JP2012068729A JP2010210929A JP2010210929A JP2012068729A JP 2012068729 A JP2012068729 A JP 2012068729A JP 2010210929 A JP2010210929 A JP 2010210929A JP 2010210929 A JP2010210929 A JP 2010210929A JP 2012068729 A JP2012068729 A JP 2012068729A
Authority
JP
Japan
Prior art keywords
notification
unit
event
transmission
event notification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010210929A
Other languages
Japanese (ja)
Inventor
Takashi Saito
隆 斎藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Information Technology Corp
Original Assignee
Mitsubishi Electric Information Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Information Technology Corp filed Critical Mitsubishi Electric Information Technology Corp
Priority to JP2010210929A priority Critical patent/JP2012068729A/en
Publication of JP2012068729A publication Critical patent/JP2012068729A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a system capable of promptly detecting a situation in which a packet does not reach a transmission destination, when the packet does not reach the transmission destination due to a failure in a communication pathway.SOLUTION: When a failure occurs, a server device 1 transmits a failure occurrence notification packet for making notification of the failure to a call center device 6 and counts transmission frequency of failure occurrence notification packets. The call center device 6 counts reception frequency of failure occurrence notification packets every time when receiving a failure occurrence notification packet. The server device 1 notifies the call center device 6 of the transmission frequency of failure occurrence notification packets in a predetermined period. The call center device 6 compares the reception frequency counted by itself with the transmission frequency received from the server device 1. When the reception frequency is smaller than the transmission frequency, it is determined that a failure occurrence notification packet does not reach the call center device 6 due to a failure in a communication pathway.

Description

本発明は、サーバ装置等において障害が発生した際に、コールセンタ等の通知先に障害の発生を通知する技術に関する。   The present invention relates to a technique for notifying occurrence of a failure to a notification destination such as a call center when a failure occurs in a server device or the like.

図18を参照して従来の障害通報方式を説明する。   A conventional failure notification method will be described with reference to FIG.

図18において、100は監視対象となるサーバ装置である。
2は、サーバ装置100の障害発生を監視する監視部である。
21は、障害を検出する障害検出部である。
22は、障害の発生を通報する障害発生通報パケットを生成する通報通知作成部である。
23は、障害発生通報パケットを送信する通報通知送信部である。
30〜3mは、サーバ装置100の構成要素群である。
40〜4mは、障害検出用信号群である。
5は、通信回線である。
50は、サーバ側ルータである。
600は、障害発生通報パケットを受けるコールセンタ装置である。
60は、センタ側ルータである。
61は、コールセンタ装置600の全体の制御を行う制御部である。
62は、障害発生通報パケットを受信する通報通知受信部である。
63は、障害発生通報パケットを解析して後述する通知メッセージ66を生成する通知作成部である。
64は、通知メッセージ66を蓄積する通知蓄積部である。
65は、通知メッセージ66を出力する通知出力部である。
66は、サーバ装置100における障害内容を通知する通知メッセージであり、例えば、電子メールである。
7は、サーバ装置100の保守を行う保守センタである。
71は、保守員である。
9は、通信回線である。
In FIG. 18, reference numeral 100 denotes a server device to be monitored.
Reference numeral 2 denotes a monitoring unit that monitors the occurrence of a failure in the server apparatus 100.
A failure detection unit 21 detects a failure.
Reference numeral 22 denotes a notification notification creation unit that generates a failure occurrence notification packet for reporting the occurrence of a failure.
Reference numeral 23 denotes a notification notification transmission unit that transmits a failure occurrence notification packet.
30 to 3 m are component groups of the server device 100.
Reference numerals 40 to 4m are failure detection signal groups.
Reference numeral 5 denotes a communication line.
Reference numeral 50 denotes a server side router.
Reference numeral 600 denotes a call center device that receives a failure occurrence notification packet.
Reference numeral 60 denotes a center side router.
A control unit 61 performs overall control of the call center device 600.
Reference numeral 62 denotes a notification notification receiving unit that receives a failure occurrence notification packet.
63 is a notification creation unit that analyzes the failure occurrence notification packet and generates a notification message 66 described later.
A notification storage unit 64 stores the notification message 66.
A notification output unit 65 outputs a notification message 66.
Reference numeral 66 denotes a notification message for notifying the details of the failure in the server apparatus 100, for example, an e-mail.
Reference numeral 7 denotes a maintenance center that performs maintenance of the server apparatus 100.
71 is a maintenance worker.
9 is a communication line.

次に動作について説明する。
ここでは、サーバ装置100の構成要素30で障害が発生した場合を例に説明する。
構成要素30で障害が発生すると、サーバ装置100では、障害検出用信号40が有意になり、それを障害検出部21で検出したサーバ監視部2は障害発生通報パケットを通報通知作成部22で生成し、通報通知送信部23経由でコールセンタ装置600に向けて送信する。
障害発生通報パケットはサーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置600に届く。
コールセンタ装置600では、通報通知受信部62で障害発生通報パケットを受信し、解析し、障害が発生したサーバ装置100の設置場所に近い保守センタ7に障害内容を通知する通知メッセージ66を通知生成部63で生成する。
通知メッセージ66は、人がわかる形式のメッセージであり、例えば、電子メールである。
コールセンタ装置600では、通知メッセージ66を通知蓄積部64に蓄積した後、通知出力部65が保守センタに送信する。
通知メッセージを受けた保守センタ7では、通知の内容からサーバ装置100の構成要素の交換部品を携えた保守員71がサーバ設置場所に行き、サーバ装置100の故障部品を交換する。
こうして、サーバ装置100は正常状態に復帰することができる。
Next, the operation will be described.
Here, a case where a failure occurs in the component 30 of the server apparatus 100 will be described as an example.
When a failure occurs in the component 30, the failure detection signal 40 becomes significant in the server device 100, and the server monitoring unit 2 that detects the failure detection signal 21 generates a failure occurrence notification packet in the notification notification creation unit 22. Then, the information is transmitted to the call center device 600 via the notification notification transmission unit 23.
The failure occurrence notification packet reaches the call center device 600 via the server side router 50, the communication line 5, and the center side router 60.
In the call center device 600, the notification notification receiving unit 62 receives and analyzes the failure occurrence notification packet, and generates a notification message 66 for notifying the content of the failure to the maintenance center 7 near the installation location of the server device 100 where the failure has occurred. 63.
The notification message 66 is a message that can be understood by a person, and is, for example, an e-mail.
In the call center device 600, after the notification message 66 is stored in the notification storage unit 64, the notification output unit 65 transmits it to the maintenance center.
In the maintenance center 7 that has received the notification message, the maintenance staff 71 who carries the replacement parts of the components of the server apparatus 100 goes to the server installation location from the contents of the notification and replaces the failed parts of the server apparatus 100.
In this way, the server apparatus 100 can return to a normal state.

また、例えば、特許文献1では、障害通報(A)を受け付けたとき、通報履歴DBを調べ、所定時間内の過去に同一顧客から障害通報(B)があれば、障害通報(A、B)の組み合わせが、関連通報DBに存在するかを調べ、関連通報DBに、この組み合わせが登録されていれば、障害通報(A)を障害通報(B)の関連通報とし、通知を省略もしくは参考情報として通知する方式が開示されている。   Further, for example, in Patent Document 1, when a failure notification (A) is received, the notification history DB is checked, and if there is a failure notification (B) from the same customer in the past within a predetermined time, the failure notification (A, B) If the combination is registered in the related notification DB, and this combination is registered in the related notification DB, the failure notification (A) is set as the related notification for the failure notification (B) and the notification is omitted or reference information. As a notification method.

特開2007−80035号公報JP 2007-80035 A

図18を参照して説明した従来の障害通報方式、更には、特許文献1の方式においても、例えばサーバ側ルータ50が故障している場合には、サーバ装置100の構成要素30で障害が発生した時に、サーバ装置100が障害発生通報パケットを生成し、送信しても、サーバ側ルータ50が故障しているために、障害発生通報パケットがコールセンタ装置600に届かず、保守センタ7への障害発生通知は行われない。
従って、例えば、サーバ装置100の管理者がサーバ障害に気づき、保守センタなどに人手で通報するまでサーバの障害状態が継続し、システムの信頼性を下げてしまうという課題がある。
In the conventional failure notification method described with reference to FIG. 18 and also in the method of Patent Document 1, for example, when the server-side router 50 is out of order, a failure occurs in the component 30 of the server device 100. Even when the server device 100 generates and transmits a failure occurrence notification packet, the failure notification packet does not reach the call center device 600 because the server-side router 50 has failed, and the failure to the maintenance center 7 occurs. No occurrence notification is made.
Therefore, for example, there is a problem that the server failure state continues until the administrator of the server apparatus 100 notices the server failure and manually notifies the maintenance center or the like, thereby reducing the reliability of the system.

この発明は、上記のような課題を解決することを主な目的の一つとしており、通信経路における障害により通知が通知先に届かない場合にも、通知が通知先に届いていないことを早期に検出できるシステムを実現することを主な目的とする。   One of the main objects of the present invention is to solve the above-described problems. Even when the notification does not reach the notification destination due to a failure in the communication path, it is early notice that the notification does not reach the notification destination. The main purpose is to realize a system that can detect the failure.

本発明に係る情報処理装置は、
所定のイベントが発生した際に、イベントの発生を通知するイベント通知を生成するイベント通知生成部と、
前記イベント通知生成部により生成されたイベント通知を所定の管理装置に対して送信するイベント通知送信部と、
前記イベント通知送信部によりイベント通知が送信される度に、イベント通知の送信回数を計数するイベント通知送信回数計数部と、
所定の間隔で、前記イベント通知送信回数計数部により計数されたイベント通知の送信回数を通知する送信回数通知を生成する送信回数通知生成部と、
前記送信回数通知生成部により生成された送信回数通知を前記管理装置に対して送信する送信回数通知送信部とを有することを特徴とする。
An information processing apparatus according to the present invention includes:
An event notification generator for generating an event notification for notifying the occurrence of an event when a predetermined event occurs;
An event notification transmitter for transmitting the event notification generated by the event notification generator to a predetermined management device;
Each time an event notification is transmitted by the event notification transmission unit, an event notification transmission number counting unit that counts the number of event notification transmissions,
A transmission frequency notification generating unit for generating a transmission frequency notification for notifying the transmission frequency of the event notification counted by the event notification transmission frequency counting unit at a predetermined interval;
A transmission frequency notification transmission unit configured to transmit the transmission frequency notification generated by the transmission frequency notification generation unit to the management apparatus.

本発明によれば、情報処理装置が、イベント通知を管理装置に送信する度にイベント通知の送信回数を計数し、計数したイベント通知の送信回数を管理装置に通知するため、管理装置で計数されたイベント通知の受信回数と、情報処理装置から通知されたイベント通知の送信回数とを比較することにより、管理装置にイベント通知が届いていないことを早期に検出できる。   According to the present invention, the information processing device counts the number of event notification transmissions every time an event notification is transmitted to the management device, and notifies the management device of the counted number of event notification transmissions. By comparing the number of received event notifications with the number of event notification transmissions notified from the information processing device, it is possible to detect early that the event notification has not reached the management device.

実施の形態1及び2に係るシステム構成例を示す図。FIG. 3 is a diagram showing a system configuration example according to the first and second embodiments. 実施の形態1に係るサーバ装置の構成例を示す図。FIG. 3 shows a configuration example of a server apparatus according to the first embodiment. 実施の形態1に係るコールセンタ装置の構成例を示す図。FIG. 3 shows a configuration example of a call center device according to the first embodiment. 実施の形態1に係る障害発生通報パケットの構成例を示す図。FIG. 6 is a diagram illustrating a configuration example of a failure occurrence notification packet according to the first embodiment. 実施の形態1に係る障害発生回数通知パケットの構成例を示す図。FIG. 4 is a diagram illustrating a configuration example of a failure occurrence count notification packet according to the first embodiment. 実施の形態2に係るコールセンタ装置の構成例を示す図。FIG. 4 is a diagram illustrating a configuration example of a call center device according to a second embodiment. 実施の形態3に係るコールセンタ装置の構成例を示す図。FIG. 10 is a diagram illustrating a configuration example of a call center device according to a third embodiment. 実施の形態1に係るサーバ装置の障害発生通報処理の手順例を示すフローチャート図。FIG. 4 is a flowchart showing a procedure example of a failure occurrence notification process of the server device according to the first embodiment. 実施の形態1に係るサーバ装置の障害発生回数通知処理の手順例を示すフローチャート図。FIG. 3 is a flowchart showing an example of a procedure of failure occurrence count notification processing of the server device according to the first embodiment. 実施の形態1に係るコールセンタ装置の通報関連処理の手順例を示すフローチャート図。FIG. 3 is a flowchart showing an example of a procedure for notification-related processing of the call center device according to the first embodiment. 実施の形態1に係るコールセンタ装置の障害発生通報処理の手順例を示すフローチャート図。FIG. 3 is a flowchart showing a procedure example of a failure occurrence notification process of the call center device according to the first embodiment. 実施の形態1に係るコールセンタ装置の障害発生回数通知処理の手順例を示すフローチャート図。FIG. 3 is a flowchart showing a procedure example of failure occurrence frequency notification processing of the call center device according to the first embodiment. 実施の形態2及び3に係るコールセンタ装置の通報関連処理の手順例を示すフローチャート図。The flowchart figure which shows the example of a procedure of the report related process of the call center apparatus which concerns on Embodiment 2 and 3. FIG. 実施の形態3に係るコールセンタ装置の障害発生通報処理の手順例を示すフローチャート図。FIG. 10 is a flowchart showing a procedure example of a failure occurrence notification process of the call center device according to the third embodiment. 実施の形態3に係るコールセンタ装置の障害発生回数通知処理の手順例を示すフローチャート図。FIG. 10 is a flowchart showing a procedure example of failure occurrence frequency notification processing of the call center device according to the third embodiment. 実施の形態3に係るコールセンタ装置の経路障害確認処理の手順例を示すフローチャート図。FIG. 10 is a flowchart showing a procedure example of a route failure confirmation process of the call center device according to the third embodiment. 実施の形態1〜3に係るサーバ装置1及びコールセンタ装置6のハードウェア構成例を示す図。The figure which shows the hardware structural example of the server apparatus 1 and the call center apparatus 6 which concern on Embodiment 1-3. 従来技術のシステム構成例を示す図。The figure which shows the system structural example of a prior art.

実施の形態1.
図1は、本実施の形態に係るシステム構成例を示す。
Embodiment 1 FIG.
FIG. 1 shows a system configuration example according to the present embodiment.

図1では、サーバ装置1がサーバ側ルータ50、通信回線5及びセンタ側ルータ60を介してコールセンタ装置6に接続されている。
そして、コールセンタ装置6は通信回線9を介して保守センタ7内の保守センタ装置70に接続されている。
図18を参照して説明したように、サーバ装置1の構成要素において障害が発生すると、サーバ装置1から障害発生通報パケットがサーバ側ルータ50、通信回線5、及びセンタ側ルータ60を経由してコールセンタ装置6に送信される。
コールセンタ装置6では、障害発生通報パケットを解析し、障害内容を通知する通知メッセージ66を生成し、保守センタ装置70に送信する。
通知メッセージを受けた保守センタ7では、通知の内容からサーバ装置1の構成要素の交換部品を携えた保守員71がサーバ設置場所に行き、サーバ装置1の故障部品を交換する。
なお、サーバ装置1は情報処理装置の例であり、コールセンタ装置6は管理装置の例である。
In FIG. 1, the server device 1 is connected to the call center device 6 via a server side router 50, a communication line 5, and a center side router 60.
The call center device 6 is connected to a maintenance center device 70 in the maintenance center 7 via a communication line 9.
As described with reference to FIG. 18, when a failure occurs in a component of the server device 1, a failure occurrence notification packet is transmitted from the server device 1 via the server side router 50, the communication line 5, and the center side router 60. It is transmitted to the call center device 6.
The call center device 6 analyzes the failure occurrence notification packet, generates a notification message 66 for notifying the failure content, and transmits it to the maintenance center device 70.
In the maintenance center 7 that has received the notification message, the maintenance staff 71 carrying the replacement parts of the components of the server apparatus 1 goes to the server installation location from the contents of the notification and replaces the failed parts of the server apparatus 1.
The server device 1 is an example of an information processing device, and the call center device 6 is an example of a management device.

図2は、本実施の形態に係るサーバ装置1の構成例を示す。
図2において、障害通報送信カウンタ24、送信間隔設定部25、送信間隔計測タイマ26及び要求信号27以外は、図18に示した要素と同じである。
但し、通報通知作成部22及び通報通知送信部23は、図18とは異なる機能を有する。
以下では、通報通知作成部22、通報通知送信部23、障害通報送信カウンタ24、送信間隔設定部25、送信間隔計測タイマ26及び要求信号27について説明し、他の要素の説明は省略する。
FIG. 2 shows a configuration example of the server apparatus 1 according to the present embodiment.
In FIG. 2, the elements other than the failure notification transmission counter 24, the transmission interval setting unit 25, the transmission interval measurement timer 26, and the request signal 27 are the same as those shown in FIG.
However, the notification notification creation unit 22 and the notification notification transmission unit 23 have functions different from those in FIG.
In the following, the notification notification creation unit 22, the notification notification transmission unit 23, the failure notification transmission counter 24, the transmission interval setting unit 25, the transmission interval measurement timer 26, and the request signal 27 will be described, and description of other elements will be omitted.

本実施の形態では、通報通知作成部22は、障害検出部21による障害検出というイベント(障害検出イベント)が発生した際に、障害の発生(障害検出イベントの発生)を通知する障害発生通報パケット(イベント通知)を生成するとともに、所定の間隔で、後述する障害通報送信カウンタ24により計数された障害発生通報パケット(イベント通知)の送信回数を通知する障害発生回数通知パケット(送信回数通知)を生成する。
通報通知作成部22は、イベント通知生成部及び送信回数通知生成部の例である。
In the present embodiment, the notification notification creation unit 22 notifies the occurrence of a failure (occurrence of a failure detection event) when a failure detection event by the failure detection unit 21 (failure detection event) occurs. (Event notification) is generated, and a failure occurrence frequency notification packet (transmission frequency notification) is sent at a predetermined interval to notify a failure occurrence notification packet (event notification) transmission count counted by a failure notification transmission counter 24 described later. Generate.
The notification notification creation unit 22 is an example of an event notification generation unit and a transmission count notification generation unit.

通報通知送信部23は、通報通知作成部22により生成された障害発生通報パケット及び障害発生回数通知パケットをコールセンタ装置6に対して送信する。
通報通知送信部23は、イベント通知送信部及び送信回数通知送信部の例である。
The notification notification transmission unit 23 transmits the failure occurrence notification packet and the failure occurrence frequency notification packet generated by the notification notification creation unit 22 to the call center device 6.
The notification notification transmission unit 23 is an example of an event notification transmission unit and a transmission frequency notification transmission unit.

障害通報送信カウンタ24は、通報通知送信部23により障害発生通報パケット(イベント通知)が送信される度に、障害発生通報パケットの送信回数を計数する。
障害通報送信カウンタ24は、イベント通知送信回数計数部の例である。
The failure notification transmission counter 24 counts the number of transmissions of the failure occurrence notification packet every time a failure occurrence notification packet (event notification) is transmitted by the notification notification transmission unit 23.
The failure notification transmission counter 24 is an example of an event notification transmission count counter.

送信間隔設定部25は、通報通知作成部22が障害発生回数通知パケットを生成し、通報通知送信部23が障害発生回数通知パケットを送信する間隔(周期)を後述の送信間隔計測タイマ26に設定する。   The transmission interval setting unit 25 sets an interval (period) at which the notification notification creating unit 22 generates a failure occurrence frequency notification packet and the notification notification transmission unit 23 transmits the failure occurrence frequency notification packet in a transmission interval measurement timer 26 described later. To do.

送信間隔計測タイマ26は、送信間隔設定部25により設定された間隔(周期)にて、要求信号27を通報通知作成部22に出力するタイマである。   The transmission interval measurement timer 26 is a timer that outputs a request signal 27 to the notification notification creation unit 22 at intervals (cycles) set by the transmission interval setting unit 25.

図3は、本実施の形態に係るコールセンタ装置6の構成例を示す。
図3において、通報確認部8内の要素以外は、図18に示した要素と同じである。
但し、通報通知受信部62、通知生成部63及び通知出力部65は、図18とは異なる機能を有する。
以下では、通報通知受信部62、通知生成部63、通知出力部65及び通報確認部8内の要素について説明し、他の要素の説明は省略する。
FIG. 3 shows a configuration example of the call center device 6 according to the present embodiment.
In FIG. 3, the elements other than the elements in the notification confirmation unit 8 are the same as the elements shown in FIG.
However, the notification notification receiving unit 62, the notification generation unit 63, and the notification output unit 65 have functions different from those in FIG.
Below, the element in the notification notification receiving part 62, the notification production | generation part 63, the notification output part 65, and the notification confirmation part 8 is demonstrated, and description of another element is abbreviate | omitted.

通報通知受信部62は、サーバ装置1から送信された障害発生通報パケット(イベント通知)を受信するとともに、サーバ装置1から所定の間隔で送信される障害発生回数通知パケットを受信する。
障害発生回数通知パケットは、前述したように、サーバ装置1で計数された障害発生通報パケットの送信回数が通知されるパケットである。
通報通知受信部62は、イベント通知受信部及び送信回数通知受信部の例である。
The notification notification receiving unit 62 receives a failure occurrence notification packet (event notification) transmitted from the server device 1 and receives a failure occurrence frequency notification packet transmitted from the server device 1 at a predetermined interval.
As described above, the failure occurrence frequency notification packet is a packet for notifying the number of transmissions of the failure occurrence notification packet counted by the server device 1.
The notification notification receiving unit 62 is an example of an event notification receiving unit and a transmission count notification receiving unit.

通報通知解析部80は、通報通知受信部62により受信されたパケットが障害発生通報パケットであるか障害発生回数通知パケットであるかを判別する。
そして、障害発生通報パケットである場合は、通報通知解析部80は障害発生通報パケットを通知生成部63に転送するとともに、障害通報受信カウンタ81に障害発生通報パケットを受信したことを通知する。
また、障害発生回数通知パケットである場合は、通報通知解析部80は障害発生回数通知パケット内の数値(サーバ装置1で計数した障害発生通報パケットの送信回数)を障害通報送信回数受信部82に出力する。
The notification notification analysis unit 80 determines whether the packet received by the notification notification reception unit 62 is a failure occurrence notification packet or a failure occurrence frequency notification packet.
If it is a failure occurrence notification packet, the notification notification analysis unit 80 transfers the failure occurrence notification packet to the notification generation unit 63 and notifies the failure notification reception counter 81 that the failure occurrence notification packet has been received.
Further, in the case of the failure occurrence frequency notification packet, the notification notification analysis unit 80 sends the numerical value in the failure occurrence frequency notification packet (the transmission frequency of the failure occurrence notification packet counted by the server device 1) to the failure notification transmission frequency reception unit 82. Output.

障害通報受信カウンタ81は、通報通知解析部80から障害発生通報パケットを受信した旨の通知を受ける度に、障害発生通報パケットの受信回数を計数する。
障害通報受信カウンタ81は、イベント通知受信回数計数部の例である。
The failure report reception counter 81 counts the number of times the failure report packet is received every time a notification that the failure report packet is received from the report notification analysis unit 80.
The failure notification reception counter 81 is an example of an event notification reception count counter.

障害通報送信回数受信部82は、通報通知解析部80から障害発生回数通知パケット内の数値(サーバ装置1で計数した障害発生通報パケットの送信回数)を入力し、比較部83に出力する。   The failure notification transmission frequency reception unit 82 receives the numerical value (the number of transmissions of the failure occurrence notification packet counted by the server device 1) in the failure occurrence frequency notification packet from the notification notification analysis unit 80 and outputs it to the comparison unit 83.

比較部83は、障害通報送信回数受信部82から障害発生回数通知パケット内の数値を入力した際(つまり、通報通知受信部62が障害発生回数通知パケットを受信した際)に、障害通報送信回数受信部82から入力した数値(サーバ装置1で計数した障害発生通報パケットの送信回数)と障害通報受信カウンタ81で計数されている受信回数とを比較する。
そして、比較部83は、比較の結果、送信回数と受信回数が一致しない場合に、通知生成部63に対して、通信経路における異常の発生の可能性を警告する警告メッセージの生成を指示する。
When the comparison unit 83 inputs a numerical value in the failure occurrence frequency notification packet from the failure notification transmission frequency reception unit 82 (that is, when the notification notification reception unit 62 receives the failure occurrence frequency notification packet), The numerical value input from the receiving unit 82 (the number of transmissions of the failure occurrence notification packet counted by the server device 1) is compared with the number of receptions counted by the failure notification reception counter 81.
Then, the comparison unit 83 instructs the notification generation unit 63 to generate a warning message that warns of the possibility of occurrence of an abnormality in the communication path when the number of transmissions and the number of receptions do not match as a result of the comparison.

通知生成部63は、通報通知解析部80から障害発生通報パケットを入力した場合に、図18の場合と同様に障害内容を通知する通知メッセージ66を生成するとともに、比較部83から警告メッセージの生成指示を入力した場合に、警告メッセージを生成する。
比較部83は、警告メッセージ生成部の例である。
When a failure occurrence notification packet is input from the notification notification analysis unit 80, the notification generation unit 63 generates a notification message 66 for notifying the failure content as in the case of FIG. 18, and also generates a warning message from the comparison unit 83. Generate warning messages when instructions are entered.
The comparison unit 83 is an example of a warning message generation unit.

通知出力部65は、通知生成部63により生成された通知メッセージ66を保守センタ装置70に対して送信するとともに、通知生成部63により警告メッセージが生成された場合に、警告メッセージを保守センタ装置70に送信する。
通知出力部65は、警告メッセージ出力部の例である。
The notification output unit 65 transmits the notification message 66 generated by the notification generation unit 63 to the maintenance center device 70. When the warning message is generated by the notification generation unit 63, the notification output unit 65 transmits the warning message to the maintenance center device 70. Send to.
The notification output unit 65 is an example of a warning message output unit.

図4は、サーバ監視部2からコールセンタ装置6に対して送信される障害発生通報パケットの構成例を示す。
障害発生通報パケットは、宛先であるコールセンタ装置6のアドレスがセットされた送信先アドレス部、送信元であるサーバ監視部2のアドレスがセットされた発信元アドレス部、障害通報であることを示すコマンドコードが設定されるコマンド部、障害発生箇所(種類)を示すコードがセットされるデータ部から構成される。
FIG. 4 shows a configuration example of a failure occurrence notification packet transmitted from the server monitoring unit 2 to the call center device 6.
The failure occurrence notification packet includes a transmission destination address portion in which the address of the call center device 6 that is the destination is set, a transmission source address portion in which the address of the server monitoring unit 2 that is the transmission source is set, and a command that indicates a failure notification It consists of a command part in which a code is set and a data part in which a code indicating a failure occurrence location (type) is set.

図5は、サーバ監視部2からコールセンタ装置6に対して送信される障害発生回数通知パケットの構成例を示す。
障害発生回数通知パケットは、宛先であるコールセンタ装置6のアドレスがセットされた送信先アドレス部、送信元であるサーバ監視部2のアドレスがセットされた発信元アドレス部、障害発生回数通知であることを示すコマンドコードが設定されるコマンド部、サーバ監視部2からコールセンタ装置6に向けて送信された障害発生通報パケットの送信回数がセットされるデータ部から構成される。
FIG. 5 shows a configuration example of a failure occurrence frequency notification packet transmitted from the server monitoring unit 2 to the call center device 6.
The failure occurrence frequency notification packet is a transmission destination address portion in which the address of the call center device 6 that is the destination is set, a transmission source address portion in which the address of the server monitoring unit 2 that is the transmission source is set, and a failure occurrence frequency notification. A command part in which a command code indicating the above is set, and a data part in which the number of transmissions of the failure occurrence notification packet transmitted from the server monitoring part 2 to the call center device 6 is set.

次に、図8〜12を参照して動作について説明する。
図8は、サーバ装置1がコールセンタ装置6に障害が発生したことを通知する障害発生通報処理の手順例を示す。
図9は、サーバ装置1がコールセンタ装置に障害発生通報パケットの送信回数を通知する障害回数通知処理の手順例を示す。
図10は、コールセンタ装置6において周期的に実行される通報関連処理の手順例を示す。
図11は、本実施の形態に係るコールセンタ装置6が障害発生通報を受信した際の障害発生通報処理の手順例であり、図10のST210の詳細を示す。
図12は、本実施の形態に係るコールセンタ装置6が障害発生回数通知を受信した際の障害発生回数通知処理の手順例であり、図10のST220の詳細を示す。
なお、以下では、サーバ装置1の構成要素30で障害が発生した場合を例に説明を進める。
Next, the operation will be described with reference to FIGS.
FIG. 8 shows a procedure example of failure occurrence notification processing in which the server device 1 notifies the call center device 6 that a failure has occurred.
FIG. 9 shows a procedure example of the failure frequency notification process in which the server device 1 notifies the call center device of the transmission frequency of the failure occurrence notification packet.
FIG. 10 shows an example of a procedure of notification-related processing that is periodically executed in the call center device 6.
FIG. 11 is a procedure example of failure occurrence notification processing when the call center device 6 according to the present embodiment receives a failure occurrence notification, and shows details of ST210 in FIG.
FIG. 12 is a procedure example of the failure occurrence frequency notification process when the call center device 6 according to the present embodiment receives the failure occurrence frequency notification, and shows details of ST220 in FIG.
In the following description, the case where a failure occurs in the component 30 of the server device 1 will be described as an example.

サーバ装置1の構成要素30で障害が発生すると(図8のST101でYES)、障害検出用信号40が有意になり、それを障害検出部21で検出したサーバ監視部2は障害発生通報パケットを通報通知作成部22で生成する(ST102)(イベント通知生成処理)。
次に、通報通知送信部23が障害発生通報パケットをコールセンタ装置6に向けて送信する(ST103)(イベント通知送信処理)。
また、この時、障害通報送信カウンタ24の値がインクリメント(+1)される(ST104)(イベント通知送信回数計数処理)。
When a failure occurs in the component 30 of the server device 1 (YES in ST101 in FIG. 8), the failure detection signal 40 becomes significant, and the server monitoring unit 2 that has detected this by the failure detection unit 21 sends a failure occurrence notification packet. Generated by the notification notification creation unit 22 (ST102) (event notification generation processing).
Next, the notification notification transmission unit 23 transmits a failure occurrence notification packet to the call center device 6 (ST103) (event notification transmission processing).
At this time, the value of the failure notification transmission counter 24 is incremented (+1) (ST104) (event notification transmission count counting process).

障害発生通報パケットはサーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置6に届く。
コールセンタ装置6では、通報通知受信部62で障害発生通報パケットを受信し(図10のST201でYES)(イベント通知受信処理)、通報通知解析部80にて解析される。
より詳細には、コールセンタ装置6では、通報通知解析部80が、通報通知受信部62で受信されたパケットからコマンド部を取り出し(ST202)、コマンド部を解析して受信パケットが障害発生通報パケットであるか障害発生回数通知パケットであるかを判断する(ST203)。
ここでは、受信パケットは障害発生通報パケットであるため、障害発生通報処理(ST210)が行われる。
The failure occurrence notification packet reaches the call center device 6 via the server side router 50, the communication line 5, and the center side router 60.
In the call center device 6, the notification notification receiving unit 62 receives the failure occurrence notification packet (YES in ST201 in FIG. 10) (event notification reception processing), and is analyzed by the notification notification analysis unit 80.
More specifically, in the call center device 6, the notification notification analysis unit 80 extracts the command portion from the packet received by the notification notification reception portion 62 (ST202), analyzes the command portion, and the received packet is a failure occurrence notification packet. It is determined whether there is a failure occurrence count notification packet (ST203).
Here, since the received packet is a failure occurrence notification packet, failure occurrence notification processing (ST210) is performed.

障害発生通報処理(ST210)では、通報通知解析部80から障害通報受信カウンタ81に障害発生通報パケットが受信された旨が通知され、また、通報通知解析部80から通知生成部63に障害発生通報パケットが転送される。
そして、通報通知解析部80から障害発生通報パケットが受信された旨が通知されると、障害通報受信カウンタ81はカウンタ値をインクリメント(+1)する(図11のST211)(イベント通知受信回数計数処理)。
また、通知生成部63は、障害発生通報パケットの少なくとも発信元アドレスとデータ部を用いて通知メッセージ66を生成する(ST212)。
次に、通知蓄積部64が、通知生成部63により生成された通知メッセージ66を蓄積するとともに(図11のST213)、通知出力部65が保守センタ7の保守センタ装置70に通知メッセージ66を送信する(ST214)。
In the failure occurrence notification process (ST210), the failure notification reception counter 81 notifies the failure notification reception unit 81 that the failure occurrence notification packet has been received, and the notification notification analysis portion 80 notifies the failure generation notification to the notification generation unit 63. The packet is forwarded.
Then, when notified that the failure notification packet is received from the notification notification analysis unit 80, the failure notification reception counter 81 increments (+1) the counter value (ST211 in FIG. 11) (event notification reception count processing) ).
Moreover, the notification production | generation part 63 produces | generates the notification message 66 using at least the transmission origin address and data part of a failure generation notification packet (ST212).
Next, the notification storage unit 64 stores the notification message 66 generated by the notification generation unit 63 (ST213 in FIG. 11), and the notification output unit 65 transmits the notification message 66 to the maintenance center device 70 of the maintenance center 7. (ST214).

通知メッセージ66を受けた保守センタ7では、通知の内容からサーバ装置1の構成要素30の交換部品を携えた保守員71がサーバ設置場所に行き、サーバ装置1の故障部品を交換する。
こうして、サーバ装置1は正常状態に復帰することができる。
In the maintenance center 7 that has received the notification message 66, the maintenance staff 71 carrying the replacement parts of the component 30 of the server apparatus 1 goes to the server installation location from the contents of the notification and replaces the failed part of the server apparatus 1.
In this way, the server apparatus 1 can return to a normal state.

また、サーバ装置1で障害が発生していない間は、送信間隔設定部25からセットされた時間の間、送信間隔計測タイマ26が時間の計測を継続する。
設定された時間が経過し、障害発生回数の通知タイミングになると(図9のST111でYES)、送信間隔計測タイマ26は要求信号27を有意にする。
要求信号27が有意になると、通報通知作成部22で要求信号27が有意になったことを検出し、通報通知作成部22が障害発生回数通知パケットを生成する(ST112)(送信回数通知生成処理)。
具体的には、通報通知作成部22は、障害通報送信カウンタ24のカウンタ値を読み出し、カウンタ値をセットした障害発生回数通知パケットを生成する。
次に、通報通知送信部23が障害発生回数通知パケットをコールセンタ装置6に向けて送信する(ST113)(送信回数通知送信処理)。
Further, while no failure has occurred in the server device 1, the transmission interval measurement timer 26 continues to measure time for the time set by the transmission interval setting unit 25.
When the set time has elapsed and the notification timing of the number of failures has occurred (YES in ST111 in FIG. 9), the transmission interval measurement timer 26 makes the request signal 27 significant.
When the request signal 27 becomes significant, the notification notification creation unit 22 detects that the request signal 27 has become significant, and the notification notification creation unit 22 generates a failure occurrence count notification packet (ST112) (transmission count notification generation processing) ).
Specifically, the notification notification creation unit 22 reads the counter value of the failure notification transmission counter 24 and generates a failure occurrence frequency notification packet in which the counter value is set.
Next, the notification notification transmission unit 23 transmits a failure occurrence frequency notification packet to the call center device 6 (ST113) (transmission frequency notification transmission processing).

障害発生回数通知パケットはサーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置6に届く。
コールセンタ装置6では、通報通知受信部62で障害発生回数通知パケットを受信し(図10のST201でYES)(送信回数通知受信処理)、通報通知解析部80にて解析される。
より詳細には、コールセンタ装置6では、通報通知解析部80が、通報通知受信部62で受信されたパケットからコマンド部を取り出し(ST202)、コマンド部を解析して受信パケットが障害発生通報パケットであるか障害発生回数通知パケットであるかを判断する(ST203及びS204)。
ここでは、受信パケットは障害発生回数通知パケットであるため、障害発生回数通知処理(ST220)が行われる。
The failure occurrence frequency notification packet reaches the call center device 6 via the server side router 50, the communication line 5, and the center side router 60.
In the call center device 6, the notification notification receiving unit 62 receives the failure occurrence number notification packet (YES in ST 201 of FIG. 10) (transmission number notification reception processing), and is analyzed by the notification notification analysis unit 80.
More specifically, in the call center device 6, the notification notification analysis unit 80 extracts the command portion from the packet received by the notification notification reception portion 62 (ST202), analyzes the command portion, and the received packet is a failure occurrence notification packet. It is determined whether there is a failure occurrence count notification packet (ST203 and S204).
Here, since the received packet is a failure occurrence count notification packet, failure occurrence count notification processing (ST220) is performed.

障害発生回数通知処理(ST220)では、通報通知解析部80から障害通報受信カウンタ81に障害発生回数通知パケットを受信した旨が通知され、また、通報通知解析部80から障害通報送信回数受信部82に障害発生回数通知パケットのデータ部に設定されている数値(障害発生回数)が出力される。
障害通報受信カウンタ81は、現在のカウンタ値を比較部83に出力し、また、障害通報送信回数受信部82は障害発生回数通知パケットのデータ部の数値(障害発生回数)を比較部83に出力する。
なお、障害発生回数通知パケットが受信された場合は、障害通報受信カウンタ81の値は変化しない。
In the failure occurrence frequency notification process (ST220), the notification notification analysis unit 80 notifies the failure notification reception counter 81 that the failure occurrence frequency notification packet has been received, and the notification notification analysis unit 80 notifies the failure notification transmission frequency reception unit 82. The numerical value set in the data part of the failure occurrence frequency notification packet (number of failure occurrences) is output.
The failure notification reception counter 81 outputs the current counter value to the comparison unit 83, and the failure notification transmission count reception unit 82 outputs the numerical value (failure occurrence count) of the data portion of the failure occurrence count notification packet to the comparison unit 83. To do.
When the failure occurrence count notification packet is received, the value of the failure notification reception counter 81 does not change.

比較部83では、障害通報送信回数受信部82から出力された障害発生回数通知パケットのデータ部の数値(障害発生回数)と、障害通報受信カウンタ81から出力されたカウンタ値を比較する(図12のST221)(比較処理)。
比較の結果、両者の値が一致している場合(ST222でYES)には、サーバ監視部2からの障害発生通報パケットは全て正常に処理されたことになるため新たな処理は何も行われない。
一方、両者の値が一致しない場合(ST222でNO)は、比較部83は通知生成部63に通信経路に異常が発生している可能性又は異常が発生していた可能性を警告する通知メッセージを生成するよう指示し、通知生成部63は、このような通知メッセージ(警告メッセージ)を生成する(ST223)(警告メッセージ生成処理)。
次に、通知蓄積部64が、通知生成部63により生成された警告メッセージを蓄積するとともに(ST224)、通知出力部65が保守センタ7の保守センタ装置70に警告メッセージを送信する(ST225)(警告メッセージ送信処理)。
そして、次回の比較に備え、障害通報送信回数受信部82の値が障害通報受信カウンタ81にセットされる(ST226)。
The comparison unit 83 compares the numerical value (failure occurrence number) of the data part of the failure occurrence frequency notification packet output from the failure notification transmission frequency reception unit 82 with the counter value output from the failure notification reception counter 81 (FIG. 12). ST221) (comparison processing).
If both values match as a result of the comparison (YES in ST222), all of the failure notification packets from the server monitoring unit 2 have been processed normally, so no new processing is performed. Absent.
On the other hand, when the two values do not match (NO in ST222), the comparison unit 83 notifies the notification generation unit 63 of a possibility that an abnormality has occurred in the communication path or a possibility that an abnormality has occurred. Is generated, and the notification generation unit 63 generates such a notification message (warning message) (ST223) (warning message generation processing).
Next, the notification storage unit 64 stores the warning message generated by the notification generation unit 63 (ST224), and the notification output unit 65 transmits the warning message to the maintenance center device 70 of the maintenance center 7 (ST225) ( Warning message transmission processing).
Then, in preparation for the next comparison, the value of the failure notification transmission count reception unit 82 is set in the failure notification reception counter 81 (ST226).

もしも、サーバ側ルータ50が障害で一時的に動作を停止している間にサーバ装置1で何らかの障害が発生すると、障害発生前に障害通報送信カウンタ24の値がNだった場合には、コールセンタ装置6へ障害発生通報パケットは届かないが、サーバ装置1からは障害発生通報パケットは送出されているので障害通報送信カウンタ24の値はN+1になる。
その後、サーバ側ルータ50が障害から復旧すると、送信間隔計測タイマ26に設定されていただけの時間が経過した時に、N+1をデータ部に設定した障害通報回数通知パケットがコールセンタ装置6に送信される。
障害通報回数通知パケットを受信したコールセンタ装置6では、それまでに受信した障害発生通報の回数をカウントしていた障害通報受信カウンタ81の内容Nと、障害通報回数通知パケットから取り出された数値N+1とが比較部83で比較される。
この場合は、その出力が不一致を示す状態になるため、障害発生通報の通信経路(サーバ側ルータ50、通信回線5、センタ側ルータ60)上で障害が発生している可能性を警告する警告メッセージが保守センタ装置70に送信される。
そして、次回の比較に備え、障害通報回数通知パケットから取り出された数値N+1が障害通報受信カウンタ81にセットされる。
If any failure occurs in the server device 1 while the server side router 50 is temporarily stopped due to a failure, if the value of the failure notification transmission counter 24 is N before the failure occurs, Although the failure occurrence notification packet does not reach the device 6, since the failure occurrence notification packet is transmitted from the server device 1, the value of the failure notification transmission counter 24 becomes N + 1.
Thereafter, when the server-side router 50 recovers from the failure, a failure notification frequency notification packet in which N + 1 is set in the data portion is transmitted to the call center device 6 when the time just set in the transmission interval measurement timer 26 has elapsed.
In the call center device 6 that has received the failure notification frequency notification packet, the content N of the failure notification reception counter 81 that has counted the number of failure notifications received so far, and the numerical value N + 1 extracted from the failure notification frequency notification packet Are compared by the comparison unit 83.
In this case, since the output indicates a mismatch, a warning that warns of the possibility of a failure occurring on the communication path (server side router 50, communication line 5, center side router 60) of the failure occurrence notification. A message is transmitted to the maintenance center device 70.
Then, in preparation for the next comparison, the numerical value N + 1 extracted from the failure notification frequency notification packet is set in the failure notification reception counter 81.

警告メッセージを受けた保守センタ7では、通知の内容から通信経路に異常が発生している可能性をサーバ装置1の管理者に伝えるとともに、障害発生通報パケットとして通報されなかった障害が何であるかを確認するため、保守員71がサーバ設置場所に行き、ログなどを解析して、障害箇所を見極め、部品交換することで、サーバ装置1が正常状態に復旧する。
このように、障害発生通報経路に異常がある場合でも、サーバ装置1での障害発生を確実に通報できるようになり、復旧までの時間の長時間化を防ぐことができるので、信頼性の高いシステムを構築することができる。
Receiving the warning message, the maintenance center 7 informs the administrator of the server apparatus 1 that there is a possibility that an abnormality has occurred in the communication path from the contents of the notification, and what is the failure that has not been reported as a failure occurrence notification packet. Therefore, the maintenance staff 71 goes to the server installation location, analyzes the log and the like, identifies the failure location, and replaces the parts, so that the server device 1 is restored to the normal state.
As described above, even when there is an abnormality in the failure occurrence notification path, the failure occurrence in the server device 1 can be reliably reported, and the time until recovery can be prevented from being prolonged, so that the reliability is high. A system can be constructed.

なお、以上の説明では、障害発生通報パケットをコールセンタ装置6に届けるための通信経路と、障害発生回数通知パケットをコールセンタ装置6に届けるための通信経路が同じである例を説明したが、障害発生通報パケットをコールセンタ装置6に届けるための通信経路と、障害発生回数通知パケットをコールセンタ装置6に届けるための通信経路を別の経路としてもよい。   In the above description, an example in which a communication path for delivering a failure occurrence notification packet to the call center device 6 and a communication route for delivering a failure occurrence frequency notification packet to the call center device 6 are the same is described. The communication path for delivering the notification packet to the call center apparatus 6 and the communication path for delivering the failure occurrence frequency notification packet to the call center apparatus 6 may be different paths.

実施の形態2.
実施の形態1に係るシステムでは、障害発生通報パケットをコールセンタ装置6に届けるための通信経路と、障害発生回数通知パケットをコールセンタ装置6に届けるための通信経路が同じである場合には、通信経路が障害から回復しないと、障害発生回数通知パケットはコールセンタ装置6に届かない。
このため、通信経路の回復に長時間を要する場合には、コールセンタ装置6において、不達になっている障害発生通報パケットの存在を確認するまでに長時間を要することになる。
本実施の形態では、このような事態に対処し、不達になっている障害発生通報パケットの存在を早期に確認できるコールセンタ装置6を説明する。
Embodiment 2. FIG.
In the system according to the first embodiment, when the communication path for delivering the failure occurrence notification packet to the call center apparatus 6 and the communication path for delivering the failure occurrence frequency notification packet to the call center apparatus 6 are the same, the communication path Does not recover from the failure, the failure occurrence frequency notification packet does not reach the call center device 6.
For this reason, when it takes a long time to recover the communication path, it takes a long time for the call center device 6 to confirm the presence of the failure notification packet that has not been delivered.
In the present embodiment, a call center device 6 capable of coping with such a situation and confirming the presence of a failure occurrence notification packet that has not arrived at an early stage will be described.

図6は、本実施の形態に係るコールセンタ装置6の構成例を示す。
コールセンタ装置6以外の要素は、実施の形態1に示したものと同様であるため、コールセンタ装置6以外の要素の説明は省略する。
FIG. 6 shows a configuration example of the call center device 6 according to the present embodiment.
Since elements other than the call center apparatus 6 are the same as those shown in the first embodiment, description of elements other than the call center apparatus 6 is omitted.

図6では、図3の構成と比較して、通知受信間隔計測タイマ84と受信間隔設定部85が追加されている。
受信間隔設定部85は、送信間隔設定部25よりも長い時間間隔を設定する。
通知受信間隔計測タイマ84は、障害発生回数通知パケットを受信した時に受信間隔設定部85に設定されている値をセットし、その後時間の経過とともにセット値をカウントダウンしていく。
つまり、通知受信間隔計測タイマ84は、通報通知受信部62が障害発生回数通知パケットを受信してからの経過時間を計測し、経過時間が受信間隔設定部85により設定された値を超過した場合に、経過時間が受信間隔設定部85の設定値を超過したことを通知生成部63に通知する。
通知受信間隔計測タイマ84は、経過時間計測部の例である。
そして、本実施の形態では、通知生成部63は、通知受信間隔計測タイマ84から経過時間が受信間隔設定部85の設定値を超過したことを通知された場合に、警告メッセージを生成する。
In FIG. 6, a notification reception interval measurement timer 84 and a reception interval setting unit 85 are added as compared with the configuration of FIG.
The reception interval setting unit 85 sets a time interval longer than the transmission interval setting unit 25.
The notification reception interval measurement timer 84 sets a value set in the reception interval setting unit 85 when receiving the failure occurrence count notification packet, and then counts down the set value as time passes.
That is, the notification reception interval measurement timer 84 measures the elapsed time since the notification notification receiving unit 62 received the failure occurrence frequency notification packet, and the elapsed time exceeds the value set by the reception interval setting unit 85. In addition, the notification generation unit 63 is notified that the elapsed time has exceeded the set value of the reception interval setting unit 85.
The notification reception interval measurement timer 84 is an example of an elapsed time measurement unit.
In the present embodiment, the notification generation unit 63 generates a warning message when notified from the notification reception interval measurement timer 84 that the elapsed time has exceeded the set value of the reception interval setting unit 85.

次に動作について説明する。
なお、サーバ装置1における動作は、図8及び図9に示す通りである。
つまり、サーバ装置1で障害が発生していない間は、送信間隔設定部25に設定された時間の間隔で、障害発生回数通知パケットがサーバ監視部2から、サーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置6に送信される。
Next, the operation will be described.
The operation in the server device 1 is as shown in FIGS.
That is, while no failure has occurred in the server device 1, the failure occurrence frequency notification packet is transmitted from the server monitoring unit 2 to the server side router 50, the communication line 5, and the time interval set in the transmission interval setting unit 25. It is transmitted to the call center device 6 via the center side router 60.

本実施の形態に係るコールセンタ装置6の動作は、図13に示す通りである。
図13では、図10と比較して、S205及びST230が追加されており、他の処理は図10と同様である。
以下では、S205及びST230について説明する。
なお、図13では、ST300、ST400、ST500も記述されているが、ST300、ST400、ST500は実施の形態3で説明する。
The operation of the call center device 6 according to the present embodiment is as shown in FIG.
In FIG. 13, compared with FIG. 10, S205 and ST230 are added, and other processes are the same as those of FIG.
Hereinafter, S205 and ST230 will be described.
In FIG. 13, ST300, ST400, and ST500 are also described, but ST300, ST400, and ST500 will be described in Embodiment 3.

本実施の形態では、通報通知解析部80が、通報通知受信部62により受信されたパケットが障害発生回数通知パケットであると判断すると、受信間隔設定部85に設定されている値が通知受信間隔計測タイマ84にセットされ、通知受信間隔計測タイマ84はセット値のカウントダウンを開始する。
つまり、通知受信間隔計測タイマ84は、障害発生回数通知パケットの受信時刻からの経過時間を計測する。
そして、通信経路に障害が発生しなければ、通知受信間隔計測タイマ84の値がゼロになる前に、サーバ装置1の送信間隔設定部25に設定された時間間隔でサーバ監視部2が障害発生回数通知パケットを送信する。
このため、通信経路に障害が発生しなければ、通知受信間隔計測タイマ84の値がゼロになる前に、通報通知受信部62が障害発生回数通知パケットを受信し、通報通知解析部80が障害発生回数通知パケットが受信された旨を確認する。
通報通知解析部80が障害発生回数通知パケットの受信を確認すると、通知受信間隔計測タイマ84には受信間隔設定部85に設定されていた時間が再度セットされ、その後カウントダウンが再度開始される。
結局、通信経路が正常であれば、通知受信間隔の再設定→カウントダウン→通知受信間隔の再設定→カウントダウンが繰り返され、通知受信間隔計測タイマ84がゼロになることはない。
ここで、もしも、サーバ側ルータ50に障害が発生した場合、サーバ監視部2からの障害発生回数通知パケットを受信しないため、通知受信間隔計測タイマ84のカウントダウンが進み、通知受信間隔計測タイマ84の値がゼロになる。
図13に従って説明すると、通知受信間隔計測タイマ84は、単位時間ごとに(ST205)に障害経路確認処理(ST230)を行って、カウントダウンを進め、カウンタ値がゼロになった場合に、通知生成部63が警告メッセージを生成し、通知出力部65が警告メッセージを送信する。
ここでは、ST205の単位時間を1秒とし、受信間隔設定部85が通知受信間隔計測タイマ84に設定する受信間隔を1000秒とする例で障害経路確認処理(ST230)を説明する。
In the present embodiment, when the notification notification analysis unit 80 determines that the packet received by the notification notification reception unit 62 is a failure occurrence frequency notification packet, the value set in the reception interval setting unit 85 is the notification reception interval. The notification reception interval measurement timer 84 is set in the measurement timer 84 and starts to count down the set value.
That is, the notification reception interval measurement timer 84 measures the elapsed time from the reception time of the failure occurrence frequency notification packet.
If no failure occurs in the communication path, the server monitoring unit 2 generates a failure at the time interval set in the transmission interval setting unit 25 of the server device 1 before the value of the notification reception interval measurement timer 84 becomes zero. Send a count notification packet.
For this reason, if a failure does not occur in the communication path, the notification notification receiving unit 62 receives the failure occurrence count notification packet before the value of the notification reception interval measurement timer 84 becomes zero, and the notification notification analysis unit 80 Confirm that the occurrence frequency notification packet has been received.
When the notification notification analysis unit 80 confirms reception of the failure occurrence count notification packet, the notification reception interval measurement timer 84 is set again in the time set in the reception interval setting unit 85, and then the countdown is started again.
In the end, if the communication path is normal, the notification reception interval resetting → countdown → notification reception interval resetting → countdown is repeated, and the notification reception interval measurement timer 84 does not become zero.
Here, if a failure occurs in the server side router 50, the notification reception interval measurement timer 84 counts down because the failure occurrence frequency notification packet from the server monitoring unit 2 is not received, and the notification reception interval measurement timer 84 The value becomes zero.
Explaining in accordance with FIG. 13, the notification reception interval measurement timer 84 performs a failure path confirmation process (ST230) every unit time (ST205), advances the countdown, and when the counter value becomes zero, the notification generation unit 63 generates a warning message, and the notification output unit 65 transmits the warning message.
Here, the failure path confirmation process (ST230) will be described using an example in which the unit time of ST205 is 1 second and the reception interval set by the reception interval setting unit 85 in the notification reception interval measurement timer 84 is 1000 seconds.

ST205により1秒ごとに経路障害確認処理(ST230)が開始され、通知受信間隔計測タイマ84はカウンタ値をデクリメントし、カウンタ値がゼロになっていなければ、経路障害確認処理(ST230)を終了し、次の1秒が経過するのを待つ。
一方、カウンタ値をデクリメントした結果カウンタ値がゼロになれば(障害発生回数通知パケットを受信していない時間が閾値である1000秒を超えたら)、通知受信間隔計測タイマ84が通知生成部63にカウンタ値がゼロになった旨を通知する。
通知生成部63は、通知受信間隔計測タイマ84からの通知を受けて、通信経路の異常の可能性を警告する警告メッセージを生成し、通知出力部65での蓄積の後、通知出力部65が警告メッセージを保守センタ装置70に送信する。
In ST205, a path failure confirmation process (ST230) is started every second, and the notification reception interval measurement timer 84 decrements the counter value. If the counter value is not zero, the path failure confirmation process (ST230) is terminated. Wait for the next second to elapse.
On the other hand, if the counter value becomes zero as a result of decrementing the counter value (if the time during which no failure occurrence notification packet is received exceeds the threshold value of 1000 seconds), the notification reception interval measurement timer 84 notifies the notification generator 63. Notify that the counter value has become zero.
The notification generation unit 63 receives a notification from the notification reception interval measurement timer 84, generates a warning message that warns of the possibility of abnormality in the communication path, and after being stored in the notification output unit 65, the notification output unit 65 A warning message is transmitted to the maintenance center device 70.

警告メッセージを受けた保守センタ7では、通知の内容から障害通報経路に異常がある旨をサーバ装置1の管理者に伝えるとともに、通信経路の障害箇所を確認するとともに障害発生通報パケットとして通報されなかった障害がないかを確認するため、保守員71がサーバ設置場所に行き、サーバ側ルータ50の障害であることを見極め、交換するとともに、サーバ装置1自体には障害はないことを確認することでシステムが正常状態に戻る。   Upon receiving the warning message, the maintenance center 7 informs the administrator of the server apparatus 1 that there is an abnormality in the failure notification path from the content of the notification, confirms the failure location of the communication path, and is not notified as a failure occurrence notification packet. In order to confirm that there is no failure, the maintenance staff 71 goes to the server installation location, identifies the failure of the server side router 50, replaces it, and confirms that there is no failure in the server device 1 itself. Will return the system to normal.

このように、障害発生通報経路に異常がある場合でも、サーバ装置で障害が発生した時に障害発生通報がコールセンタに届かなくなることを未然に防ぐことが可能になり、信頼性の高いシステムを構築することができる。   In this way, even when there is an abnormality in the failure occurrence notification path, it is possible to prevent the failure occurrence notification from reaching the call center when a failure occurs in the server device, and to build a highly reliable system be able to.

実施の形態3.
本実施の形態では、複数のサーバ装置1と複数の保守センタ7に対応させたコールセンタ装置6を説明する。
Embodiment 3 FIG.
In the present embodiment, a call center device 6 corresponding to a plurality of server devices 1 and a plurality of maintenance centers 7 will be described.

図7は、本実施の形態に係るコールセンタ装置6の構成例を示す。
図示は省略しているが本実施の形態に係るコールセンタ装置6は複数のサーバ装置1にネットワーク接続されている。
また、本実施の形態に係るコールセンタ装置6は、複数の保守センタ7とネットワーク接続されている。
FIG. 7 shows a configuration example of the call center device 6 according to the present embodiment.
Although not shown, the call center device 6 according to the present embodiment is connected to a plurality of server devices 1 via a network.
Further, the call center device 6 according to the present embodiment is connected to a plurality of maintenance centers 7 through a network.

図7は、図6に示した通報確認部8をソフトウェアとして実現している例を示す。
つまり、サーバ群監視情報記憶部800において、サーバ装置ごとの記憶ブロックを設け、各記憶ブロックに図6に示した通報確認部8を実現するためのデータを格納している。
サーバ1対応情報ブロック810は、サーバ番号1のサーバ装置1に対する記憶ブロックであり、サーバn対応情報ブロック8n0は、サーバ番号nのサーバ装置1に対する記憶ブロックである。
以下では、サーバ1対応情報ブロック810を例にして、記憶ブロック内の構成を説明する。
FIG. 7 shows an example in which the notification confirmation unit 8 shown in FIG. 6 is realized as software.
That is, in the server group monitoring information storage unit 800, a storage block is provided for each server device, and data for realizing the notification confirmation unit 8 shown in FIG. 6 is stored in each storage block.
The server 1 correspondence information block 810 is a storage block for the server device 1 with the server number 1, and the server n correspondence information block 8n0 is a storage block for the server device 1 with the server number n.
Hereinafter, the configuration in the storage block will be described using the server 1 correspondence information block 810 as an example.

障害通報受信カウンタ811は、図6に示した障害通報受信カウンタ81と同様に動作し、障害発生通報パケットの受信回数を計数する。
障害通報送信回数受信部812は、図6に示した障害通報送信回数受信部82と同様に動作し、通報通知解析部80から障害発生回数通知パケットのデータ部の数値(障害発生回数)を記憶する。
通知受信間隔計測タイマ814は、図6に示した通知受信間隔計測タイマ84と同様に動作し、障害発生回数通知パケットを受信してからの経過時間を計測する。
受信間隔設定部815は、図6に示した受信間隔設定部85と同様に動作し、通知受信間隔計測タイマ814の計測時間をセットする。
アドレス設定部816は、サーバ番号1のサーバ装置1の通信アドレスを格納している。
サーバ1近隣保守センタアドレス817は、サーバ番号1のサーバ装置1の近隣に設置されている保守センタ7の保守センタ装置70の通信アドレスを格納している。
サーバ1有効フラグ818は、サーバ1対応情報ブロック810が登録済で有効であることを示す。
The failure notification reception counter 811 operates in the same manner as the failure notification reception counter 81 shown in FIG. 6, and counts the number of receptions of the failure occurrence notification packet.
The failure notification transmission frequency reception unit 812 operates in the same manner as the failure notification transmission frequency reception unit 82 shown in FIG. 6, and stores the numerical value (failure occurrence frequency) of the data portion of the failure occurrence frequency notification packet from the notification notification analysis unit 80. To do.
The notification reception interval measurement timer 814 operates in the same manner as the notification reception interval measurement timer 84 shown in FIG. 6, and measures the elapsed time after receiving the failure occurrence frequency notification packet.
The reception interval setting unit 815 operates in the same manner as the reception interval setting unit 85 illustrated in FIG. 6 and sets the measurement time of the notification reception interval measurement timer 814.
The address setting unit 816 stores the communication address of the server device 1 with the server number 1.
The server 1 neighboring maintenance center address 817 stores the communication address of the maintenance center device 70 of the maintenance center 7 installed in the vicinity of the server device 1 with the server number 1.
The server 1 validity flag 818 indicates that the server 1 correspondence information block 810 has been registered and is valid.

なお、本実施の形態では、図6に示した比較部83の動作は制御部61が行うものとする。
つまり、本実施の形態では、例えばサーバ番号1のサーバ装置1の場合では、制御部61が障害通報受信カウンタ811のカウンタ値と障害通報送信回数受信部812の値とを比較する。
なお、コールセンタ装置6の他の要素は図6と同じであり、説明を省略する。
In the present embodiment, it is assumed that the operation of the comparison unit 83 shown in FIG.
That is, in the present embodiment, for example, in the case of the server device 1 with the server number 1, the control unit 61 compares the counter value of the failure notification reception counter 811 with the value of the failure notification transmission count reception unit 812.
The other elements of the call center device 6 are the same as those in FIG.

次に動作について説明する。
各サーバ装置1における障害発生時の通報および正常時の障害発生回数通知については実施の形態1と同様に行われる。
ここでは、図13〜図16を参照して、通報および通知を受信したコールセンタ装置6での動作を中心に述べる。
なお、図13は、本実施の形態に係るコールセンタ装置6において周期的に実行される通報関連処理の手順例を示す。
図14は、本実施の形態に係るコールセンタ装置6が障害発生通報を受信した際の障害発生通報処理の手順例であり、図13のST300の詳細を示す。
図15は、本実施の形態に係るコールセンタ装置6が障害発生回数通知を受信した際の障害発生回数通知処理の手順例であり、図13のST400の詳細を示す。
図16は、本実施の形態に係るコールセンタ装置6の経路障害確認処理の手順例であり、全てのサーバ装置において通信経路故障による通知の受信タイムアウトが発生していないかを周期的にチェックする動作を示す。
図16は、図13のST500の詳細を示す。
Next, the operation will be described.
The notification when a failure occurs in each server device 1 and the notification of the number of occurrences of failure at normal times are performed in the same manner as in the first embodiment.
Here, with reference to FIGS. 13 to 16, the operation in the call center device 6 that has received the notification and notification will be mainly described.
FIG. 13 shows an example of a procedure of notification-related processing that is periodically executed in the call center device 6 according to the present embodiment.
FIG. 14 is a procedure example of the failure occurrence notification process when the call center device 6 according to the present embodiment receives the failure occurrence notification, and shows details of ST300 in FIG.
FIG. 15 is a procedure example of the failure occurrence frequency notification process when the call center device 6 according to the present embodiment receives the failure occurrence frequency notification, and shows details of ST400 in FIG.
FIG. 16 is a procedure example of the route failure confirmation process of the call center device 6 according to the present embodiment, and an operation for periodically checking whether a notification reception timeout due to a communication route failure has occurred in all server devices. Indicates.
FIG. 16 shows details of ST500 in FIG.

サーバ装置1からの障害発生通報パケットを通報通知受信部62で受信する(図13のST201でYES)と、通報通知解析部80がパケットのコマンド部を取り出して(ST202)パケットを解析し、障害発生通報パケットであることを確認する(ST203でYES)。
このため、障害発生通報処理(ST300)(図14)が行われる。
When the failure notification packet from server device 1 is received by notification notification receiver 62 (YES in ST201 in FIG. 13), notification notification analyzer 80 extracts the command part of the packet (ST202), analyzes the packet, It is confirmed that the packet is an occurrence notification packet (YES in ST203).
For this reason, failure occurrence notification processing (ST300) (FIG. 14) is performed.

障害発生通報処理(ST300)では、制御部61が、障害発生通報パケットの送信元アドレスを読み出す(図14のST301)とともに、サーバ群監視情報記憶部800の記憶ブロックの配置順にアドレス設定部816・・・8n6を読み出し(ST302、ST303)、読み出したアドレス設定部のアドレスと障害発生通信パケットの送信元アドレスとの比較を行う(ST304)。
一致しない場合(ST304でNO)は、次の記憶ブロックのアドレス設定部を読み出して(ST309、ST310、ST303)、障害発生通報パケットの送信元アドレスとの比較を行う(ST304)。
In the failure occurrence notification process (ST300), the control unit 61 reads out the transmission source address of the failure occurrence notification packet (ST301 in FIG. 14), and in the order of storage block arrangement in the server group monitoring information storage unit 800, the address setting unit 816. .. 8n6 is read (ST302 and ST303), and the address of the read address setting unit is compared with the transmission source address of the faulty communication packet (ST304).
If they do not match (NO in ST304), the address setting unit of the next storage block is read (ST309, ST310, ST303) and compared with the source address of the failure notification packet (ST304).

一方、ST304でYESの場合は、当該アドレス設定部が含まれている記憶ブロックに対応するサーバ装置1からの通報であり、制御部61は、その記憶ブロックを選択する。
以下では、サーバ1対応情報ブロック810を選択したとして説明を進める。
制御部61は、障害通報受信カウンタ811の内容をインクリメント(+1)するとともに、サーバ1近隣保守センタアドレス817に格納されているサーバ番号1のサーバ装置1の近隣にある保守センタ7のアドレス(保守センタ装置70のアドレス)を通知生成部63に通知メッセージ66の送信先として通知する(ST305)。
また、制御部61は、障害発生通報パケットのデータ部の障害発生個所を示すコードを通知生成部63に通知する(ST306)。
また、制御部61は、通知生成部63が通知メッセージ66を生成するにあたって他に必要なデータがあれば、そのデータを通知生成部63に通知する(ST307)。
次に、通知生成部63が通知メッセージ66を生成し、通知蓄積部64に蓄積された後に、通知出力部65が通知メッセージ66を送信する(ST308)。
通知メッセージ66の送信先は、ST305で抽出された、サーバ番号1のサーバ装置1の近隣にある保守センタ7の保守センタ装置70である。
On the other hand, in the case of YES in ST304, this is a notification from the server device 1 corresponding to the storage block in which the address setting unit is included, and the control unit 61 selects the storage block.
In the following description, it is assumed that the server 1 correspondence information block 810 has been selected.
The control unit 61 increments (+1) the contents of the failure notification reception counter 811 and addresses the maintenance center 7 in the vicinity of the server device 1 with the server number 1 stored in the server 1 neighboring maintenance center address 817 (maintenance). The address of the center device 70) is notified to the notification generation unit 63 as the transmission destination of the notification message 66 (ST305).
In addition, control unit 61 notifies notification generation unit 63 of a code indicating the location of the failure occurrence in the data portion of the failure occurrence notification packet (ST306).
In addition, if there is other data necessary for the notification generation unit 63 to generate the notification message 66, the control unit 61 notifies the notification generation unit 63 of the data (ST307).
Next, after the notification generation unit 63 generates the notification message 66 and stores it in the notification storage unit 64, the notification output unit 65 transmits the notification message 66 (ST308).
The transmission destination of the notification message 66 is the maintenance center device 70 of the maintenance center 7 in the vicinity of the server device 1 with the server number 1 extracted in ST305.

この後、障害発生の通知を受けた保守センタ7から保守員がサーバ装置1の設置場所に派遣され、障害発生箇所の交換が行われてシステムは正常に復帰する。   Thereafter, a maintenance staff is dispatched from the maintenance center 7 that has received the notification of the occurrence of the failure to the installation location of the server device 1, the location of the failure is replaced, and the system returns to normal.

もしも、サーバ側ルータ50が障害で一時的に動作を停止している間にサーバ装置1で何らかの障害が発生すると、障害発生前に障害通報送信カウンタ24の値がNだった場合には、コールセンタ装置6へ障害発生通報パケットは届かないが、サーバ装置1からは障害発生通報パケットは送出されているので障害通報送信カウンタ24の値はN+1になる。
その後、サーバ側ルータ50が障害から復旧すると、送信間隔計測タイマ26に設定されていただけの時間が経過した時に、N+1をデータ部に設定した障害通報回数通知パケットがコールセンタ装置6に送信される。
If any failure occurs in the server device 1 while the server side router 50 is temporarily stopped due to a failure, if the value of the failure notification transmission counter 24 is N before the failure occurs, Although the failure occurrence notification packet does not reach the device 6, since the failure occurrence notification packet is transmitted from the server device 1, the value of the failure notification transmission counter 24 becomes N + 1.
Thereafter, when the server-side router 50 recovers from the failure, a failure notification frequency notification packet in which N + 1 is set in the data portion is transmitted to the call center device 6 when the time just set in the transmission interval measurement timer 26 has elapsed.

障害通報回数通知パケットを受信したコールセンタ装置6では、サーバ装置1からの障害発生通報パケットを通報通知受信部62で受信する(図13のST201でYES)と、通報通知解析部80がパケットのコマンド部を取り出して(ST202)パケットを解析し、障害発生回数通知パケットであることを確認する(ST203でNO、ST204でYES)。
このため、障害発生回数通知処理(ST400)(図15)が行われる。
In the call center device 6 that has received the failure notification count notification packet, when the failure notification packet from the server device 1 is received by the notification notification receiving unit 62 (YES in ST201 of FIG. 13), the notification notification analysis unit 80 uses the packet command. (ST202), the packet is analyzed, and it is confirmed that it is a failure occurrence frequency notification packet (NO in ST203, YES in ST204).
Therefore, the failure occurrence frequency notification process (ST400) (FIG. 15) is performed.

障害発生回数通知処理(ST400)では、制御部61が、障害発生回数通知パケットの送信元アドレスを読み出す(図15のST401)とともに、サーバ群監視情報記憶部800の記憶ブロックの配置順にアドレス設定部816・・・8n6を読み出し(ST402、ST403)、読み出したアドレス設定部のアドレスと障害発生回数通知パケットの送信元アドレスとの比較を行う(ST404)。
一致しない場合(ST404でNO)は、次の記憶ブロックのアドレス設定部を読み出して(ST414、ST415、ST403)、障害発生回数通知パケットの送信元アドレスとの比較を行う(ST404)。
In the failure occurrence frequency notification process (ST400), the control unit 61 reads the transmission source address of the failure occurrence frequency notification packet (ST401 in FIG. 15) and addresses setting units in the order of storage blocks in the server group monitoring information storage unit 800. 816... 8n6 are read (ST402, ST403), and the read address setting unit address is compared with the source address of the failure occurrence frequency notification packet (ST404).
If they do not match (NO in ST404), the address setting unit of the next storage block is read (ST414, ST415, ST403) and compared with the source address of the failure occurrence frequency notification packet (ST404).

一方、ST404でYESの場合は、当該アドレス設定部が含まれている記憶ブロックに対応するサーバ装置1からの通報であり、制御部61は、その記憶ブロックを選択する。
以下では、サーバ1対応情報ブロック810を選択したとして説明を進める。
制御部61は、次に、受信間隔設定部815に格納されている受信間隔の値を通知受信間隔計測タイマ814にセットして、通知受信間隔計測タイマ814のカウントダウンとを開始させる(ST405)。
次に、制御部61は、障害発生回数通知パケットのデータ部に格納されている障害発生回数を読み出し、読み出した障害発生回数を障害通報送信回数受信部812に格納する(ST406)。
そして、制御部61は、障害通報受信カウンタ811からカウンタ値を読み出すとともに(ST407)、障害通報送信回数受信部812から障害発生回数を読み出して、両者を比較する(ST408)。
障害通報受信カウンタ811の内容と、障害通報送信回数受信部812の内容が等しければ(ST408でYES)、制御部61は処理を終了する。
一方、障害通報受信カウンタ811の値がN、障害通報送信回数受信部812の値がN+1である場合には、不一致であり(ST408でNO)、制御部61は、サーバ1近隣保守センタアドレス817に格納されているサーバ番号1のサーバ装置1の近隣にある保守センタ7のアドレス(保守センタ装置70のアドレス)を通知生成部63に警告メッセージの送信先として通知する(ST409)。
また、制御部61は、通信経路故障を示すメッセージを通知生成部63に通知する(ST410)。
また、制御部61は、通知生成部63が警告メッセージを生成するにあたって他に必要なデータがあれば、そのデータを通知生成部63に通知する(ST411)。
次に、通知生成部63が警告メッセージを生成し、通知蓄積部64に蓄積された後に、通知出力部65が警告メッセージを送信する(ST412)。
警告メッセージの送信先は、ST409で抽出された、サーバ番号1のサーバ装置1の近隣にある保守センタ7の保守センタ装置70である。
そして、次回の比較に備え、障害通報送信回数受信部812の値N+1を障害通報受信カウンタ811にセットする(ST413)。
On the other hand, in the case of YES in ST404, it is a notification from the server device 1 corresponding to the storage block including the address setting unit, and the control unit 61 selects the storage block.
In the following description, it is assumed that the server 1 correspondence information block 810 has been selected.
Next, control unit 61 sets the value of the reception interval stored in reception interval setting unit 815 in notification reception interval measurement timer 814, and starts the countdown of notification reception interval measurement timer 814 (ST405).
Next, control unit 61 reads the number of failure occurrences stored in the data part of the failure occurrence count notification packet, and stores the read failure occurrence count in failure report transmission count reception unit 812 (ST406).
Then, control unit 61 reads the counter value from failure notification reception counter 811 (ST407), reads the number of failure occurrences from failure notification transmission frequency reception unit 812, and compares the two (ST408).
If the content of failure notification reception counter 811 is equal to the content of failure notification transmission count reception unit 812 (YES in ST408), control unit 61 ends the process.
On the other hand, if the value of the failure notification reception counter 811 is N and the value of the failure notification transmission count reception unit 812 is N + 1, there is a mismatch (NO in ST408), and the control unit 61 determines that the server 1 neighbor maintenance center address 817 The address of the maintenance center 7 in the vicinity of the server apparatus 1 with the server number 1 stored in (the address of the maintenance center apparatus 70) is notified to the notification generation unit 63 as a warning message transmission destination (ST409).
Further, control unit 61 notifies message generation unit 63 of a message indicating a communication path failure (ST410).
In addition, if there is other data necessary for the notification generation unit 63 to generate the warning message, the control unit 61 notifies the notification generation unit 63 of the data (ST411).
Next, after the notification generation unit 63 generates a warning message and stores it in the notification storage unit 64, the notification output unit 65 transmits the warning message (ST412).
The transmission destination of the warning message is the maintenance center device 70 of the maintenance center 7 in the vicinity of the server device 1 with the server number 1 extracted in ST409.
Then, in preparation for the next comparison, the value N + 1 of the failure notification transmission count reception unit 812 is set in the failure notification reception counter 811 (ST413).

その後、通知を受けた保守センタ7では、通知の内容から障害通報経路に異常があり、サーバ番号1のサーバ装置1で障害が発生している可能性がある旨を当該サーバ装置1の管理者に伝えるとともに、障害発生通報パケットとして通報されなかった障害が何であるかを確認するため、保守員71がサーバ設置場所に行き、ログなどを解析して、障害箇所を見極め、部品交換することで、サーバが正常状態に復旧する。
また、サーバ側ルータ50も交換されて、システムが正常状態に戻る。
Thereafter, in the maintenance center 7 that has received the notification, the administrator of the server device 1 indicates that there is a failure in the failure notification path from the content of the notification and that there is a possibility that the server device 1 with the server number 1 has a failure. In order to confirm the failure that was not reported as a failure occurrence notification packet, the maintenance staff 71 goes to the server installation location, analyzes the log, etc., identifies the failure location, and replaces the parts. The server is restored to normal status.
Further, the server side router 50 is also replaced, and the system returns to a normal state.

また、サーバ装置1で障害が発生しなかった場合でも、コールセンタ装置6のサーバ群監視情報記憶部800内に記憶された各サーバに対応する記憶ブロック中の通知受信間隔計測タイマの内容が一定間隔でカウントダウンされる。
あるサーバ装置1から障害発生回数通知パケットを受信すると、通報通知解析部80で解析されて、対応する記憶ブロック中の受信間隔設定部の内容が通知受信間隔計測タイマにセットされる。
通信経路に障害がない場合には、こうして各サーバ装置に対応した通知受信間隔計測タイマがカウントダウン→受信間隔設定部の内容の再セット→カウントダウン→受信間隔設定部の内容の再セットを繰り返す。
ここで、もしも、サーバ側ルータ50に障害が発生した場合、サーバ監視部2からの障害発生回数通知パケットを受信しないため、通知受信間隔計測タイマのカウントダウンが進み、その値がゼロになる。
図13に従って説明すると、制御部61は、単位時間ごとに(ST205)に障害経路確認処理(ST500)を行って、通知受信間隔計測タイマのカウントダウンを進め、カウンタ値がゼロになった場合に、通知生成部63が警告メッセージを生成し、通知出力部65が警告メッセージを送信する。
ここでは、ST205の単位時間を全サーバ装置で共通に1秒とし、受信間隔設定部が通知受信間隔計測タイマに設定する受信間隔を全サーバ装置で共通に1000秒とする例で障害経路確認処理(ST500)を説明する。
Even when no failure has occurred in the server device 1, the content of the notification reception interval measurement timer in the storage block corresponding to each server stored in the server group monitoring information storage unit 800 of the call center device 6 is constant. Will count down.
When a failure occurrence frequency notification packet is received from a certain server device 1, it is analyzed by the notification notification analysis unit 80, and the content of the reception interval setting unit in the corresponding storage block is set in the notification reception interval measurement timer.
If there is no failure in the communication path, the notification reception interval measurement timer corresponding to each server device repeats counting down → resetting the contents of the receiving interval setting unit → counting down → resetting the contents of the receiving interval setting unit.
Here, if a failure occurs in the server-side router 50, the failure reception frequency notification packet from the server monitoring unit 2 is not received, so the countdown of the notification reception interval measurement timer proceeds and the value becomes zero.
Describing according to FIG. 13, the control unit 61 performs the failure path confirmation process (ST500) every unit time (ST205), advances the countdown of the notification reception interval measurement timer, and when the counter value becomes zero, The notification generation unit 63 generates a warning message, and the notification output unit 65 transmits the warning message.
Here, in the example where the unit time of ST205 is 1 second commonly for all server devices, and the reception interval set in the notification reception interval measurement timer by the reception interval setting unit is 1000 seconds commonly for all server devices, the failure path confirmation processing (ST500) will be described.

ST205により1秒ごとに経路障害確認処理(ST500)が開始される。
経路障害確認処理(ST500)では、制御部61が、サーバ群監視情報記憶部800の記憶ブロックの配置順にサーバ1有効フラグ818・・・8n8を読み出し(図16のST501、ST502)、フラグ有効になっている記憶ブロックの通知受信間隔計測タイマ814・・・8n4のカウンタ値をデクリメント(−1)させ(ST503)、カウンタ値がゼロになっていなければ(ST504でNO)、次の記憶ブロックの有効フラグを確認する(ST509、ST510、ST502)。
全ての記憶ブロックに対して処理が終了すると(ST509でYES)、制御部61は経路障害確認処理(ST500)を終了し、次の1秒が経過するのを待つ。
一方、カウンタ値をデクリメントした結果カウンタ値がゼロになれば(障害発生回数通知パケットを受信していない時間が閾値である1000秒を超えたら)(ST504でYES)、制御部61は、S505に処理を進める。
ここでは、サーバ1対応情報ブロック810の通知受信間隔計測タイマ814のカウンタ値がゼロになった場合、すなわち、サーバ番号1のサーバ装置1からの障害発生回数通知パケットを1000秒以上受信していない場合を例にして説明する。
制御部61は、サーバ1近隣保守センタアドレス817に格納されているサーバ装置1の近隣にある保守センタ7のアドレスを通知生成部63に警告メッセージの送信先として通知する(ST505)。
また、制御部61は、通信経路故障を示すメッセージを通知生成部63に通知する(ST506)。
また、制御部61は、通知生成部63が警告メッセージを生成するにあたって他に必要なデータがあれば、そのデータを通知生成部63に通知する(ST507)。
次に、通知生成部63が警告メッセージを生成し、通知蓄積部64に蓄積された後に、通知出力部65が警告メッセージを送信する(ST508)。
警告メッセージの送信先は、ST505で抽出された、サーバ番号1のサーバ装置1の近隣にある保守センタ7の保守センタ装置70である。
通知生成部63による警告メッセージの送信及び通知出力部65による警告メッセージの送信に並行して、制御部61はST509以降の処理を進め、全ての記憶ブロックに対して処理が終了すると(ST509でYES)、制御部61は経路障害確認処理(ST500)を終了し、次の1秒が経過するのを待つ。
A route failure confirmation process (ST500) is started every second by ST205.
In the route failure confirmation process (ST500), the control unit 61 reads the server 1 valid flag 818... 8n8 in the order of storage block arrangement in the server group monitoring information storage unit 800 (ST501 and ST502 in FIG. 16) and makes the flag valid. The counter value of the notification reception interval measurement timer 814... 8n4 of the memory block in question is decremented (−1) (ST503), and if the counter value is not zero (NO in ST504), the next memory block The valid flag is confirmed (ST509, ST510, ST502).
When processing is completed for all storage blocks (YES in ST509), control unit 61 ends path failure confirmation processing (ST500) and waits for the next one second to elapse.
On the other hand, if the counter value becomes zero as a result of decrementing the counter value (if the time during which no failure occurrence notification packet is received exceeds the threshold value of 1000 seconds) (YES in ST504), the control unit 61 proceeds to S505. Proceed with the process.
Here, when the counter value of the notification reception interval measurement timer 814 of the server 1 correspondence information block 810 becomes zero, that is, the failure occurrence frequency notification packet from the server device 1 of the server number 1 has not been received for 1000 seconds or more. A case will be described as an example.
Control unit 61 notifies notification generation unit 63 of the address of maintenance center 7 in the vicinity of server device 1 stored in server 1 neighboring maintenance center address 817 (ST505).
Further, control unit 61 notifies message generation unit 63 of a message indicating a communication path failure (ST506).
In addition, if there is other data necessary for notification generation unit 63 to generate a warning message, control unit 61 notifies notification generation unit 63 of the data (ST507).
Next, after the notification generation unit 63 generates a warning message and stores it in the notification storage unit 64, the notification output unit 65 transmits the warning message (ST508).
The destination of the warning message is the maintenance center device 70 of the maintenance center 7 in the vicinity of the server device 1 with the server number 1 extracted in ST505.
In parallel with the transmission of the warning message by the notification generation unit 63 and the transmission of the warning message by the notification output unit 65, the control unit 61 proceeds with the processing after ST509, and when the processing is completed for all the storage blocks (YES in ST509). ), The control unit 61 ends the route failure confirmation process (ST500) and waits for the next one second to elapse.

通知出力部65により警告メッセージが送信されると、通知を受けた保守センタ7では、通知の内容から障害通報経路に異常がある旨をサーバ装置1の管理者に伝えるとともに、通信経路の障害箇所を確認するとともに通報されなかった障害がないかを確認するため、保守員71がサーバ設置場所に行き、サーバ側ルータ50の障害であることを見極め、交換するとともに、サーバ装置1自体には障害はないことを確認することでシステムが正常状態に戻る。   When the warning message is transmitted by the notification output unit 65, the maintenance center 7 that has received the notification informs the administrator of the server apparatus 1 that there is an abnormality in the failure notification path from the content of the notification, and also indicates the location of the failure in the communication path. In order to check whether there is a failure that has not been reported, the maintenance staff 71 goes to the server installation location, identifies the failure of the server side router 50, replaces it, and the server device 1 itself has a failure. Confirm that there is no error, and the system will return to normal.

以上のように、複数のサーバ装置についてサーバ装置もしくは障害発生通報経路に異常が発生した場合でも、障害の発生を検出できるとともに、場合によってはサーバ装置での障害が発生した時に障害発生通報がコールセンタに届かなくなることを未然に防ぐことが可能になるため、信頼性の高いシステムを構築することができる。   As described above, even when an abnormality occurs in the server device or the failure occurrence notification path for a plurality of server devices, the occurrence of the failure can be detected, and in some cases, when the failure occurs in the server device, the failure occurrence notification is sent to the call center. Therefore, it is possible to construct a highly reliable system.

以上、実施の形態1〜3では、
サーバ装置の障害発生を監視するサーバ監視部に障害通報送信カウンタを設け、障害通報を受信するコールセンタ装置にはサーバ装置毎に障害通報受信カウンタを設け、サーバ装置で障害が発生したことを検出した監視部は障害発生を通報する度に障害通報送信カウンタを+1し、コールセンタ装置側では障害通報を受信する度に障害通報受信カウンタを+1し、
サーバ監視部は定期的に障害通報送信カウンタの内容をコールセンタ装置に送信するようにし、コールセンタ装置で、サーバ監視部から送信されてきた障害通報送信カウンタの内容と障害通報受信カウンタの内容を比較し、
コールセンタ装置で両者が一致しないことを検出した場合には、監視対象のサーバ装置とコールセンタ装置間の通信経路に障害が発生したか、設定に誤りがあることを検出でき、保守センタに通知できるので、通信経路断などの障害が発生したことを素早く検出でき、対処することができるようになり、システムの信頼性を上げることができるシステムを説明した。
As described above, in the first to third embodiments,
The server monitoring unit that monitors the occurrence of a failure in the server device is provided with a failure notification transmission counter, and the call center device that receives the failure notification is provided with a failure notification reception counter for each server device to detect that a failure has occurred in the server device. The monitoring unit increments the trouble report transmission counter by +1 every time it reports the occurrence of a trouble, and the call center device side increments the trouble report reception counter by +1 each time a trouble report is received.
The server monitoring unit periodically transmits the content of the failure notification transmission counter to the call center device, and the call center device compares the content of the failure notification transmission counter transmitted from the server monitoring unit with the content of the failure notification reception counter. ,
If the call center device detects that the two do not match, it can detect that a failure has occurred in the communication path between the monitored server device and the call center device or that there is an error in the settings, and can notify the maintenance center. A system that can quickly detect and deal with the occurrence of a failure such as a communication path interruption and improve the reliability of the system has been described.

なお、以上の説明では、サーバ装置1における障害の発生をコールセンタ装置6に通知する例を説明したが、通知する内容は障害の発生に限らない。
サーバ装置1における所定のイベントの発生を通知するイベント通知をコールセンタ装置6に送信するシステム構成において、サーバ装置1でイベント通知の送信回数を計数し、コールセンタ装置6でイベント通知の受信回数を計数し、所定の間隔でサーバ装置1がイベント通知の送信回数を通知するようにしてもよい。
また、イベント通知を送受信する装置は、サーバ装置1とコールセンタ装置6に限定されない。
In the above description, an example in which the occurrence of a failure in the server device 1 is notified to the call center device 6 has been described. However, the content to be notified is not limited to the occurrence of a failure.
In a system configuration in which an event notification for notifying the occurrence of a predetermined event in the server device 1 is transmitted to the call center device 6, the server device 1 counts the number of event notification transmissions, and the call center device 6 counts the number of event notification receptions. The server device 1 may notify the number of event notification transmissions at predetermined intervals.
Further, the device that transmits and receives the event notification is not limited to the server device 1 and the call center device 6.

最後に、実施の形態1〜3に示したサーバ装置1及びコールセンタ装置6のハードウェア構成例について説明する。
図17は、実施の形態1〜3に示すサーバ装置1及びコールセンタ装置6のハードウェア資源の一例を示す図である。
なお、図17の構成は、あくまでもサーバ装置1及びコールセンタ装置6のハードウェア構成の一例を示すものであり、サーバ装置1及びコールセンタ装置6のハードウェア構成は図17に記載の構成に限らず、他の構成であってもよい。
Finally, hardware configuration examples of the server device 1 and the call center device 6 described in the first to third embodiments will be described.
FIG. 17 is a diagram illustrating an example of hardware resources of the server device 1 and the call center device 6 described in the first to third embodiments.
The configuration in FIG. 17 is merely an example of the hardware configuration of the server device 1 and the call center device 6, and the hardware configuration of the server device 1 and the call center device 6 is not limited to the configuration described in FIG. Other configurations may be used.

図17において、サーバ装置1及びコールセンタ装置6は、プログラムを実行するCPU911(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。
CPU911は、バス912を介して、例えば、ROM(Read Only Memory)913、RAM(Random Access Memory)914、通信ボード915、表示装置901、キーボード902、マウス903、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。
更に、CPU911は、FDD904(Flexible Disk Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907と接続していてもよい。また、磁気ディスク装置920の代わりに、SSD(Solid State Drive)、光ディスク装置、メモリカード(登録商標)読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置の一例である。
実施の形態1〜3で説明した通知蓄積部64又はサーバ群監視情報記憶部800は、RAM914、磁気ディスク装置920等により実現される。
通信ボード915、キーボード902、マウス903、スキャナ装置907、FDD904などは、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは出力装置の一例である。
In FIG. 17, the server device 1 and the call center device 6 include a CPU 911 (also referred to as a central processing unit, a central processing unit, a processing unit, an arithmetic unit, a microprocessor, a microcomputer, and a processor) that executes a program.
The CPU 911 is connected to, for example, a ROM (Read Only Memory) 913, a RAM (Random Access Memory) 914, a communication board 915, a display device 901, a keyboard 902, a mouse 903, and a magnetic disk device 920 via a bus 912. Control hardware devices.
Further, the CPU 911 may be connected to an FDD 904 (Flexible Disk Drive), a compact disk device 905 (CDD), a printer device 906, and a scanner device 907. Further, instead of the magnetic disk device 920, a storage device such as an SSD (Solid State Drive), an optical disk device, or a memory card (registered trademark) read / write device may be used.
The RAM 914 is an example of a volatile memory. The storage media of the ROM 913, the FDD 904, the CDD 905, and the magnetic disk device 920 are an example of a nonvolatile memory. These are examples of the storage device.
The notification storage unit 64 or the server group monitoring information storage unit 800 described in the first to third embodiments is realized by the RAM 914, the magnetic disk device 920, and the like.
A communication board 915, a keyboard 902, a mouse 903, a scanner device 907, an FDD 904, and the like are examples of input devices.
The communication board 915, the display device 901, the printer device 906, and the like are examples of output devices.

通信ボード915は、図1に示すように、ネットワークに接続されている。
例えば、通信ボード915は、LAN(ローカルエリアネットワーク)、インターネット、WAN(ワイドエリアネットワーク)、SAN(ストレージエリアネットワーク)などに接続されていても構わない。
As shown in FIG. 1, the communication board 915 is connected to a network.
For example, the communication board 915 may be connected to a LAN (local area network), the Internet, a WAN (wide area network), a SAN (storage area network), or the like.

磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。
プログラム群923のプログラムは、CPU911がオペレーティングシステム921、ウィンドウシステム922を利用しながら実行する。
The magnetic disk device 920 stores an operating system 921 (OS), a window system 922, a program group 923, and a file group 924.
The programs in the program group 923 are executed by the CPU 911 using the operating system 921 and the window system 922.

また、RAM914には、CPU911に実行させるオペレーティングシステム921のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。
また、RAM914には、CPU911による処理に必要な各種データが格納される。
The RAM 914 temporarily stores at least part of the operating system 921 program and application programs to be executed by the CPU 911.
The RAM 914 stores various data necessary for processing by the CPU 911.

また、ROM913には、BIOS(Basic Input Output System)プログラムが格納され、磁気ディスク装置920にはブートプログラムが格納されている。
サーバ装置1及びコールセンタ装置6の起動時には、ROM913のBIOSプログラム及び磁気ディスク装置920のブートプログラムが実行され、BIOSプログラム及びブートプログラムによりオペレーティングシステム921が起動される。
The ROM 913 stores a BIOS (Basic Input Output System) program, and the magnetic disk device 920 stores a boot program.
When the server device 1 and the call center device 6 are activated, the BIOS program in the ROM 913 and the boot program in the magnetic disk device 920 are executed, and the operating system 921 is activated by the BIOS program and the boot program.

上記プログラム群923には、実施の形態1〜3の説明において「〜部」(通知蓄積部64及びサーバ群監視情報記憶部800以外、以下同様)として説明している機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。   The program group 923 stores a program that executes a function described as “˜unit” (except for the notification accumulation unit 64 and the server group monitoring information storage unit 800) in the description of the first to third embodiments. Has been. The program is read and executed by the CPU 911.

ファイル群924には、実施の形態1〜3の説明において、「〜の判断」、「〜の計算」、「〜の比較」、「〜の読み出し」、「〜の更新」、「〜の設定」、「〜の登録」、「〜の選択」、「〜の入力」、「〜の出力」等として説明している処理の結果を示す情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。
「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。
ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出される。
そして、読み出された情報やデータや信号値や変数値やパラメータは、抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示などのCPUの動作に用いられる。
抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリ、レジスタ、キャッシュメモリ、バッファメモリ等に一時的に記憶される。
また、実施の形態1〜3で説明しているフローチャートの矢印の部分は主としてデータや信号の入出力を示す。
データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD等の記録媒体に記録される。
また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
In the file group 924, in the description of the first to third embodiments, “determination of”, “calculation of”, “comparison of”, “reading of”, “update of”, and “setting of” are set. ”,“ Registration of ”,“ selection of ”,“ input of ”,“ output of ”, etc., information, data, signal values, variable values, and parameters indicating the results of the processing are“ It is stored as each item of "~ file" and "~ database".
The “˜file” and “˜database” are stored in a recording medium such as a disk or a memory.
Information, data, signal values, variable values, and parameters stored in a storage medium such as a disk or memory are read out to the main memory or cache memory by the CPU 911 via a read / write circuit.
The read information, data, signal value, variable value, and parameter are used for CPU operations such as extraction, search, reference, comparison, calculation, calculation, processing, editing, output, printing, and display.
Information, data, signal values, variable values, and parameters are stored in the main memory, registers, cache memory, and buffers during the CPU operations of extraction, search, reference, comparison, calculation, processing, editing, output, printing, and display. It is temporarily stored in a memory or the like.
In addition, the arrows in the flowcharts described in Embodiments 1 to 3 mainly indicate input and output of data and signals.
Data and signal values are recorded on a recording medium such as a memory of the RAM 914, a flexible disk of the FDD 904, a compact disk of the CDD 905, a magnetic disk of the magnetic disk device 920, other optical disks, a mini disk, and a DVD.
Data and signals are transmitted online via a bus 912, signal lines, cables, or other transmission media.

また、実施の形態1〜3の説明において「〜部」として説明しているものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。
すなわち、実施の形態1〜3で説明したフローチャートに示すステップ、手順、処理により、本発明を方法の発明として把握することができる。
また、「〜部」として説明しているものは、ROM913に記憶されたファームウェアで実現されていても構わない。
或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。
ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。
プログラムはCPU911により読み出され、CPU911により実行される。
すなわち、プログラムは、実施の形態1〜3の「〜部」としてコンピュータを機能させるものである。あるいは、実施の形態1〜3の「〜部」の手順や方法をコンピュータに実行させるものである。
In addition, what is described as “˜unit” in the description of the first to third embodiments may be “˜circuit”, “˜device”, “˜device”, and “˜step”, It may be “˜procedure” or “˜processing”.
That is, the present invention can be grasped as a method invention by the steps, procedures, and processes shown in the flowcharts described in the first to third embodiments.
Further, what is described as “˜unit” may be realized by firmware stored in the ROM 913.
Alternatively, it may be implemented only by software, or only by hardware such as elements, devices, substrates, and wirings, by a combination of software and hardware, or by a combination of firmware.
Firmware and software are stored as programs in a recording medium such as a magnetic disk, a flexible disk, an optical disk, a compact disk, a mini disk, and a DVD.
The program is read by the CPU 911 and executed by the CPU 911.
That is, the program causes the computer to function as “to part” in the first to third embodiments. Alternatively, the computer executes the procedure and method of “to part” in the first to third embodiments.

このように、実施の形態1〜3に示すサーバ装置1及びコールセンタ装置6は、処理装置たるCPU、記憶装置たるメモリ、磁気ディスク等、入力装置たるキーボード、マウス、通信ボード等、出力装置たる表示装置、通信ボード等を備えるコンピュータである。
そして、上記したように「〜部」として示された機能をこれら処理装置、記憶装置、入力装置、出力装置を用いて実現するものである。
As described above, the server device 1 and the call center device 6 shown in the first to third embodiments have a display as an output device such as a CPU as a processing device, a memory as a storage device, a magnetic disk, a keyboard as an input device, a mouse, a communication board, and the like. A computer including a device, a communication board, and the like.
Then, as described above, the functions indicated as “˜units” are realized using these processing devices, storage devices, input devices, and output devices.

1 サーバ装置、2 サーバ監視部、5 通信回線、6 コールセンタ装置、7 保守センタ、8 通報確認部、9 通信回線、21 障害検出部、22 通報通知作成部、23 通報通知送信部、24 障害通報送信カウンタ、25 送信間隔設定部、26 送信間隔計測タイマ、27 要求信号、50 サーバ側ルータ、60 センタ側ルータ、61 制御部、62 通報通知受信部、63 通知生成部、64 通知蓄積部、65 通知出力部、66 通知メッセージ、70 保守センタ装置、71 保守員、80 通報通知解析部、81 障害通報受信カウンタ、82 障害通報送信回数受信部、83 比較部、84 通知受信間隔計測タイマ、85 受信間隔設定部、800 サーバ群監視情報記憶部、810 サーバ1対応情報ブロック、811 障害通報受信カウンタ、812 障害通報送信回数受信部、814 通知受信間隔計測タイマ、815 受信間隔設定部、816 アドレス設定部、817 サーバ1近隣保守センタアドレス、818 サーバ1有効フラグ。   DESCRIPTION OF SYMBOLS 1 Server apparatus, 2 Server monitoring part, 5 Communication line, 6 Call center apparatus, 7 Maintenance center, 8 Notification confirmation part, 9 Communication line, 21 Failure detection part, 22 Notification notification preparation part, 23 Notification notification transmission part, 24 Fault notification Transmission counter, 25 Transmission interval setting unit, 26 Transmission interval measurement timer, 27 Request signal, 50 Server side router, 60 Center side router, 61 Control unit, 62 Notification notification reception unit, 63 Notification generation unit, 64 Notification storage unit, 65 Notification output unit, 66 Notification message, 70 Maintenance center device, 71 Maintenance staff, 80 Report notification analysis unit, 81 Fault report reception counter, 82 Fault report transmission count reception unit, 83 Comparison unit, 84 Notification reception interval measurement timer, 85 reception Interval setting unit, 800 server group monitoring information storage unit, 810 server 1 correspondence information block, 811 Reception counter, 812 fault notification transmission number receiving section, 814 notifies reception interval measuring timer, 815 reception interval setting unit, 816 an address setting unit, 817 the server 1 close maintenance center address, 818 server 1 valid flag.

Claims (12)

所定のイベントが発生した際に、イベントの発生を通知するイベント通知を生成するイベント通知生成部と、
前記イベント通知生成部により生成されたイベント通知を所定の管理装置に対して送信するイベント通知送信部と、
前記イベント通知送信部によりイベント通知が送信される度に、イベント通知の送信回数を計数するイベント通知送信回数計数部と、
所定の間隔で、前記イベント通知送信回数計数部により計数されたイベント通知の送信回数を通知する送信回数通知を生成する送信回数通知生成部と、
前記送信回数通知生成部により生成された送信回数通知を前記管理装置に対して送信する送信回数通知送信部とを有することを特徴とする情報処理装置。
An event notification generator for generating an event notification for notifying the occurrence of an event when a predetermined event occurs;
An event notification transmitter for transmitting the event notification generated by the event notification generator to a predetermined management device;
Each time an event notification is transmitted by the event notification transmission unit, an event notification transmission number counting unit that counts the number of event notification transmissions,
A transmission frequency notification generating unit for generating a transmission frequency notification for notifying the transmission frequency of the event notification counted by the event notification transmission frequency counting unit at a predetermined interval;
An information processing apparatus comprising: a transmission frequency notification transmission unit that transmits the transmission frequency notification generated by the transmission frequency notification generation unit to the management device.
前記情報処理装置は、
所定の監視対象物における障害を検出し、障害検出イベントを発生させる障害検出部を有し、
前記イベント通知生成部は、
前記障害検出部により障害検出イベントが発生した場合に、障害検出イベントを通知するイベント通知を生成することを特徴とする請求項1に記載の情報処理装置。
The information processing apparatus includes:
A fault detection unit that detects a fault in a predetermined monitoring target and generates a fault detection event;
The event notification generation unit
The information processing apparatus according to claim 1, wherein an event notification for notifying a failure detection event is generated when a failure detection event occurs by the failure detection unit.
情報処理装置から、前記情報処理装置における所定のイベントの発生を通知するイベント通知を受信するイベント通知受信部と、
前記イベント通知受信部によりイベント通知が受信される度に、イベント通知の受信回数を計数するイベント通知受信回数計数部と、
前記情報処理装置から所定の間隔で送信される、前記情報処理装置で計数されたイベント通知の送信回数が通知される送信回数通知を受信する送信回数通知受信部と、
前記送信回数通知受信部により送信回数通知が受信された際に、受信された送信回数通知で通知されているイベント通知の送信回数と、前記イベント通知受信回数計数部により計数されているイベント通知の受信回数とを比較する比較部と、
前記比較部による比較の結果、イベント通知の送信回数とイベント通知の受信回数が一致しない場合に、異常の発生の可能性を警告する警告メッセージを生成する警告メッセージ生成部と、
前記警告メッセージ生成部により生成された警告メッセージを出力する警告メッセージ出力部とを有することを特徴とする管理装置。
An event notification receiver for receiving an event notification for notifying the occurrence of a predetermined event in the information processing device from the information processing device;
Each time an event notification is received by the event notification receiving unit, an event notification reception number counting unit that counts the number of receptions of event notifications,
A transmission frequency notification receiving unit that receives a transmission frequency notification that is transmitted from the information processing device at a predetermined interval and that is notified of the transmission frequency of the event notification counted by the information processing device;
When the transmission number notification is received by the transmission number notification receiving unit, the event notification transmission number notified by the received transmission number notification and the event notification counted by the event notification reception number counting unit A comparison unit that compares the number of receptions;
As a result of the comparison by the comparison unit, when the number of event notification transmissions and the number of event notification receptions do not match, a warning message generation unit that generates a warning message that warns the possibility of occurrence of an abnormality,
A management apparatus comprising: a warning message output unit that outputs a warning message generated by the warning message generation unit.
前記管理装置は、更に、
前記送信回数通知受信部が前記情報処理装置から送信回数通知を受信してからの経過時間を計測し、経過時間が所定の閾値を超過した場合に、経過時間が閾値を超過したことを通知する経過時間計測部を有し、
前記警告メッセージ生成部は、
前記経過時間計測部から経過時間が閾値を超過したことが通知された場合に、警告メッセージを生成することを特徴とする請求項3に記載の管理装置。
The management device further includes:
The transmission count notification receiving unit measures an elapsed time after receiving the transmission count notification from the information processing apparatus, and notifies that the elapsed time exceeds the threshold when the elapsed time exceeds a predetermined threshold. Has an elapsed time measurement unit,
The warning message generator
The management apparatus according to claim 3, wherein a warning message is generated when the elapsed time measurement unit notifies that the elapsed time has exceeded a threshold value.
前記警告メッセージ生成部は、
前記情報処理装置との通信経路における異常の発生の可能性を警告する警告メッセージを生成することを特徴とする請求項3又は4に記載の管理装置。
The warning message generator
The management apparatus according to claim 3 or 4, wherein a warning message is generated to warn of a possibility of occurrence of an abnormality in a communication path with the information processing apparatus.
前記警告メッセージ出力部は、
前記情報処理装置の保守を行う保守センタに設けられている装置に対して、警告メッセージを出力することを特徴とする請求項3〜5のいずれかに記載の管理装置。
The warning message output unit
6. The management apparatus according to claim 3, wherein a warning message is output to an apparatus provided in a maintenance center that performs maintenance of the information processing apparatus.
前記管理装置は、
複数の情報処理装置に接続され、
前記イベント通知受信部は、
情報処理装置ごとに、イベント通知を受信し、
前記イベント通知受信回数計数部は、
情報処理装置ごとに、イベント通知の受信回数を計数し、
前記送信回数通知受信部は、
情報処理装置ごとに、送信回数通知を受信し、
前記比較部は、
情報処理装置ごとに、イベント通知の送信回数とイベント通知の受信回数とを比較し、
前記警告メッセージ生成部は、
前記比較部による比較の結果、イベント通知の送信回数とイベント通知の受信回数が一致しない情報処理装置がある場合に、当該情報処理装置について異常の発生の可能性を警告する警告メッセージを生成することを特徴とする請求項3〜6にいずれかに記載の管理装置。
The management device
Connected to multiple information processing devices,
The event notification receiver
Each information processing device receives event notifications,
The event notification reception number counting unit
For each information processing device, count the number of event notifications received,
The transmission number notification receiving unit,
For each information processing device, receive a notification of the number of transmissions,
The comparison unit includes:
For each information processing device, compare the number of event notifications sent and the number of event notifications received,
The warning message generator
As a result of the comparison by the comparison unit, when there is an information processing device whose event notification transmission count and event notification reception count do not match, a warning message is generated to warn of the possibility of an abnormality in the information processing device. The management apparatus according to any one of claims 3 to 6, wherein:
前記管理装置は、更に、
情報処理装置ごとに、前記送信回数通知受信部が送信回数通知を受信してからの経過時間を計測し、経過時間が所定の閾値を超過した情報処理装置がある場合に、当該情報処理装置について経過時間が閾値を超過したことを通知する経過時間計測部を有し、
前記警告メッセージ生成部は、
前記経過時間計測部から経過時間が閾値を超過したことが通知された情報処理装置について、警告メッセージを生成することを特徴とする請求項7に記載の管理装置。
The management device further includes:
For each information processing device, if there is an information processing device that measures the elapsed time since the transmission number notification receiving unit received the transmission number notification and the elapsed time exceeds a predetermined threshold, the information processing device It has an elapsed time measurement unit that notifies that the elapsed time has exceeded the threshold,
The warning message generator
The management apparatus according to claim 7, wherein a warning message is generated for an information processing apparatus notified from the elapsed time measurement unit that the elapsed time has exceeded a threshold value.
前記管理装置は、更に、
前記警告メッセージ生成部により警告メッセージが生成された情報処理装置の保守を行う保守センタに設けられている装置に対して、警告メッセージを出力する警告メッセージ出力部を有することを特徴とする請求項7又は8に記載の管理装置。
The management device further includes:
8. A warning message output unit that outputs a warning message to an apparatus provided in a maintenance center that performs maintenance of the information processing apparatus for which the warning message has been generated by the warning message generation unit. Or the management apparatus of 8.
前記イベント通知受信部は、
情報処理装置で発生した障害検出イベントを通知するイベント通知を受信することを特徴とする請求項3〜9のいずれかに記載の管理装置。
The event notification receiver
The management apparatus according to claim 3, wherein an event notification for notifying a failure detection event that has occurred in the information processing apparatus is received.
所定のイベントが発生した際に、イベントの発生を通知するイベント通知を生成するイベント通知生成処理と、
前記イベント通知生成処理により生成されたイベント通知を所定の管理装置に対して送信するイベント通知送信処理と、
前記イベント通知送信処理によりイベント通知が送信される度に、イベント通知の送信回数を計数するイベント通知送信回数計数処理と、
所定の間隔で、前記イベント通知送信回数計数処理により計数されたイベント通知の送信回数を通知する送信回数通知を生成する送信回数通知生成処理と、
前記送信回数通知生成処理により生成された送信回数通知を前記管理装置に対して送信する送信回数通知送信処理とをコンピュータに実行させることを特徴とするプログラム。
An event notification generation process for generating an event notification for notifying the occurrence of an event when a predetermined event occurs;
An event notification transmission process for transmitting the event notification generated by the event notification generation process to a predetermined management device;
Each time an event notification is transmitted by the event notification transmission process, an event notification transmission number counting process for counting the number of event notification transmissions;
A transmission frequency notification generation process for generating a transmission frequency notification for notifying the transmission frequency of the event notification counted by the event notification transmission frequency counting process at a predetermined interval;
A program that causes a computer to execute a transmission frequency notification transmission process of transmitting a transmission frequency notification generated by the transmission frequency notification generation process to the management apparatus.
情報処理装置から、前記情報処理装置における所定のイベントの発生を通知するイベント通知を受信するイベント通知受信処理と、
前記イベント通知受信処理によりイベント通知が受信される度に、イベント通知の受信回数を計数するイベント通知受信回数計数処理と、
前記情報処理装置から所定の間隔で送信される、前記情報処理装置で計数されたイベント通知の送信回数が通知される送信回数通知を受信する送信回数通知受信処理と、
前記送信回数通知受信処理により送信回数通知が受信された際に、受信された送信回数通知で通知されているイベント通知の送信回数と、前記イベント通知受信回数計数処理により計数されているイベント通知の受信回数とを比較する比較処理と、
前記比較処理による比較の結果、イベント通知の送信回数とイベント通知の受信回数が一致しない場合に、異常の発生の可能性を警告する警告メッセージを生成する警告メッセージ生成処理と、
前記警告メッセージ生成処理により生成された警告メッセージを出力する警告メッセージ出力処理とをコンピュータに実行させることを特徴とするプログラム。
An event notification receiving process for receiving an event notification for notifying the occurrence of a predetermined event in the information processing device from the information processing device;
Each time an event notification is received by the event notification reception process, an event notification reception count process for counting the number of event notifications received,
A transmission count notification reception process for receiving a transmission count notification to be transmitted from the information processing apparatus at a predetermined interval to be notified of the transmission count of the event notification counted by the information processing apparatus;
When the transmission count notification is received by the transmission count notification reception process, the event notification transmission count notified by the received transmission count notification and the event notification count counted by the event notification reception count counting process A comparison process for comparing the number of receptions;
As a result of the comparison by the comparison process, when the event notification transmission count and the event notification reception count do not match, a warning message generation processing that generates a warning message that warns the possibility of occurrence of an abnormality,
A program for causing a computer to execute warning message output processing for outputting a warning message generated by the warning message generation processing.
JP2010210929A 2010-09-21 2010-09-21 Information processor and management device and program Pending JP2012068729A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010210929A JP2012068729A (en) 2010-09-21 2010-09-21 Information processor and management device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010210929A JP2012068729A (en) 2010-09-21 2010-09-21 Information processor and management device and program

Publications (1)

Publication Number Publication Date
JP2012068729A true JP2012068729A (en) 2012-04-05

Family

ID=46165982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010210929A Pending JP2012068729A (en) 2010-09-21 2010-09-21 Information processor and management device and program

Country Status (1)

Country Link
JP (1) JP2012068729A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014010538A (en) * 2012-06-28 2014-01-20 Nec Corp Operation management device, operation management system, and operation management method
JP2016149655A (en) * 2015-02-12 2016-08-18 富士通株式会社 Management method, management program, management apparatus, management system, and information processing method
KR102018556B1 (en) * 2018-10-11 2019-09-05 주식회사 컴패스 Management system and method for managing defect repairing

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014010538A (en) * 2012-06-28 2014-01-20 Nec Corp Operation management device, operation management system, and operation management method
JP2016149655A (en) * 2015-02-12 2016-08-18 富士通株式会社 Management method, management program, management apparatus, management system, and information processing method
KR102018556B1 (en) * 2018-10-11 2019-09-05 주식회사 컴패스 Management system and method for managing defect repairing

Similar Documents

Publication Publication Date Title
US9367379B1 (en) Automated self-healing computer system
CN110377469B (en) Detection system and method for PCIE (peripheral component interface express) equipment
US20080155332A1 (en) Point of sale system boot failure detection
CN107896172B (en) Monitoring fault processing method and device, storage medium and electronic equipment
US20080140895A1 (en) Systems and Arrangements for Interrupt Management in a Processing Environment
CN1841547B (en) Method and apparatus for identifying failure module
WO2012046293A1 (en) Fault monitoring device, fault monitoring method and program
JP2011100283A (en) Management device, equipment management method, equipment management program, recording medium, and equipment management system
US20210405097A1 (en) Reliable hardware metering
JP6183931B2 (en) Cluster system, server apparatus, cluster system management method, and program
JP2011113122A (en) Failure influence analysis device, application system, and failure influence analysis method
CN111176866A (en) Data interaction method and electronic equipment
JP2012068729A (en) Information processor and management device and program
CN112783703A (en) SAS link fault positioning method, device, equipment and storage medium
US20080288828A1 (en) structures for interrupt management in a processing environment
JP4102592B2 (en) Failure information notification system with an aggregation function and a program for causing a machine to function as a failure information notification means with an aggregation function
CN113014640B (en) Request processing method, request processing device, electronic equipment and storage medium
CN113868058A (en) Peripheral component high-speed interconnection equipment fault detection method and device and server
JP2006268515A (en) Pci card trouble management system
KR101572672B1 (en) Method for monitoring node failure on communication network and system thereof
JP2001005692A (en) Computer system, its maintenance and management system, and method for informing of fault
US11153769B2 (en) Network fault discovery
US9594622B2 (en) Contacting remote support (call home) and reporting a catastrophic event with supporting documentation
JP4081258B2 (en) Management server system
JP5814842B2 (en) E-mail relay device