JP2012068729A - Information processor and management device and program - Google Patents
Information processor and management device and program Download PDFInfo
- Publication number
- JP2012068729A JP2012068729A JP2010210929A JP2010210929A JP2012068729A JP 2012068729 A JP2012068729 A JP 2012068729A JP 2010210929 A JP2010210929 A JP 2010210929A JP 2010210929 A JP2010210929 A JP 2010210929A JP 2012068729 A JP2012068729 A JP 2012068729A
- Authority
- JP
- Japan
- Prior art keywords
- notification
- unit
- event
- transmission
- event notification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、サーバ装置等において障害が発生した際に、コールセンタ等の通知先に障害の発生を通知する技術に関する。 The present invention relates to a technique for notifying occurrence of a failure to a notification destination such as a call center when a failure occurs in a server device or the like.
図18を参照して従来の障害通報方式を説明する。 A conventional failure notification method will be described with reference to FIG.
図18において、100は監視対象となるサーバ装置である。
2は、サーバ装置100の障害発生を監視する監視部である。
21は、障害を検出する障害検出部である。
22は、障害の発生を通報する障害発生通報パケットを生成する通報通知作成部である。
23は、障害発生通報パケットを送信する通報通知送信部である。
30〜3mは、サーバ装置100の構成要素群である。
40〜4mは、障害検出用信号群である。
5は、通信回線である。
50は、サーバ側ルータである。
600は、障害発生通報パケットを受けるコールセンタ装置である。
60は、センタ側ルータである。
61は、コールセンタ装置600の全体の制御を行う制御部である。
62は、障害発生通報パケットを受信する通報通知受信部である。
63は、障害発生通報パケットを解析して後述する通知メッセージ66を生成する通知作成部である。
64は、通知メッセージ66を蓄積する通知蓄積部である。
65は、通知メッセージ66を出力する通知出力部である。
66は、サーバ装置100における障害内容を通知する通知メッセージであり、例えば、電子メールである。
7は、サーバ装置100の保守を行う保守センタである。
71は、保守員である。
9は、通信回線である。
In FIG. 18,
A
30 to 3 m are component groups of the
A
63 is a notification creation unit that analyzes the failure occurrence notification packet and generates a
A
A
Reference numeral 7 denotes a maintenance center that performs maintenance of the
71 is a maintenance worker.
9 is a communication line.
次に動作について説明する。
ここでは、サーバ装置100の構成要素30で障害が発生した場合を例に説明する。
構成要素30で障害が発生すると、サーバ装置100では、障害検出用信号40が有意になり、それを障害検出部21で検出したサーバ監視部2は障害発生通報パケットを通報通知作成部22で生成し、通報通知送信部23経由でコールセンタ装置600に向けて送信する。
障害発生通報パケットはサーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置600に届く。
コールセンタ装置600では、通報通知受信部62で障害発生通報パケットを受信し、解析し、障害が発生したサーバ装置100の設置場所に近い保守センタ7に障害内容を通知する通知メッセージ66を通知生成部63で生成する。
通知メッセージ66は、人がわかる形式のメッセージであり、例えば、電子メールである。
コールセンタ装置600では、通知メッセージ66を通知蓄積部64に蓄積した後、通知出力部65が保守センタに送信する。
通知メッセージを受けた保守センタ7では、通知の内容からサーバ装置100の構成要素の交換部品を携えた保守員71がサーバ設置場所に行き、サーバ装置100の故障部品を交換する。
こうして、サーバ装置100は正常状態に復帰することができる。
Next, the operation will be described.
Here, a case where a failure occurs in the
When a failure occurs in the
The failure occurrence notification packet reaches the
In the
The
In the
In the maintenance center 7 that has received the notification message, the
In this way, the
また、例えば、特許文献1では、障害通報(A)を受け付けたとき、通報履歴DBを調べ、所定時間内の過去に同一顧客から障害通報(B)があれば、障害通報(A、B)の組み合わせが、関連通報DBに存在するかを調べ、関連通報DBに、この組み合わせが登録されていれば、障害通報(A)を障害通報(B)の関連通報とし、通知を省略もしくは参考情報として通知する方式が開示されている。
Further, for example, in
図18を参照して説明した従来の障害通報方式、更には、特許文献1の方式においても、例えばサーバ側ルータ50が故障している場合には、サーバ装置100の構成要素30で障害が発生した時に、サーバ装置100が障害発生通報パケットを生成し、送信しても、サーバ側ルータ50が故障しているために、障害発生通報パケットがコールセンタ装置600に届かず、保守センタ7への障害発生通知は行われない。
従って、例えば、サーバ装置100の管理者がサーバ障害に気づき、保守センタなどに人手で通報するまでサーバの障害状態が継続し、システムの信頼性を下げてしまうという課題がある。
In the conventional failure notification method described with reference to FIG. 18 and also in the method of
Therefore, for example, there is a problem that the server failure state continues until the administrator of the
この発明は、上記のような課題を解決することを主な目的の一つとしており、通信経路における障害により通知が通知先に届かない場合にも、通知が通知先に届いていないことを早期に検出できるシステムを実現することを主な目的とする。 One of the main objects of the present invention is to solve the above-described problems. Even when the notification does not reach the notification destination due to a failure in the communication path, it is early notice that the notification does not reach the notification destination. The main purpose is to realize a system that can detect the failure.
本発明に係る情報処理装置は、
所定のイベントが発生した際に、イベントの発生を通知するイベント通知を生成するイベント通知生成部と、
前記イベント通知生成部により生成されたイベント通知を所定の管理装置に対して送信するイベント通知送信部と、
前記イベント通知送信部によりイベント通知が送信される度に、イベント通知の送信回数を計数するイベント通知送信回数計数部と、
所定の間隔で、前記イベント通知送信回数計数部により計数されたイベント通知の送信回数を通知する送信回数通知を生成する送信回数通知生成部と、
前記送信回数通知生成部により生成された送信回数通知を前記管理装置に対して送信する送信回数通知送信部とを有することを特徴とする。
An information processing apparatus according to the present invention includes:
An event notification generator for generating an event notification for notifying the occurrence of an event when a predetermined event occurs;
An event notification transmitter for transmitting the event notification generated by the event notification generator to a predetermined management device;
Each time an event notification is transmitted by the event notification transmission unit, an event notification transmission number counting unit that counts the number of event notification transmissions,
A transmission frequency notification generating unit for generating a transmission frequency notification for notifying the transmission frequency of the event notification counted by the event notification transmission frequency counting unit at a predetermined interval;
A transmission frequency notification transmission unit configured to transmit the transmission frequency notification generated by the transmission frequency notification generation unit to the management apparatus.
本発明によれば、情報処理装置が、イベント通知を管理装置に送信する度にイベント通知の送信回数を計数し、計数したイベント通知の送信回数を管理装置に通知するため、管理装置で計数されたイベント通知の受信回数と、情報処理装置から通知されたイベント通知の送信回数とを比較することにより、管理装置にイベント通知が届いていないことを早期に検出できる。 According to the present invention, the information processing device counts the number of event notification transmissions every time an event notification is transmitted to the management device, and notifies the management device of the counted number of event notification transmissions. By comparing the number of received event notifications with the number of event notification transmissions notified from the information processing device, it is possible to detect early that the event notification has not reached the management device.
実施の形態1.
図1は、本実施の形態に係るシステム構成例を示す。
FIG. 1 shows a system configuration example according to the present embodiment.
図1では、サーバ装置1がサーバ側ルータ50、通信回線5及びセンタ側ルータ60を介してコールセンタ装置6に接続されている。
そして、コールセンタ装置6は通信回線9を介して保守センタ7内の保守センタ装置70に接続されている。
図18を参照して説明したように、サーバ装置1の構成要素において障害が発生すると、サーバ装置1から障害発生通報パケットがサーバ側ルータ50、通信回線5、及びセンタ側ルータ60を経由してコールセンタ装置6に送信される。
コールセンタ装置6では、障害発生通報パケットを解析し、障害内容を通知する通知メッセージ66を生成し、保守センタ装置70に送信する。
通知メッセージを受けた保守センタ7では、通知の内容からサーバ装置1の構成要素の交換部品を携えた保守員71がサーバ設置場所に行き、サーバ装置1の故障部品を交換する。
なお、サーバ装置1は情報処理装置の例であり、コールセンタ装置6は管理装置の例である。
In FIG. 1, the
The
As described with reference to FIG. 18, when a failure occurs in a component of the
The
In the maintenance center 7 that has received the notification message, the
The
図2は、本実施の形態に係るサーバ装置1の構成例を示す。
図2において、障害通報送信カウンタ24、送信間隔設定部25、送信間隔計測タイマ26及び要求信号27以外は、図18に示した要素と同じである。
但し、通報通知作成部22及び通報通知送信部23は、図18とは異なる機能を有する。
以下では、通報通知作成部22、通報通知送信部23、障害通報送信カウンタ24、送信間隔設定部25、送信間隔計測タイマ26及び要求信号27について説明し、他の要素の説明は省略する。
FIG. 2 shows a configuration example of the
In FIG. 2, the elements other than the failure
However, the notification
In the following, the notification
本実施の形態では、通報通知作成部22は、障害検出部21による障害検出というイベント(障害検出イベント)が発生した際に、障害の発生(障害検出イベントの発生)を通知する障害発生通報パケット(イベント通知)を生成するとともに、所定の間隔で、後述する障害通報送信カウンタ24により計数された障害発生通報パケット(イベント通知)の送信回数を通知する障害発生回数通知パケット(送信回数通知)を生成する。
通報通知作成部22は、イベント通知生成部及び送信回数通知生成部の例である。
In the present embodiment, the notification
The notification
通報通知送信部23は、通報通知作成部22により生成された障害発生通報パケット及び障害発生回数通知パケットをコールセンタ装置6に対して送信する。
通報通知送信部23は、イベント通知送信部及び送信回数通知送信部の例である。
The notification
The notification
障害通報送信カウンタ24は、通報通知送信部23により障害発生通報パケット(イベント通知)が送信される度に、障害発生通報パケットの送信回数を計数する。
障害通報送信カウンタ24は、イベント通知送信回数計数部の例である。
The failure notification transmission counter 24 counts the number of transmissions of the failure occurrence notification packet every time a failure occurrence notification packet (event notification) is transmitted by the notification
The failure
送信間隔設定部25は、通報通知作成部22が障害発生回数通知パケットを生成し、通報通知送信部23が障害発生回数通知パケットを送信する間隔(周期)を後述の送信間隔計測タイマ26に設定する。
The transmission
送信間隔計測タイマ26は、送信間隔設定部25により設定された間隔(周期)にて、要求信号27を通報通知作成部22に出力するタイマである。
The transmission
図3は、本実施の形態に係るコールセンタ装置6の構成例を示す。
図3において、通報確認部8内の要素以外は、図18に示した要素と同じである。
但し、通報通知受信部62、通知生成部63及び通知出力部65は、図18とは異なる機能を有する。
以下では、通報通知受信部62、通知生成部63、通知出力部65及び通報確認部8内の要素について説明し、他の要素の説明は省略する。
FIG. 3 shows a configuration example of the
In FIG. 3, the elements other than the elements in the notification confirmation unit 8 are the same as the elements shown in FIG.
However, the notification
Below, the element in the notification
通報通知受信部62は、サーバ装置1から送信された障害発生通報パケット(イベント通知)を受信するとともに、サーバ装置1から所定の間隔で送信される障害発生回数通知パケットを受信する。
障害発生回数通知パケットは、前述したように、サーバ装置1で計数された障害発生通報パケットの送信回数が通知されるパケットである。
通報通知受信部62は、イベント通知受信部及び送信回数通知受信部の例である。
The notification
As described above, the failure occurrence frequency notification packet is a packet for notifying the number of transmissions of the failure occurrence notification packet counted by the
The notification
通報通知解析部80は、通報通知受信部62により受信されたパケットが障害発生通報パケットであるか障害発生回数通知パケットであるかを判別する。
そして、障害発生通報パケットである場合は、通報通知解析部80は障害発生通報パケットを通知生成部63に転送するとともに、障害通報受信カウンタ81に障害発生通報パケットを受信したことを通知する。
また、障害発生回数通知パケットである場合は、通報通知解析部80は障害発生回数通知パケット内の数値(サーバ装置1で計数した障害発生通報パケットの送信回数)を障害通報送信回数受信部82に出力する。
The notification
If it is a failure occurrence notification packet, the notification
Further, in the case of the failure occurrence frequency notification packet, the notification
障害通報受信カウンタ81は、通報通知解析部80から障害発生通報パケットを受信した旨の通知を受ける度に、障害発生通報パケットの受信回数を計数する。
障害通報受信カウンタ81は、イベント通知受信回数計数部の例である。
The failure report reception counter 81 counts the number of times the failure report packet is received every time a notification that the failure report packet is received from the report
The failure
障害通報送信回数受信部82は、通報通知解析部80から障害発生回数通知パケット内の数値(サーバ装置1で計数した障害発生通報パケットの送信回数)を入力し、比較部83に出力する。
The failure notification transmission
比較部83は、障害通報送信回数受信部82から障害発生回数通知パケット内の数値を入力した際(つまり、通報通知受信部62が障害発生回数通知パケットを受信した際)に、障害通報送信回数受信部82から入力した数値(サーバ装置1で計数した障害発生通報パケットの送信回数)と障害通報受信カウンタ81で計数されている受信回数とを比較する。
そして、比較部83は、比較の結果、送信回数と受信回数が一致しない場合に、通知生成部63に対して、通信経路における異常の発生の可能性を警告する警告メッセージの生成を指示する。
When the
Then, the
通知生成部63は、通報通知解析部80から障害発生通報パケットを入力した場合に、図18の場合と同様に障害内容を通知する通知メッセージ66を生成するとともに、比較部83から警告メッセージの生成指示を入力した場合に、警告メッセージを生成する。
比較部83は、警告メッセージ生成部の例である。
When a failure occurrence notification packet is input from the notification
The
通知出力部65は、通知生成部63により生成された通知メッセージ66を保守センタ装置70に対して送信するとともに、通知生成部63により警告メッセージが生成された場合に、警告メッセージを保守センタ装置70に送信する。
通知出力部65は、警告メッセージ出力部の例である。
The
The
図4は、サーバ監視部2からコールセンタ装置6に対して送信される障害発生通報パケットの構成例を示す。
障害発生通報パケットは、宛先であるコールセンタ装置6のアドレスがセットされた送信先アドレス部、送信元であるサーバ監視部2のアドレスがセットされた発信元アドレス部、障害通報であることを示すコマンドコードが設定されるコマンド部、障害発生箇所(種類)を示すコードがセットされるデータ部から構成される。
FIG. 4 shows a configuration example of a failure occurrence notification packet transmitted from the
The failure occurrence notification packet includes a transmission destination address portion in which the address of the
図5は、サーバ監視部2からコールセンタ装置6に対して送信される障害発生回数通知パケットの構成例を示す。
障害発生回数通知パケットは、宛先であるコールセンタ装置6のアドレスがセットされた送信先アドレス部、送信元であるサーバ監視部2のアドレスがセットされた発信元アドレス部、障害発生回数通知であることを示すコマンドコードが設定されるコマンド部、サーバ監視部2からコールセンタ装置6に向けて送信された障害発生通報パケットの送信回数がセットされるデータ部から構成される。
FIG. 5 shows a configuration example of a failure occurrence frequency notification packet transmitted from the
The failure occurrence frequency notification packet is a transmission destination address portion in which the address of the
次に、図8〜12を参照して動作について説明する。
図8は、サーバ装置1がコールセンタ装置6に障害が発生したことを通知する障害発生通報処理の手順例を示す。
図9は、サーバ装置1がコールセンタ装置に障害発生通報パケットの送信回数を通知する障害回数通知処理の手順例を示す。
図10は、コールセンタ装置6において周期的に実行される通報関連処理の手順例を示す。
図11は、本実施の形態に係るコールセンタ装置6が障害発生通報を受信した際の障害発生通報処理の手順例であり、図10のST210の詳細を示す。
図12は、本実施の形態に係るコールセンタ装置6が障害発生回数通知を受信した際の障害発生回数通知処理の手順例であり、図10のST220の詳細を示す。
なお、以下では、サーバ装置1の構成要素30で障害が発生した場合を例に説明を進める。
Next, the operation will be described with reference to FIGS.
FIG. 8 shows a procedure example of failure occurrence notification processing in which the
FIG. 9 shows a procedure example of the failure frequency notification process in which the
FIG. 10 shows an example of a procedure of notification-related processing that is periodically executed in the
FIG. 11 is a procedure example of failure occurrence notification processing when the
FIG. 12 is a procedure example of the failure occurrence frequency notification process when the
In the following description, the case where a failure occurs in the
サーバ装置1の構成要素30で障害が発生すると(図8のST101でYES)、障害検出用信号40が有意になり、それを障害検出部21で検出したサーバ監視部2は障害発生通報パケットを通報通知作成部22で生成する(ST102)(イベント通知生成処理)。
次に、通報通知送信部23が障害発生通報パケットをコールセンタ装置6に向けて送信する(ST103)(イベント通知送信処理)。
また、この時、障害通報送信カウンタ24の値がインクリメント(+1)される(ST104)(イベント通知送信回数計数処理)。
When a failure occurs in the
Next, the notification
At this time, the value of the failure
障害発生通報パケットはサーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置6に届く。
コールセンタ装置6では、通報通知受信部62で障害発生通報パケットを受信し(図10のST201でYES)(イベント通知受信処理)、通報通知解析部80にて解析される。
より詳細には、コールセンタ装置6では、通報通知解析部80が、通報通知受信部62で受信されたパケットからコマンド部を取り出し(ST202)、コマンド部を解析して受信パケットが障害発生通報パケットであるか障害発生回数通知パケットであるかを判断する(ST203)。
ここでは、受信パケットは障害発生通報パケットであるため、障害発生通報処理(ST210)が行われる。
The failure occurrence notification packet reaches the
In the
More specifically, in the
Here, since the received packet is a failure occurrence notification packet, failure occurrence notification processing (ST210) is performed.
障害発生通報処理(ST210)では、通報通知解析部80から障害通報受信カウンタ81に障害発生通報パケットが受信された旨が通知され、また、通報通知解析部80から通知生成部63に障害発生通報パケットが転送される。
そして、通報通知解析部80から障害発生通報パケットが受信された旨が通知されると、障害通報受信カウンタ81はカウンタ値をインクリメント(+1)する(図11のST211)(イベント通知受信回数計数処理)。
また、通知生成部63は、障害発生通報パケットの少なくとも発信元アドレスとデータ部を用いて通知メッセージ66を生成する(ST212)。
次に、通知蓄積部64が、通知生成部63により生成された通知メッセージ66を蓄積するとともに(図11のST213)、通知出力部65が保守センタ7の保守センタ装置70に通知メッセージ66を送信する(ST214)。
In the failure occurrence notification process (ST210), the failure
Then, when notified that the failure notification packet is received from the notification
Moreover, the notification production |
Next, the
通知メッセージ66を受けた保守センタ7では、通知の内容からサーバ装置1の構成要素30の交換部品を携えた保守員71がサーバ設置場所に行き、サーバ装置1の故障部品を交換する。
こうして、サーバ装置1は正常状態に復帰することができる。
In the maintenance center 7 that has received the
In this way, the
また、サーバ装置1で障害が発生していない間は、送信間隔設定部25からセットされた時間の間、送信間隔計測タイマ26が時間の計測を継続する。
設定された時間が経過し、障害発生回数の通知タイミングになると(図9のST111でYES)、送信間隔計測タイマ26は要求信号27を有意にする。
要求信号27が有意になると、通報通知作成部22で要求信号27が有意になったことを検出し、通報通知作成部22が障害発生回数通知パケットを生成する(ST112)(送信回数通知生成処理)。
具体的には、通報通知作成部22は、障害通報送信カウンタ24のカウンタ値を読み出し、カウンタ値をセットした障害発生回数通知パケットを生成する。
次に、通報通知送信部23が障害発生回数通知パケットをコールセンタ装置6に向けて送信する(ST113)(送信回数通知送信処理)。
Further, while no failure has occurred in the
When the set time has elapsed and the notification timing of the number of failures has occurred (YES in ST111 in FIG. 9), the transmission
When the request signal 27 becomes significant, the notification
Specifically, the notification
Next, the notification
障害発生回数通知パケットはサーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置6に届く。
コールセンタ装置6では、通報通知受信部62で障害発生回数通知パケットを受信し(図10のST201でYES)(送信回数通知受信処理)、通報通知解析部80にて解析される。
より詳細には、コールセンタ装置6では、通報通知解析部80が、通報通知受信部62で受信されたパケットからコマンド部を取り出し(ST202)、コマンド部を解析して受信パケットが障害発生通報パケットであるか障害発生回数通知パケットであるかを判断する(ST203及びS204)。
ここでは、受信パケットは障害発生回数通知パケットであるため、障害発生回数通知処理(ST220)が行われる。
The failure occurrence frequency notification packet reaches the
In the
More specifically, in the
Here, since the received packet is a failure occurrence count notification packet, failure occurrence count notification processing (ST220) is performed.
障害発生回数通知処理(ST220)では、通報通知解析部80から障害通報受信カウンタ81に障害発生回数通知パケットを受信した旨が通知され、また、通報通知解析部80から障害通報送信回数受信部82に障害発生回数通知パケットのデータ部に設定されている数値(障害発生回数)が出力される。
障害通報受信カウンタ81は、現在のカウンタ値を比較部83に出力し、また、障害通報送信回数受信部82は障害発生回数通知パケットのデータ部の数値(障害発生回数)を比較部83に出力する。
なお、障害発生回数通知パケットが受信された場合は、障害通報受信カウンタ81の値は変化しない。
In the failure occurrence frequency notification process (ST220), the notification
The failure
When the failure occurrence count notification packet is received, the value of the failure
比較部83では、障害通報送信回数受信部82から出力された障害発生回数通知パケットのデータ部の数値(障害発生回数)と、障害通報受信カウンタ81から出力されたカウンタ値を比較する(図12のST221)(比較処理)。
比較の結果、両者の値が一致している場合(ST222でYES)には、サーバ監視部2からの障害発生通報パケットは全て正常に処理されたことになるため新たな処理は何も行われない。
一方、両者の値が一致しない場合(ST222でNO)は、比較部83は通知生成部63に通信経路に異常が発生している可能性又は異常が発生していた可能性を警告する通知メッセージを生成するよう指示し、通知生成部63は、このような通知メッセージ(警告メッセージ)を生成する(ST223)(警告メッセージ生成処理)。
次に、通知蓄積部64が、通知生成部63により生成された警告メッセージを蓄積するとともに(ST224)、通知出力部65が保守センタ7の保守センタ装置70に警告メッセージを送信する(ST225)(警告メッセージ送信処理)。
そして、次回の比較に備え、障害通報送信回数受信部82の値が障害通報受信カウンタ81にセットされる(ST226)。
The
If both values match as a result of the comparison (YES in ST222), all of the failure notification packets from the
On the other hand, when the two values do not match (NO in ST222), the
Next, the
Then, in preparation for the next comparison, the value of the failure notification transmission
もしも、サーバ側ルータ50が障害で一時的に動作を停止している間にサーバ装置1で何らかの障害が発生すると、障害発生前に障害通報送信カウンタ24の値がNだった場合には、コールセンタ装置6へ障害発生通報パケットは届かないが、サーバ装置1からは障害発生通報パケットは送出されているので障害通報送信カウンタ24の値はN+1になる。
その後、サーバ側ルータ50が障害から復旧すると、送信間隔計測タイマ26に設定されていただけの時間が経過した時に、N+1をデータ部に設定した障害通報回数通知パケットがコールセンタ装置6に送信される。
障害通報回数通知パケットを受信したコールセンタ装置6では、それまでに受信した障害発生通報の回数をカウントしていた障害通報受信カウンタ81の内容Nと、障害通報回数通知パケットから取り出された数値N+1とが比較部83で比較される。
この場合は、その出力が不一致を示す状態になるため、障害発生通報の通信経路(サーバ側ルータ50、通信回線5、センタ側ルータ60)上で障害が発生している可能性を警告する警告メッセージが保守センタ装置70に送信される。
そして、次回の比較に備え、障害通報回数通知パケットから取り出された数値N+1が障害通報受信カウンタ81にセットされる。
If any failure occurs in the
Thereafter, when the server-
In the
In this case, since the output indicates a mismatch, a warning that warns of the possibility of a failure occurring on the communication path (
Then, in preparation for the next comparison, the numerical value N + 1 extracted from the failure notification frequency notification packet is set in the failure
警告メッセージを受けた保守センタ7では、通知の内容から通信経路に異常が発生している可能性をサーバ装置1の管理者に伝えるとともに、障害発生通報パケットとして通報されなかった障害が何であるかを確認するため、保守員71がサーバ設置場所に行き、ログなどを解析して、障害箇所を見極め、部品交換することで、サーバ装置1が正常状態に復旧する。
このように、障害発生通報経路に異常がある場合でも、サーバ装置1での障害発生を確実に通報できるようになり、復旧までの時間の長時間化を防ぐことができるので、信頼性の高いシステムを構築することができる。
Receiving the warning message, the maintenance center 7 informs the administrator of the
As described above, even when there is an abnormality in the failure occurrence notification path, the failure occurrence in the
なお、以上の説明では、障害発生通報パケットをコールセンタ装置6に届けるための通信経路と、障害発生回数通知パケットをコールセンタ装置6に届けるための通信経路が同じである例を説明したが、障害発生通報パケットをコールセンタ装置6に届けるための通信経路と、障害発生回数通知パケットをコールセンタ装置6に届けるための通信経路を別の経路としてもよい。
In the above description, an example in which a communication path for delivering a failure occurrence notification packet to the
実施の形態2.
実施の形態1に係るシステムでは、障害発生通報パケットをコールセンタ装置6に届けるための通信経路と、障害発生回数通知パケットをコールセンタ装置6に届けるための通信経路が同じである場合には、通信経路が障害から回復しないと、障害発生回数通知パケットはコールセンタ装置6に届かない。
このため、通信経路の回復に長時間を要する場合には、コールセンタ装置6において、不達になっている障害発生通報パケットの存在を確認するまでに長時間を要することになる。
本実施の形態では、このような事態に対処し、不達になっている障害発生通報パケットの存在を早期に確認できるコールセンタ装置6を説明する。
In the system according to the first embodiment, when the communication path for delivering the failure occurrence notification packet to the
For this reason, when it takes a long time to recover the communication path, it takes a long time for the
In the present embodiment, a
図6は、本実施の形態に係るコールセンタ装置6の構成例を示す。
コールセンタ装置6以外の要素は、実施の形態1に示したものと同様であるため、コールセンタ装置6以外の要素の説明は省略する。
FIG. 6 shows a configuration example of the
Since elements other than the
図6では、図3の構成と比較して、通知受信間隔計測タイマ84と受信間隔設定部85が追加されている。
受信間隔設定部85は、送信間隔設定部25よりも長い時間間隔を設定する。
通知受信間隔計測タイマ84は、障害発生回数通知パケットを受信した時に受信間隔設定部85に設定されている値をセットし、その後時間の経過とともにセット値をカウントダウンしていく。
つまり、通知受信間隔計測タイマ84は、通報通知受信部62が障害発生回数通知パケットを受信してからの経過時間を計測し、経過時間が受信間隔設定部85により設定された値を超過した場合に、経過時間が受信間隔設定部85の設定値を超過したことを通知生成部63に通知する。
通知受信間隔計測タイマ84は、経過時間計測部の例である。
そして、本実施の形態では、通知生成部63は、通知受信間隔計測タイマ84から経過時間が受信間隔設定部85の設定値を超過したことを通知された場合に、警告メッセージを生成する。
In FIG. 6, a notification reception interval measurement timer 84 and a reception
The reception
The notification reception interval measurement timer 84 sets a value set in the reception
That is, the notification reception interval measurement timer 84 measures the elapsed time since the notification
The notification reception interval measurement timer 84 is an example of an elapsed time measurement unit.
In the present embodiment, the
次に動作について説明する。
なお、サーバ装置1における動作は、図8及び図9に示す通りである。
つまり、サーバ装置1で障害が発生していない間は、送信間隔設定部25に設定された時間の間隔で、障害発生回数通知パケットがサーバ監視部2から、サーバ側ルータ50、通信回線5、センタ側ルータ60を経由し、コールセンタ装置6に送信される。
Next, the operation will be described.
The operation in the
That is, while no failure has occurred in the
本実施の形態に係るコールセンタ装置6の動作は、図13に示す通りである。
図13では、図10と比較して、S205及びST230が追加されており、他の処理は図10と同様である。
以下では、S205及びST230について説明する。
なお、図13では、ST300、ST400、ST500も記述されているが、ST300、ST400、ST500は実施の形態3で説明する。
The operation of the
In FIG. 13, compared with FIG. 10, S205 and ST230 are added, and other processes are the same as those of FIG.
Hereinafter, S205 and ST230 will be described.
In FIG. 13, ST300, ST400, and ST500 are also described, but ST300, ST400, and ST500 will be described in
本実施の形態では、通報通知解析部80が、通報通知受信部62により受信されたパケットが障害発生回数通知パケットであると判断すると、受信間隔設定部85に設定されている値が通知受信間隔計測タイマ84にセットされ、通知受信間隔計測タイマ84はセット値のカウントダウンを開始する。
つまり、通知受信間隔計測タイマ84は、障害発生回数通知パケットの受信時刻からの経過時間を計測する。
そして、通信経路に障害が発生しなければ、通知受信間隔計測タイマ84の値がゼロになる前に、サーバ装置1の送信間隔設定部25に設定された時間間隔でサーバ監視部2が障害発生回数通知パケットを送信する。
このため、通信経路に障害が発生しなければ、通知受信間隔計測タイマ84の値がゼロになる前に、通報通知受信部62が障害発生回数通知パケットを受信し、通報通知解析部80が障害発生回数通知パケットが受信された旨を確認する。
通報通知解析部80が障害発生回数通知パケットの受信を確認すると、通知受信間隔計測タイマ84には受信間隔設定部85に設定されていた時間が再度セットされ、その後カウントダウンが再度開始される。
結局、通信経路が正常であれば、通知受信間隔の再設定→カウントダウン→通知受信間隔の再設定→カウントダウンが繰り返され、通知受信間隔計測タイマ84がゼロになることはない。
ここで、もしも、サーバ側ルータ50に障害が発生した場合、サーバ監視部2からの障害発生回数通知パケットを受信しないため、通知受信間隔計測タイマ84のカウントダウンが進み、通知受信間隔計測タイマ84の値がゼロになる。
図13に従って説明すると、通知受信間隔計測タイマ84は、単位時間ごとに(ST205)に障害経路確認処理(ST230)を行って、カウントダウンを進め、カウンタ値がゼロになった場合に、通知生成部63が警告メッセージを生成し、通知出力部65が警告メッセージを送信する。
ここでは、ST205の単位時間を1秒とし、受信間隔設定部85が通知受信間隔計測タイマ84に設定する受信間隔を1000秒とする例で障害経路確認処理(ST230)を説明する。
In the present embodiment, when the notification
That is, the notification reception interval measurement timer 84 measures the elapsed time from the reception time of the failure occurrence frequency notification packet.
If no failure occurs in the communication path, the
For this reason, if a failure does not occur in the communication path, the notification
When the notification
In the end, if the communication path is normal, the notification reception interval resetting → countdown → notification reception interval resetting → countdown is repeated, and the notification reception interval measurement timer 84 does not become zero.
Here, if a failure occurs in the
Explaining in accordance with FIG. 13, the notification reception interval measurement timer 84 performs a failure path confirmation process (ST230) every unit time (ST205), advances the countdown, and when the counter value becomes zero, the
Here, the failure path confirmation process (ST230) will be described using an example in which the unit time of ST205 is 1 second and the reception interval set by the reception
ST205により1秒ごとに経路障害確認処理(ST230)が開始され、通知受信間隔計測タイマ84はカウンタ値をデクリメントし、カウンタ値がゼロになっていなければ、経路障害確認処理(ST230)を終了し、次の1秒が経過するのを待つ。
一方、カウンタ値をデクリメントした結果カウンタ値がゼロになれば(障害発生回数通知パケットを受信していない時間が閾値である1000秒を超えたら)、通知受信間隔計測タイマ84が通知生成部63にカウンタ値がゼロになった旨を通知する。
通知生成部63は、通知受信間隔計測タイマ84からの通知を受けて、通信経路の異常の可能性を警告する警告メッセージを生成し、通知出力部65での蓄積の後、通知出力部65が警告メッセージを保守センタ装置70に送信する。
In ST205, a path failure confirmation process (ST230) is started every second, and the notification reception interval measurement timer 84 decrements the counter value. If the counter value is not zero, the path failure confirmation process (ST230) is terminated. Wait for the next second to elapse.
On the other hand, if the counter value becomes zero as a result of decrementing the counter value (if the time during which no failure occurrence notification packet is received exceeds the threshold value of 1000 seconds), the notification reception interval measurement timer 84 notifies the
The
警告メッセージを受けた保守センタ7では、通知の内容から障害通報経路に異常がある旨をサーバ装置1の管理者に伝えるとともに、通信経路の障害箇所を確認するとともに障害発生通報パケットとして通報されなかった障害がないかを確認するため、保守員71がサーバ設置場所に行き、サーバ側ルータ50の障害であることを見極め、交換するとともに、サーバ装置1自体には障害はないことを確認することでシステムが正常状態に戻る。
Upon receiving the warning message, the maintenance center 7 informs the administrator of the
このように、障害発生通報経路に異常がある場合でも、サーバ装置で障害が発生した時に障害発生通報がコールセンタに届かなくなることを未然に防ぐことが可能になり、信頼性の高いシステムを構築することができる。 In this way, even when there is an abnormality in the failure occurrence notification path, it is possible to prevent the failure occurrence notification from reaching the call center when a failure occurs in the server device, and to build a highly reliable system be able to.
実施の形態3.
本実施の形態では、複数のサーバ装置1と複数の保守センタ7に対応させたコールセンタ装置6を説明する。
In the present embodiment, a
図7は、本実施の形態に係るコールセンタ装置6の構成例を示す。
図示は省略しているが本実施の形態に係るコールセンタ装置6は複数のサーバ装置1にネットワーク接続されている。
また、本実施の形態に係るコールセンタ装置6は、複数の保守センタ7とネットワーク接続されている。
FIG. 7 shows a configuration example of the
Although not shown, the
Further, the
図7は、図6に示した通報確認部8をソフトウェアとして実現している例を示す。
つまり、サーバ群監視情報記憶部800において、サーバ装置ごとの記憶ブロックを設け、各記憶ブロックに図6に示した通報確認部8を実現するためのデータを格納している。
サーバ1対応情報ブロック810は、サーバ番号1のサーバ装置1に対する記憶ブロックであり、サーバn対応情報ブロック8n0は、サーバ番号nのサーバ装置1に対する記憶ブロックである。
以下では、サーバ1対応情報ブロック810を例にして、記憶ブロック内の構成を説明する。
FIG. 7 shows an example in which the notification confirmation unit 8 shown in FIG. 6 is realized as software.
That is, in the server group monitoring
The
Hereinafter, the configuration in the storage block will be described using the
障害通報受信カウンタ811は、図6に示した障害通報受信カウンタ81と同様に動作し、障害発生通報パケットの受信回数を計数する。
障害通報送信回数受信部812は、図6に示した障害通報送信回数受信部82と同様に動作し、通報通知解析部80から障害発生回数通知パケットのデータ部の数値(障害発生回数)を記憶する。
通知受信間隔計測タイマ814は、図6に示した通知受信間隔計測タイマ84と同様に動作し、障害発生回数通知パケットを受信してからの経過時間を計測する。
受信間隔設定部815は、図6に示した受信間隔設定部85と同様に動作し、通知受信間隔計測タイマ814の計測時間をセットする。
アドレス設定部816は、サーバ番号1のサーバ装置1の通信アドレスを格納している。
サーバ1近隣保守センタアドレス817は、サーバ番号1のサーバ装置1の近隣に設置されている保守センタ7の保守センタ装置70の通信アドレスを格納している。
サーバ1有効フラグ818は、サーバ1対応情報ブロック810が登録済で有効であることを示す。
The failure notification reception counter 811 operates in the same manner as the failure notification reception counter 81 shown in FIG. 6, and counts the number of receptions of the failure occurrence notification packet.
The failure notification transmission frequency reception unit 812 operates in the same manner as the failure notification transmission
The notification reception interval measurement timer 814 operates in the same manner as the notification reception interval measurement timer 84 shown in FIG. 6, and measures the elapsed time after receiving the failure occurrence frequency notification packet.
The reception
The
The
The
なお、本実施の形態では、図6に示した比較部83の動作は制御部61が行うものとする。
つまり、本実施の形態では、例えばサーバ番号1のサーバ装置1の場合では、制御部61が障害通報受信カウンタ811のカウンタ値と障害通報送信回数受信部812の値とを比較する。
なお、コールセンタ装置6の他の要素は図6と同じであり、説明を省略する。
In the present embodiment, it is assumed that the operation of the
That is, in the present embodiment, for example, in the case of the
The other elements of the
次に動作について説明する。
各サーバ装置1における障害発生時の通報および正常時の障害発生回数通知については実施の形態1と同様に行われる。
ここでは、図13〜図16を参照して、通報および通知を受信したコールセンタ装置6での動作を中心に述べる。
なお、図13は、本実施の形態に係るコールセンタ装置6において周期的に実行される通報関連処理の手順例を示す。
図14は、本実施の形態に係るコールセンタ装置6が障害発生通報を受信した際の障害発生通報処理の手順例であり、図13のST300の詳細を示す。
図15は、本実施の形態に係るコールセンタ装置6が障害発生回数通知を受信した際の障害発生回数通知処理の手順例であり、図13のST400の詳細を示す。
図16は、本実施の形態に係るコールセンタ装置6の経路障害確認処理の手順例であり、全てのサーバ装置において通信経路故障による通知の受信タイムアウトが発生していないかを周期的にチェックする動作を示す。
図16は、図13のST500の詳細を示す。
Next, the operation will be described.
The notification when a failure occurs in each
Here, with reference to FIGS. 13 to 16, the operation in the
FIG. 13 shows an example of a procedure of notification-related processing that is periodically executed in the
FIG. 14 is a procedure example of the failure occurrence notification process when the
FIG. 15 is a procedure example of the failure occurrence frequency notification process when the
FIG. 16 is a procedure example of the route failure confirmation process of the
FIG. 16 shows details of ST500 in FIG.
サーバ装置1からの障害発生通報パケットを通報通知受信部62で受信する(図13のST201でYES)と、通報通知解析部80がパケットのコマンド部を取り出して(ST202)パケットを解析し、障害発生通報パケットであることを確認する(ST203でYES)。
このため、障害発生通報処理(ST300)(図14)が行われる。
When the failure notification packet from
For this reason, failure occurrence notification processing (ST300) (FIG. 14) is performed.
障害発生通報処理(ST300)では、制御部61が、障害発生通報パケットの送信元アドレスを読み出す(図14のST301)とともに、サーバ群監視情報記憶部800の記憶ブロックの配置順にアドレス設定部816・・・8n6を読み出し(ST302、ST303)、読み出したアドレス設定部のアドレスと障害発生通信パケットの送信元アドレスとの比較を行う(ST304)。
一致しない場合(ST304でNO)は、次の記憶ブロックのアドレス設定部を読み出して(ST309、ST310、ST303)、障害発生通報パケットの送信元アドレスとの比較を行う(ST304)。
In the failure occurrence notification process (ST300), the
If they do not match (NO in ST304), the address setting unit of the next storage block is read (ST309, ST310, ST303) and compared with the source address of the failure notification packet (ST304).
一方、ST304でYESの場合は、当該アドレス設定部が含まれている記憶ブロックに対応するサーバ装置1からの通報であり、制御部61は、その記憶ブロックを選択する。
以下では、サーバ1対応情報ブロック810を選択したとして説明を進める。
制御部61は、障害通報受信カウンタ811の内容をインクリメント(+1)するとともに、サーバ1近隣保守センタアドレス817に格納されているサーバ番号1のサーバ装置1の近隣にある保守センタ7のアドレス(保守センタ装置70のアドレス)を通知生成部63に通知メッセージ66の送信先として通知する(ST305)。
また、制御部61は、障害発生通報パケットのデータ部の障害発生個所を示すコードを通知生成部63に通知する(ST306)。
また、制御部61は、通知生成部63が通知メッセージ66を生成するにあたって他に必要なデータがあれば、そのデータを通知生成部63に通知する(ST307)。
次に、通知生成部63が通知メッセージ66を生成し、通知蓄積部64に蓄積された後に、通知出力部65が通知メッセージ66を送信する(ST308)。
通知メッセージ66の送信先は、ST305で抽出された、サーバ番号1のサーバ装置1の近隣にある保守センタ7の保守センタ装置70である。
On the other hand, in the case of YES in ST304, this is a notification from the
In the following description, it is assumed that the
The
In addition,
In addition, if there is other data necessary for the
Next, after the
The transmission destination of the
この後、障害発生の通知を受けた保守センタ7から保守員がサーバ装置1の設置場所に派遣され、障害発生箇所の交換が行われてシステムは正常に復帰する。
Thereafter, a maintenance staff is dispatched from the maintenance center 7 that has received the notification of the occurrence of the failure to the installation location of the
もしも、サーバ側ルータ50が障害で一時的に動作を停止している間にサーバ装置1で何らかの障害が発生すると、障害発生前に障害通報送信カウンタ24の値がNだった場合には、コールセンタ装置6へ障害発生通報パケットは届かないが、サーバ装置1からは障害発生通報パケットは送出されているので障害通報送信カウンタ24の値はN+1になる。
その後、サーバ側ルータ50が障害から復旧すると、送信間隔計測タイマ26に設定されていただけの時間が経過した時に、N+1をデータ部に設定した障害通報回数通知パケットがコールセンタ装置6に送信される。
If any failure occurs in the
Thereafter, when the server-
障害通報回数通知パケットを受信したコールセンタ装置6では、サーバ装置1からの障害発生通報パケットを通報通知受信部62で受信する(図13のST201でYES)と、通報通知解析部80がパケットのコマンド部を取り出して(ST202)パケットを解析し、障害発生回数通知パケットであることを確認する(ST203でNO、ST204でYES)。
このため、障害発生回数通知処理(ST400)(図15)が行われる。
In the
Therefore, the failure occurrence frequency notification process (ST400) (FIG. 15) is performed.
障害発生回数通知処理(ST400)では、制御部61が、障害発生回数通知パケットの送信元アドレスを読み出す(図15のST401)とともに、サーバ群監視情報記憶部800の記憶ブロックの配置順にアドレス設定部816・・・8n6を読み出し(ST402、ST403)、読み出したアドレス設定部のアドレスと障害発生回数通知パケットの送信元アドレスとの比較を行う(ST404)。
一致しない場合(ST404でNO)は、次の記憶ブロックのアドレス設定部を読み出して(ST414、ST415、ST403)、障害発生回数通知パケットの送信元アドレスとの比較を行う(ST404)。
In the failure occurrence frequency notification process (ST400), the
If they do not match (NO in ST404), the address setting unit of the next storage block is read (ST414, ST415, ST403) and compared with the source address of the failure occurrence frequency notification packet (ST404).
一方、ST404でYESの場合は、当該アドレス設定部が含まれている記憶ブロックに対応するサーバ装置1からの通報であり、制御部61は、その記憶ブロックを選択する。
以下では、サーバ1対応情報ブロック810を選択したとして説明を進める。
制御部61は、次に、受信間隔設定部815に格納されている受信間隔の値を通知受信間隔計測タイマ814にセットして、通知受信間隔計測タイマ814のカウントダウンとを開始させる(ST405)。
次に、制御部61は、障害発生回数通知パケットのデータ部に格納されている障害発生回数を読み出し、読み出した障害発生回数を障害通報送信回数受信部812に格納する(ST406)。
そして、制御部61は、障害通報受信カウンタ811からカウンタ値を読み出すとともに(ST407)、障害通報送信回数受信部812から障害発生回数を読み出して、両者を比較する(ST408)。
障害通報受信カウンタ811の内容と、障害通報送信回数受信部812の内容が等しければ(ST408でYES)、制御部61は処理を終了する。
一方、障害通報受信カウンタ811の値がN、障害通報送信回数受信部812の値がN+1である場合には、不一致であり(ST408でNO)、制御部61は、サーバ1近隣保守センタアドレス817に格納されているサーバ番号1のサーバ装置1の近隣にある保守センタ7のアドレス(保守センタ装置70のアドレス)を通知生成部63に警告メッセージの送信先として通知する(ST409)。
また、制御部61は、通信経路故障を示すメッセージを通知生成部63に通知する(ST410)。
また、制御部61は、通知生成部63が警告メッセージを生成するにあたって他に必要なデータがあれば、そのデータを通知生成部63に通知する(ST411)。
次に、通知生成部63が警告メッセージを生成し、通知蓄積部64に蓄積された後に、通知出力部65が警告メッセージを送信する(ST412)。
警告メッセージの送信先は、ST409で抽出された、サーバ番号1のサーバ装置1の近隣にある保守センタ7の保守センタ装置70である。
そして、次回の比較に備え、障害通報送信回数受信部812の値N+1を障害通報受信カウンタ811にセットする(ST413)。
On the other hand, in the case of YES in ST404, it is a notification from the
In the following description, it is assumed that the
Next,
Next,
Then, control
If the content of failure notification reception counter 811 is equal to the content of failure notification transmission count reception unit 812 (YES in ST408),
On the other hand, if the value of the failure notification reception counter 811 is N and the value of the failure notification transmission count reception unit 812 is N + 1, there is a mismatch (NO in ST408), and the
Further,
In addition, if there is other data necessary for the
Next, after the
The transmission destination of the warning message is the
Then, in preparation for the next comparison, the value N + 1 of the failure notification transmission count reception unit 812 is set in the failure notification reception counter 811 (ST413).
その後、通知を受けた保守センタ7では、通知の内容から障害通報経路に異常があり、サーバ番号1のサーバ装置1で障害が発生している可能性がある旨を当該サーバ装置1の管理者に伝えるとともに、障害発生通報パケットとして通報されなかった障害が何であるかを確認するため、保守員71がサーバ設置場所に行き、ログなどを解析して、障害箇所を見極め、部品交換することで、サーバが正常状態に復旧する。
また、サーバ側ルータ50も交換されて、システムが正常状態に戻る。
Thereafter, in the maintenance center 7 that has received the notification, the administrator of the
Further, the
また、サーバ装置1で障害が発生しなかった場合でも、コールセンタ装置6のサーバ群監視情報記憶部800内に記憶された各サーバに対応する記憶ブロック中の通知受信間隔計測タイマの内容が一定間隔でカウントダウンされる。
あるサーバ装置1から障害発生回数通知パケットを受信すると、通報通知解析部80で解析されて、対応する記憶ブロック中の受信間隔設定部の内容が通知受信間隔計測タイマにセットされる。
通信経路に障害がない場合には、こうして各サーバ装置に対応した通知受信間隔計測タイマがカウントダウン→受信間隔設定部の内容の再セット→カウントダウン→受信間隔設定部の内容の再セットを繰り返す。
ここで、もしも、サーバ側ルータ50に障害が発生した場合、サーバ監視部2からの障害発生回数通知パケットを受信しないため、通知受信間隔計測タイマのカウントダウンが進み、その値がゼロになる。
図13に従って説明すると、制御部61は、単位時間ごとに(ST205)に障害経路確認処理(ST500)を行って、通知受信間隔計測タイマのカウントダウンを進め、カウンタ値がゼロになった場合に、通知生成部63が警告メッセージを生成し、通知出力部65が警告メッセージを送信する。
ここでは、ST205の単位時間を全サーバ装置で共通に1秒とし、受信間隔設定部が通知受信間隔計測タイマに設定する受信間隔を全サーバ装置で共通に1000秒とする例で障害経路確認処理(ST500)を説明する。
Even when no failure has occurred in the
When a failure occurrence frequency notification packet is received from a
If there is no failure in the communication path, the notification reception interval measurement timer corresponding to each server device repeats counting down → resetting the contents of the receiving interval setting unit → counting down → resetting the contents of the receiving interval setting unit.
Here, if a failure occurs in the server-
Describing according to FIG. 13, the
Here, in the example where the unit time of ST205 is 1 second commonly for all server devices, and the reception interval set in the notification reception interval measurement timer by the reception interval setting unit is 1000 seconds commonly for all server devices, the failure path confirmation processing (ST500) will be described.
ST205により1秒ごとに経路障害確認処理(ST500)が開始される。
経路障害確認処理(ST500)では、制御部61が、サーバ群監視情報記憶部800の記憶ブロックの配置順にサーバ1有効フラグ818・・・8n8を読み出し(図16のST501、ST502)、フラグ有効になっている記憶ブロックの通知受信間隔計測タイマ814・・・8n4のカウンタ値をデクリメント(−1)させ(ST503)、カウンタ値がゼロになっていなければ(ST504でNO)、次の記憶ブロックの有効フラグを確認する(ST509、ST510、ST502)。
全ての記憶ブロックに対して処理が終了すると(ST509でYES)、制御部61は経路障害確認処理(ST500)を終了し、次の1秒が経過するのを待つ。
一方、カウンタ値をデクリメントした結果カウンタ値がゼロになれば(障害発生回数通知パケットを受信していない時間が閾値である1000秒を超えたら)(ST504でYES)、制御部61は、S505に処理を進める。
ここでは、サーバ1対応情報ブロック810の通知受信間隔計測タイマ814のカウンタ値がゼロになった場合、すなわち、サーバ番号1のサーバ装置1からの障害発生回数通知パケットを1000秒以上受信していない場合を例にして説明する。
制御部61は、サーバ1近隣保守センタアドレス817に格納されているサーバ装置1の近隣にある保守センタ7のアドレスを通知生成部63に警告メッセージの送信先として通知する(ST505)。
また、制御部61は、通信経路故障を示すメッセージを通知生成部63に通知する(ST506)。
また、制御部61は、通知生成部63が警告メッセージを生成するにあたって他に必要なデータがあれば、そのデータを通知生成部63に通知する(ST507)。
次に、通知生成部63が警告メッセージを生成し、通知蓄積部64に蓄積された後に、通知出力部65が警告メッセージを送信する(ST508)。
警告メッセージの送信先は、ST505で抽出された、サーバ番号1のサーバ装置1の近隣にある保守センタ7の保守センタ装置70である。
通知生成部63による警告メッセージの送信及び通知出力部65による警告メッセージの送信に並行して、制御部61はST509以降の処理を進め、全ての記憶ブロックに対して処理が終了すると(ST509でYES)、制御部61は経路障害確認処理(ST500)を終了し、次の1秒が経過するのを待つ。
A route failure confirmation process (ST500) is started every second by ST205.
In the route failure confirmation process (ST500), the
When processing is completed for all storage blocks (YES in ST509),
On the other hand, if the counter value becomes zero as a result of decrementing the counter value (if the time during which no failure occurrence notification packet is received exceeds the threshold value of 1000 seconds) (YES in ST504), the
Here, when the counter value of the notification reception interval measurement timer 814 of the
Further,
In addition, if there is other data necessary for
Next, after the
The destination of the warning message is the
In parallel with the transmission of the warning message by the
通知出力部65により警告メッセージが送信されると、通知を受けた保守センタ7では、通知の内容から障害通報経路に異常がある旨をサーバ装置1の管理者に伝えるとともに、通信経路の障害箇所を確認するとともに通報されなかった障害がないかを確認するため、保守員71がサーバ設置場所に行き、サーバ側ルータ50の障害であることを見極め、交換するとともに、サーバ装置1自体には障害はないことを確認することでシステムが正常状態に戻る。
When the warning message is transmitted by the
以上のように、複数のサーバ装置についてサーバ装置もしくは障害発生通報経路に異常が発生した場合でも、障害の発生を検出できるとともに、場合によってはサーバ装置での障害が発生した時に障害発生通報がコールセンタに届かなくなることを未然に防ぐことが可能になるため、信頼性の高いシステムを構築することができる。 As described above, even when an abnormality occurs in the server device or the failure occurrence notification path for a plurality of server devices, the occurrence of the failure can be detected, and in some cases, when the failure occurs in the server device, the failure occurrence notification is sent to the call center. Therefore, it is possible to construct a highly reliable system.
以上、実施の形態1〜3では、
サーバ装置の障害発生を監視するサーバ監視部に障害通報送信カウンタを設け、障害通報を受信するコールセンタ装置にはサーバ装置毎に障害通報受信カウンタを設け、サーバ装置で障害が発生したことを検出した監視部は障害発生を通報する度に障害通報送信カウンタを+1し、コールセンタ装置側では障害通報を受信する度に障害通報受信カウンタを+1し、
サーバ監視部は定期的に障害通報送信カウンタの内容をコールセンタ装置に送信するようにし、コールセンタ装置で、サーバ監視部から送信されてきた障害通報送信カウンタの内容と障害通報受信カウンタの内容を比較し、
コールセンタ装置で両者が一致しないことを検出した場合には、監視対象のサーバ装置とコールセンタ装置間の通信経路に障害が発生したか、設定に誤りがあることを検出でき、保守センタに通知できるので、通信経路断などの障害が発生したことを素早く検出でき、対処することができるようになり、システムの信頼性を上げることができるシステムを説明した。
As described above, in the first to third embodiments,
The server monitoring unit that monitors the occurrence of a failure in the server device is provided with a failure notification transmission counter, and the call center device that receives the failure notification is provided with a failure notification reception counter for each server device to detect that a failure has occurred in the server device. The monitoring unit increments the trouble report transmission counter by +1 every time it reports the occurrence of a trouble, and the call center device side increments the trouble report reception counter by +1 each time a trouble report is received.
The server monitoring unit periodically transmits the content of the failure notification transmission counter to the call center device, and the call center device compares the content of the failure notification transmission counter transmitted from the server monitoring unit with the content of the failure notification reception counter. ,
If the call center device detects that the two do not match, it can detect that a failure has occurred in the communication path between the monitored server device and the call center device or that there is an error in the settings, and can notify the maintenance center. A system that can quickly detect and deal with the occurrence of a failure such as a communication path interruption and improve the reliability of the system has been described.
なお、以上の説明では、サーバ装置1における障害の発生をコールセンタ装置6に通知する例を説明したが、通知する内容は障害の発生に限らない。
サーバ装置1における所定のイベントの発生を通知するイベント通知をコールセンタ装置6に送信するシステム構成において、サーバ装置1でイベント通知の送信回数を計数し、コールセンタ装置6でイベント通知の受信回数を計数し、所定の間隔でサーバ装置1がイベント通知の送信回数を通知するようにしてもよい。
また、イベント通知を送受信する装置は、サーバ装置1とコールセンタ装置6に限定されない。
In the above description, an example in which the occurrence of a failure in the
In a system configuration in which an event notification for notifying the occurrence of a predetermined event in the
Further, the device that transmits and receives the event notification is not limited to the
最後に、実施の形態1〜3に示したサーバ装置1及びコールセンタ装置6のハードウェア構成例について説明する。
図17は、実施の形態1〜3に示すサーバ装置1及びコールセンタ装置6のハードウェア資源の一例を示す図である。
なお、図17の構成は、あくまでもサーバ装置1及びコールセンタ装置6のハードウェア構成の一例を示すものであり、サーバ装置1及びコールセンタ装置6のハードウェア構成は図17に記載の構成に限らず、他の構成であってもよい。
Finally, hardware configuration examples of the
FIG. 17 is a diagram illustrating an example of hardware resources of the
The configuration in FIG. 17 is merely an example of the hardware configuration of the
図17において、サーバ装置1及びコールセンタ装置6は、プログラムを実行するCPU911(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。
CPU911は、バス912を介して、例えば、ROM(Read Only Memory)913、RAM(Random Access Memory)914、通信ボード915、表示装置901、キーボード902、マウス903、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。
更に、CPU911は、FDD904(Flexible Disk Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907と接続していてもよい。また、磁気ディスク装置920の代わりに、SSD(Solid State Drive)、光ディスク装置、メモリカード(登録商標)読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置の一例である。
実施の形態1〜3で説明した通知蓄積部64又はサーバ群監視情報記憶部800は、RAM914、磁気ディスク装置920等により実現される。
通信ボード915、キーボード902、マウス903、スキャナ装置907、FDD904などは、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは出力装置の一例である。
In FIG. 17, the
The
Further, the
The
The
A
The
通信ボード915は、図1に示すように、ネットワークに接続されている。
例えば、通信ボード915は、LAN(ローカルエリアネットワーク)、インターネット、WAN(ワイドエリアネットワーク)、SAN(ストレージエリアネットワーク)などに接続されていても構わない。
As shown in FIG. 1, the
For example, the
磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。
プログラム群923のプログラムは、CPU911がオペレーティングシステム921、ウィンドウシステム922を利用しながら実行する。
The
The programs in the
また、RAM914には、CPU911に実行させるオペレーティングシステム921のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。
また、RAM914には、CPU911による処理に必要な各種データが格納される。
The
The
また、ROM913には、BIOS(Basic Input Output System)プログラムが格納され、磁気ディスク装置920にはブートプログラムが格納されている。
サーバ装置1及びコールセンタ装置6の起動時には、ROM913のBIOSプログラム及び磁気ディスク装置920のブートプログラムが実行され、BIOSプログラム及びブートプログラムによりオペレーティングシステム921が起動される。
The
When the
上記プログラム群923には、実施の形態1〜3の説明において「〜部」(通知蓄積部64及びサーバ群監視情報記憶部800以外、以下同様)として説明している機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
The
ファイル群924には、実施の形態1〜3の説明において、「〜の判断」、「〜の計算」、「〜の比較」、「〜の読み出し」、「〜の更新」、「〜の設定」、「〜の登録」、「〜の選択」、「〜の入力」、「〜の出力」等として説明している処理の結果を示す情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。
「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。
ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出される。
そして、読み出された情報やデータや信号値や変数値やパラメータは、抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示などのCPUの動作に用いられる。
抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリ、レジスタ、キャッシュメモリ、バッファメモリ等に一時的に記憶される。
また、実施の形態1〜3で説明しているフローチャートの矢印の部分は主としてデータや信号の入出力を示す。
データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD等の記録媒体に記録される。
また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
In the
The “˜file” and “˜database” are stored in a recording medium such as a disk or a memory.
Information, data, signal values, variable values, and parameters stored in a storage medium such as a disk or memory are read out to the main memory or cache memory by the
The read information, data, signal value, variable value, and parameter are used for CPU operations such as extraction, search, reference, comparison, calculation, calculation, processing, editing, output, printing, and display.
Information, data, signal values, variable values, and parameters are stored in the main memory, registers, cache memory, and buffers during the CPU operations of extraction, search, reference, comparison, calculation, processing, editing, output, printing, and display. It is temporarily stored in a memory or the like.
In addition, the arrows in the flowcharts described in
Data and signal values are recorded on a recording medium such as a memory of the
Data and signals are transmitted online via a bus 912, signal lines, cables, or other transmission media.
また、実施の形態1〜3の説明において「〜部」として説明しているものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。
すなわち、実施の形態1〜3で説明したフローチャートに示すステップ、手順、処理により、本発明を方法の発明として把握することができる。
また、「〜部」として説明しているものは、ROM913に記憶されたファームウェアで実現されていても構わない。
或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。
ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。
プログラムはCPU911により読み出され、CPU911により実行される。
すなわち、プログラムは、実施の形態1〜3の「〜部」としてコンピュータを機能させるものである。あるいは、実施の形態1〜3の「〜部」の手順や方法をコンピュータに実行させるものである。
In addition, what is described as “˜unit” in the description of the first to third embodiments may be “˜circuit”, “˜device”, “˜device”, and “˜step”, It may be “˜procedure” or “˜processing”.
That is, the present invention can be grasped as a method invention by the steps, procedures, and processes shown in the flowcharts described in the first to third embodiments.
Further, what is described as “˜unit” may be realized by firmware stored in the
Alternatively, it may be implemented only by software, or only by hardware such as elements, devices, substrates, and wirings, by a combination of software and hardware, or by a combination of firmware.
Firmware and software are stored as programs in a recording medium such as a magnetic disk, a flexible disk, an optical disk, a compact disk, a mini disk, and a DVD.
The program is read by the
That is, the program causes the computer to function as “to part” in the first to third embodiments. Alternatively, the computer executes the procedure and method of “to part” in the first to third embodiments.
このように、実施の形態1〜3に示すサーバ装置1及びコールセンタ装置6は、処理装置たるCPU、記憶装置たるメモリ、磁気ディスク等、入力装置たるキーボード、マウス、通信ボード等、出力装置たる表示装置、通信ボード等を備えるコンピュータである。
そして、上記したように「〜部」として示された機能をこれら処理装置、記憶装置、入力装置、出力装置を用いて実現するものである。
As described above, the
Then, as described above, the functions indicated as “˜units” are realized using these processing devices, storage devices, input devices, and output devices.
1 サーバ装置、2 サーバ監視部、5 通信回線、6 コールセンタ装置、7 保守センタ、8 通報確認部、9 通信回線、21 障害検出部、22 通報通知作成部、23 通報通知送信部、24 障害通報送信カウンタ、25 送信間隔設定部、26 送信間隔計測タイマ、27 要求信号、50 サーバ側ルータ、60 センタ側ルータ、61 制御部、62 通報通知受信部、63 通知生成部、64 通知蓄積部、65 通知出力部、66 通知メッセージ、70 保守センタ装置、71 保守員、80 通報通知解析部、81 障害通報受信カウンタ、82 障害通報送信回数受信部、83 比較部、84 通知受信間隔計測タイマ、85 受信間隔設定部、800 サーバ群監視情報記憶部、810 サーバ1対応情報ブロック、811 障害通報受信カウンタ、812 障害通報送信回数受信部、814 通知受信間隔計測タイマ、815 受信間隔設定部、816 アドレス設定部、817 サーバ1近隣保守センタアドレス、818 サーバ1有効フラグ。
DESCRIPTION OF
Claims (12)
前記イベント通知生成部により生成されたイベント通知を所定の管理装置に対して送信するイベント通知送信部と、
前記イベント通知送信部によりイベント通知が送信される度に、イベント通知の送信回数を計数するイベント通知送信回数計数部と、
所定の間隔で、前記イベント通知送信回数計数部により計数されたイベント通知の送信回数を通知する送信回数通知を生成する送信回数通知生成部と、
前記送信回数通知生成部により生成された送信回数通知を前記管理装置に対して送信する送信回数通知送信部とを有することを特徴とする情報処理装置。 An event notification generator for generating an event notification for notifying the occurrence of an event when a predetermined event occurs;
An event notification transmitter for transmitting the event notification generated by the event notification generator to a predetermined management device;
Each time an event notification is transmitted by the event notification transmission unit, an event notification transmission number counting unit that counts the number of event notification transmissions,
A transmission frequency notification generating unit for generating a transmission frequency notification for notifying the transmission frequency of the event notification counted by the event notification transmission frequency counting unit at a predetermined interval;
An information processing apparatus comprising: a transmission frequency notification transmission unit that transmits the transmission frequency notification generated by the transmission frequency notification generation unit to the management device.
所定の監視対象物における障害を検出し、障害検出イベントを発生させる障害検出部を有し、
前記イベント通知生成部は、
前記障害検出部により障害検出イベントが発生した場合に、障害検出イベントを通知するイベント通知を生成することを特徴とする請求項1に記載の情報処理装置。 The information processing apparatus includes:
A fault detection unit that detects a fault in a predetermined monitoring target and generates a fault detection event;
The event notification generation unit
The information processing apparatus according to claim 1, wherein an event notification for notifying a failure detection event is generated when a failure detection event occurs by the failure detection unit.
前記イベント通知受信部によりイベント通知が受信される度に、イベント通知の受信回数を計数するイベント通知受信回数計数部と、
前記情報処理装置から所定の間隔で送信される、前記情報処理装置で計数されたイベント通知の送信回数が通知される送信回数通知を受信する送信回数通知受信部と、
前記送信回数通知受信部により送信回数通知が受信された際に、受信された送信回数通知で通知されているイベント通知の送信回数と、前記イベント通知受信回数計数部により計数されているイベント通知の受信回数とを比較する比較部と、
前記比較部による比較の結果、イベント通知の送信回数とイベント通知の受信回数が一致しない場合に、異常の発生の可能性を警告する警告メッセージを生成する警告メッセージ生成部と、
前記警告メッセージ生成部により生成された警告メッセージを出力する警告メッセージ出力部とを有することを特徴とする管理装置。 An event notification receiver for receiving an event notification for notifying the occurrence of a predetermined event in the information processing device from the information processing device;
Each time an event notification is received by the event notification receiving unit, an event notification reception number counting unit that counts the number of receptions of event notifications,
A transmission frequency notification receiving unit that receives a transmission frequency notification that is transmitted from the information processing device at a predetermined interval and that is notified of the transmission frequency of the event notification counted by the information processing device;
When the transmission number notification is received by the transmission number notification receiving unit, the event notification transmission number notified by the received transmission number notification and the event notification counted by the event notification reception number counting unit A comparison unit that compares the number of receptions;
As a result of the comparison by the comparison unit, when the number of event notification transmissions and the number of event notification receptions do not match, a warning message generation unit that generates a warning message that warns the possibility of occurrence of an abnormality,
A management apparatus comprising: a warning message output unit that outputs a warning message generated by the warning message generation unit.
前記送信回数通知受信部が前記情報処理装置から送信回数通知を受信してからの経過時間を計測し、経過時間が所定の閾値を超過した場合に、経過時間が閾値を超過したことを通知する経過時間計測部を有し、
前記警告メッセージ生成部は、
前記経過時間計測部から経過時間が閾値を超過したことが通知された場合に、警告メッセージを生成することを特徴とする請求項3に記載の管理装置。 The management device further includes:
The transmission count notification receiving unit measures an elapsed time after receiving the transmission count notification from the information processing apparatus, and notifies that the elapsed time exceeds the threshold when the elapsed time exceeds a predetermined threshold. Has an elapsed time measurement unit,
The warning message generator
The management apparatus according to claim 3, wherein a warning message is generated when the elapsed time measurement unit notifies that the elapsed time has exceeded a threshold value.
前記情報処理装置との通信経路における異常の発生の可能性を警告する警告メッセージを生成することを特徴とする請求項3又は4に記載の管理装置。 The warning message generator
The management apparatus according to claim 3 or 4, wherein a warning message is generated to warn of a possibility of occurrence of an abnormality in a communication path with the information processing apparatus.
前記情報処理装置の保守を行う保守センタに設けられている装置に対して、警告メッセージを出力することを特徴とする請求項3〜5のいずれかに記載の管理装置。 The warning message output unit
6. The management apparatus according to claim 3, wherein a warning message is output to an apparatus provided in a maintenance center that performs maintenance of the information processing apparatus.
複数の情報処理装置に接続され、
前記イベント通知受信部は、
情報処理装置ごとに、イベント通知を受信し、
前記イベント通知受信回数計数部は、
情報処理装置ごとに、イベント通知の受信回数を計数し、
前記送信回数通知受信部は、
情報処理装置ごとに、送信回数通知を受信し、
前記比較部は、
情報処理装置ごとに、イベント通知の送信回数とイベント通知の受信回数とを比較し、
前記警告メッセージ生成部は、
前記比較部による比較の結果、イベント通知の送信回数とイベント通知の受信回数が一致しない情報処理装置がある場合に、当該情報処理装置について異常の発生の可能性を警告する警告メッセージを生成することを特徴とする請求項3〜6にいずれかに記載の管理装置。 The management device
Connected to multiple information processing devices,
The event notification receiver
Each information processing device receives event notifications,
The event notification reception number counting unit
For each information processing device, count the number of event notifications received,
The transmission number notification receiving unit,
For each information processing device, receive a notification of the number of transmissions,
The comparison unit includes:
For each information processing device, compare the number of event notifications sent and the number of event notifications received,
The warning message generator
As a result of the comparison by the comparison unit, when there is an information processing device whose event notification transmission count and event notification reception count do not match, a warning message is generated to warn of the possibility of an abnormality in the information processing device. The management apparatus according to any one of claims 3 to 6, wherein:
情報処理装置ごとに、前記送信回数通知受信部が送信回数通知を受信してからの経過時間を計測し、経過時間が所定の閾値を超過した情報処理装置がある場合に、当該情報処理装置について経過時間が閾値を超過したことを通知する経過時間計測部を有し、
前記警告メッセージ生成部は、
前記経過時間計測部から経過時間が閾値を超過したことが通知された情報処理装置について、警告メッセージを生成することを特徴とする請求項7に記載の管理装置。 The management device further includes:
For each information processing device, if there is an information processing device that measures the elapsed time since the transmission number notification receiving unit received the transmission number notification and the elapsed time exceeds a predetermined threshold, the information processing device It has an elapsed time measurement unit that notifies that the elapsed time has exceeded the threshold,
The warning message generator
The management apparatus according to claim 7, wherein a warning message is generated for an information processing apparatus notified from the elapsed time measurement unit that the elapsed time has exceeded a threshold value.
前記警告メッセージ生成部により警告メッセージが生成された情報処理装置の保守を行う保守センタに設けられている装置に対して、警告メッセージを出力する警告メッセージ出力部を有することを特徴とする請求項7又は8に記載の管理装置。 The management device further includes:
8. A warning message output unit that outputs a warning message to an apparatus provided in a maintenance center that performs maintenance of the information processing apparatus for which the warning message has been generated by the warning message generation unit. Or the management apparatus of 8.
情報処理装置で発生した障害検出イベントを通知するイベント通知を受信することを特徴とする請求項3〜9のいずれかに記載の管理装置。 The event notification receiver
The management apparatus according to claim 3, wherein an event notification for notifying a failure detection event that has occurred in the information processing apparatus is received.
前記イベント通知生成処理により生成されたイベント通知を所定の管理装置に対して送信するイベント通知送信処理と、
前記イベント通知送信処理によりイベント通知が送信される度に、イベント通知の送信回数を計数するイベント通知送信回数計数処理と、
所定の間隔で、前記イベント通知送信回数計数処理により計数されたイベント通知の送信回数を通知する送信回数通知を生成する送信回数通知生成処理と、
前記送信回数通知生成処理により生成された送信回数通知を前記管理装置に対して送信する送信回数通知送信処理とをコンピュータに実行させることを特徴とするプログラム。 An event notification generation process for generating an event notification for notifying the occurrence of an event when a predetermined event occurs;
An event notification transmission process for transmitting the event notification generated by the event notification generation process to a predetermined management device;
Each time an event notification is transmitted by the event notification transmission process, an event notification transmission number counting process for counting the number of event notification transmissions;
A transmission frequency notification generation process for generating a transmission frequency notification for notifying the transmission frequency of the event notification counted by the event notification transmission frequency counting process at a predetermined interval;
A program that causes a computer to execute a transmission frequency notification transmission process of transmitting a transmission frequency notification generated by the transmission frequency notification generation process to the management apparatus.
前記イベント通知受信処理によりイベント通知が受信される度に、イベント通知の受信回数を計数するイベント通知受信回数計数処理と、
前記情報処理装置から所定の間隔で送信される、前記情報処理装置で計数されたイベント通知の送信回数が通知される送信回数通知を受信する送信回数通知受信処理と、
前記送信回数通知受信処理により送信回数通知が受信された際に、受信された送信回数通知で通知されているイベント通知の送信回数と、前記イベント通知受信回数計数処理により計数されているイベント通知の受信回数とを比較する比較処理と、
前記比較処理による比較の結果、イベント通知の送信回数とイベント通知の受信回数が一致しない場合に、異常の発生の可能性を警告する警告メッセージを生成する警告メッセージ生成処理と、
前記警告メッセージ生成処理により生成された警告メッセージを出力する警告メッセージ出力処理とをコンピュータに実行させることを特徴とするプログラム。 An event notification receiving process for receiving an event notification for notifying the occurrence of a predetermined event in the information processing device from the information processing device;
Each time an event notification is received by the event notification reception process, an event notification reception count process for counting the number of event notifications received,
A transmission count notification reception process for receiving a transmission count notification to be transmitted from the information processing apparatus at a predetermined interval to be notified of the transmission count of the event notification counted by the information processing apparatus;
When the transmission count notification is received by the transmission count notification reception process, the event notification transmission count notified by the received transmission count notification and the event notification count counted by the event notification reception count counting process A comparison process for comparing the number of receptions;
As a result of the comparison by the comparison process, when the event notification transmission count and the event notification reception count do not match, a warning message generation processing that generates a warning message that warns the possibility of occurrence of an abnormality,
A program for causing a computer to execute warning message output processing for outputting a warning message generated by the warning message generation processing.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010210929A JP2012068729A (en) | 2010-09-21 | 2010-09-21 | Information processor and management device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010210929A JP2012068729A (en) | 2010-09-21 | 2010-09-21 | Information processor and management device and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012068729A true JP2012068729A (en) | 2012-04-05 |
Family
ID=46165982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010210929A Pending JP2012068729A (en) | 2010-09-21 | 2010-09-21 | Information processor and management device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012068729A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014010538A (en) * | 2012-06-28 | 2014-01-20 | Nec Corp | Operation management device, operation management system, and operation management method |
JP2016149655A (en) * | 2015-02-12 | 2016-08-18 | 富士通株式会社 | Management method, management program, management apparatus, management system, and information processing method |
KR102018556B1 (en) * | 2018-10-11 | 2019-09-05 | 주식회사 컴패스 | Management system and method for managing defect repairing |
-
2010
- 2010-09-21 JP JP2010210929A patent/JP2012068729A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014010538A (en) * | 2012-06-28 | 2014-01-20 | Nec Corp | Operation management device, operation management system, and operation management method |
JP2016149655A (en) * | 2015-02-12 | 2016-08-18 | 富士通株式会社 | Management method, management program, management apparatus, management system, and information processing method |
KR102018556B1 (en) * | 2018-10-11 | 2019-09-05 | 주식회사 컴패스 | Management system and method for managing defect repairing |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9367379B1 (en) | Automated self-healing computer system | |
CN110377469B (en) | Detection system and method for PCIE (peripheral component interface express) equipment | |
US20080155332A1 (en) | Point of sale system boot failure detection | |
CN107896172B (en) | Monitoring fault processing method and device, storage medium and electronic equipment | |
US20080140895A1 (en) | Systems and Arrangements for Interrupt Management in a Processing Environment | |
CN1841547B (en) | Method and apparatus for identifying failure module | |
WO2012046293A1 (en) | Fault monitoring device, fault monitoring method and program | |
JP2011100283A (en) | Management device, equipment management method, equipment management program, recording medium, and equipment management system | |
US20210405097A1 (en) | Reliable hardware metering | |
JP6183931B2 (en) | Cluster system, server apparatus, cluster system management method, and program | |
JP2011113122A (en) | Failure influence analysis device, application system, and failure influence analysis method | |
CN111176866A (en) | Data interaction method and electronic equipment | |
JP2012068729A (en) | Information processor and management device and program | |
CN112783703A (en) | SAS link fault positioning method, device, equipment and storage medium | |
US20080288828A1 (en) | structures for interrupt management in a processing environment | |
JP4102592B2 (en) | Failure information notification system with an aggregation function and a program for causing a machine to function as a failure information notification means with an aggregation function | |
CN113014640B (en) | Request processing method, request processing device, electronic equipment and storage medium | |
CN113868058A (en) | Peripheral component high-speed interconnection equipment fault detection method and device and server | |
JP2006268515A (en) | Pci card trouble management system | |
KR101572672B1 (en) | Method for monitoring node failure on communication network and system thereof | |
JP2001005692A (en) | Computer system, its maintenance and management system, and method for informing of fault | |
US11153769B2 (en) | Network fault discovery | |
US9594622B2 (en) | Contacting remote support (call home) and reporting a catastrophic event with supporting documentation | |
JP4081258B2 (en) | Management server system | |
JP5814842B2 (en) | E-mail relay device |