JP4533716B2 - Re-warning system for failure messages - Google Patents

Re-warning system for failure messages Download PDF

Info

Publication number
JP4533716B2
JP4533716B2 JP2004298459A JP2004298459A JP4533716B2 JP 4533716 B2 JP4533716 B2 JP 4533716B2 JP 2004298459 A JP2004298459 A JP 2004298459A JP 2004298459 A JP2004298459 A JP 2004298459A JP 4533716 B2 JP4533716 B2 JP 4533716B2
Authority
JP
Japan
Prior art keywords
warning
message
status
failure message
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004298459A
Other languages
Japanese (ja)
Other versions
JP2006113708A (en
Inventor
政行 島田
俊行 益田
健一郎 安部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2004298459A priority Critical patent/JP4533716B2/en
Publication of JP2006113708A publication Critical patent/JP2006113708A/en
Application granted granted Critical
Publication of JP4533716B2 publication Critical patent/JP4533716B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、障害メッセージに対する再警告発動システムに係り、特に、監視対象であるコンピュータシステム内に設けた運行状況監視ツールから送信される障害メッセージに関し、適切な対応が施されることなく放置されることを防止するためのシステム及びプログラムに関する。   The present invention relates to a re-warning activation system for a failure message, and particularly, regarding a failure message transmitted from an operation status monitoring tool provided in a computer system to be monitored, it is left without taking appropriate measures. The present invention relates to a system and a program for preventing this.

近年、コンピュータのソフトウェア及びハードウェアの性能向上に伴い、ソフトウェアやハードウェアに対する運用要件も複雑化してきている。
このため、各ソフトウェア及びハードウェア毎に個別の運行状況監視ツールが導入され、これら複数のツールを統合的に監視する統合監視システムを構築するケースが増えている。
最新の統合監視システムでは、複数の運行状況監視ツールからジョブの運行状況を表す情報メッセージやシステムのトラブルを表す障害メッセージなどを収集するとともに、収集した各メッセージから必要とされる情報を抽出・加工する機能を搭載したソフトウェアが登場している。
In recent years, with the improvement in performance of computer software and hardware, operation requirements for software and hardware have also become complicated.
For this reason, an individual operation status monitoring tool is introduced for each software and hardware, and the number of cases in which an integrated monitoring system for monitoring these plural tools in an integrated manner is increasing.
The latest integrated monitoring system collects information messages indicating job operation status and failure messages indicating system troubles from multiple operation status monitoring tools, and extracts and processes necessary information from each collected message. Software with a function to perform has appeared.

このような統合監視システムに係る先行技術として、例えば以下の特許文献が存在している。
特開平9−134297号公報 この特許文献1には、各企業の監視対象システムから電子メールを介して運行状況データを収集する方式を採用することによってセキュリティ上の問題をクリアし、企業横断的な統合監視業務を実現する遠隔管理システムが開示されている。
For example, the following patent documents exist as prior art related to such an integrated monitoring system.
In Japanese Patent Laid-Open No. 9-134297, the security problem is cleared by adopting a method of collecting operation status data from a monitoring target system of each company via an electronic mail. A remote management system that realizes integrated monitoring work is disclosed.

このような統合監視システムでは、図3に示すように、抽出・加工した情報を専用の運用管理端末に一覧表示することで、運用オペレータに現在の運行状況を通知している。
また統合監視システムは、障害メッセージを受信した際にビープ音やパトランプの鳴動、あるいはポップアップウィンドウを用いた警告表示により、オペレータの注意を喚起する機能を備えている。
In such an integrated monitoring system, as shown in FIG. 3, the current operation status is notified to the operation operator by displaying the extracted / processed information in a list on a dedicated operation management terminal.
The integrated monitoring system also has a function of alerting an operator by receiving a beep sound, a patrol lamp, or a warning display using a pop-up window when a failure message is received.

さらに統合監視システムは、収集した各障害メッセージに対して、現在どのような段階にあるのかを示すステータスを付加する機能を有している。
図10はステータスの一例を示すものであり、障害メッセージを受信した際には、まず統合監視システムによって「オープン」のステータスが当該障害メッセージに設定される。
つぎに、オペレータが統合監視システムによる上記の警告発動に対し認知を示す入力操作を行った場合には、「受付済み」のステータスが設定される。
つぎに、オペレータが関係者に連絡を行い、トラブル復旧作業担当者の割当が完了したことを示す入力操作を行うと、統合監視システムによって「割当済み」のステータスが設定される。
最後に、オペレータによってトラブルが復旧したことを示すデータが入力されると、統合監視システムは「対処完了」のステータスを当該障害メッセージに設定する。
Furthermore, the integrated monitoring system has a function of adding a status indicating what stage it is currently in to each of the collected failure messages.
FIG. 10 shows an example of a status. When a failure message is received, an “open” status is first set in the failure message by the integrated monitoring system.
Next, when the operator performs an input operation indicating recognition for the above-described warning activation by the integrated monitoring system, a status of “accepted” is set.
Next, when the operator contacts the related person and performs an input operation indicating that the assignment of the trouble recovery worker is completed, the status of “allocated” is set by the integrated monitoring system.
Finally, when data indicating that the trouble has been recovered is input by the operator, the integrated monitoring system sets the status of “completion of handling” in the failure message.

上記のように、統合監視システムは障害メッセージの受信時に所定の警告手段を用いてオペレータの注意を喚起すると共に、対応の進展に応じて障害メッセージのステータスが更新されるため、最初の警告が発動された後は、このステータスを監視することでオペレータは障害対応の進捗状況を把握することが可能となる。   As described above, the integrated monitoring system alerts the operator using a predetermined warning means when receiving a failure message, and the status of the failure message is updated as the response progresses, so the first warning is triggered. Thereafter, by monitoring this status, the operator can grasp the progress of failure handling.

しかしながら、監視対象数の増加に伴い膨大なメッセージが統合監視システムに集約されるようになると、障害メッセージが集中的に発生した場合などには一覧画面を目で追うだけでは見落としが生じやすくなる。
実際、最初に警告が発動された直後は緊張感を持って対応に当たっていても、担当者を割り当てた時点でオペレータが安心してしまい、その後のウォッチを怠ったために対応が手遅れになるケースも稀ではない。
However, when an enormous number of messages are aggregated in the integrated monitoring system as the number of monitoring targets increases, oversight of the list screen is likely to occur simply by following the list screen when trouble messages occur in a concentrated manner.
In fact, it is rare that the operator is relieved at the time of assigning the person in charge and the response is too late due to neglect of the subsequent watch even if the response is made with tension immediately after the first warning is triggered. Absent.

この発明は、上記した従来の問題点を解決するためになされたものであり、その目的とするところは、監視対象システムから統合監視システムに障害メッセージが送信された場合に、そのステータスの進行に応じ適当なタイミングでオペレータに再警告を発することにより、対応漏れを有効に防止できる技術を提供することにある。   The present invention has been made to solve the above-described conventional problems, and the object of the present invention is to progress the status when a failure message is transmitted from the monitored system to the integrated monitoring system. Accordingly, it is an object of the present invention to provide a technique capable of effectively preventing omission of response by issuing a re-warning to the operator at an appropriate timing.

上記の目的を達成するため、請求項1に記載した障害メッセージに対する再警告発動システムは、統合監視サーバと運用管理端末とからなるシステムであって、上記統合監視サーバが、複数の監視対象コンピュータにセットアップされた運行状況監視プログラムから障害メッセージが送信された際に、当該障害メッセージに初期状態を示すステータスを設定すると共に、その受付日時をステータス変更日時として設定した上で、メッセージ情報記憶手段に格納する手段と、このメッセージ情報記憶手段に新たな障害メッセージが格納された際、及び各障害メッセージのステータスが変更された際に、障害メッセージの閲覧画面を生成し、上記運用管理端末に送信する手段と、上記運用管理端末から特定の障害メッセージについてステータス変更リクエストが送信された場合に、該当の障害メッセージに設定されたステータス及びステータス変更日時を更新する手段と、警告間隔と、障害メッセージの重大度に対応した複数の重み係数とを設定しておく警告設定情報記憶手段と、上記の警告間隔よりも短い時間間隔である通知間隔が到来する度に、上記メッセージ情報記憶手段に格納された各障害メッセージについて、それぞれのステータス変更日時から現在日時を引き算した経過時間と、上記の警告間隔を各障害メッセージに設定された重大度に対応した重み係数で除して得られた重大度に応じた警告間隔とを比較し、前者が後者以上となっている場合には当該障害メッセージについて再警告が必要であると判定し、再警告信号を上記運用管理端末に送信する再警告発動手段を備え、上記運用管理端末が、上記統合監視サーバから送信された閲覧画面をディスプレイに表示させる手段と、入力装置を介して閲覧画面に表示された特定の障害メッセージについて所定の入力動作がなされた場合に、上記統合監視サーバに対してステータス変更リクエストを送信する手段と、上記統合監視サーバから再警告信号が送信された場合に、所定の警告手段を介して再警告再生処理を実行する手段を備えたことを特徴としている。 In order to achieve the above object, a rewarning activation system for a failure message described in claim 1 is a system comprising an integrated monitoring server and an operation management terminal, wherein the integrated monitoring server is connected to a plurality of monitored computers. When a failure message is sent from the set operation status monitoring program , a status indicating the initial state is set in the failure message, and the reception date and time is set as the status change date and stored in the message information storage means. It means for, when a new fault message is stored in the message information storing means, and when the status of each failure message is changed, generates a viewing screen of a fault message, means for transmitting to the operation management terminal Status change for a specific fault message from the operation management terminal. If the request is sent, means for updating the status and status change time set in the fault message in question and warning interval, is set a plurality of weighting coefficients corresponding to the severity of the fault message warning Each time the notification interval, which is a time interval shorter than the above-mentioned warning interval, arrives at the setting information storage means, the current date and time are subtracted from the status change date and time for each failure message stored in the message information storage means. The elapsed time is compared with the warning interval according to the severity obtained by dividing the above warning interval by the weighting factor corresponding to the severity set for each failure message, and the former is more than the latter. In such a case, it is determined that re-warning is necessary for the failure message, and re-warning means for transmitting a re-warning signal to the operation management terminal is provided. When the operation management terminal performs a predetermined input operation for a specific failure message displayed on the browsing screen via the input device and means for displaying the browsing screen transmitted from the integrated monitoring server on the display, Means for transmitting a status change request to the integrated monitoring server, and means for executing re-warning reproduction processing via a predetermined warning means when a re-warning signal is transmitted from the integrated monitoring server It is characterized by.

請求項2に記載した障害メッセージに対する再警告発動システムは、請求項1のシステムであって、さらに、上記統合監視サーバの警告設定情報記憶手段には、障害メッセージのステータスに対応した複数の警告間隔が設定されており、上記統合監視サーバの再警告発動手段が、各障害メッセージに設定されたステータスに対応した警告間隔に基づいて上記の重大度に応じた警告間隔を算出することを特徴としている。 The re-warning activation system for a failure message according to claim 2 is the system according to claim 1, and the warning setting information storage means of the integrated monitoring server further includes a plurality of warning intervals corresponding to the status of the failure message. There are set, re-alert activation means of the integrated monitoring server, is characterized by calculating a warning distance corresponding to the severity based on alert intervals corresponding to the status set in each fault message .

請求項3に記載した障害メッセージに対する再警告発動システムは、統合監視サーバと運用管理端末とからなるシステムであって、上記統合監視サーバが、複数の監視対象コンピュータにセットアップされた運行状況監視プログラムから障害メッセージが送信された際に、当該障害メッセージに初期状態を示すステータスを設定すると共に、その受付日時をステータス変更日時として設定した上で、メッセージ情報記憶手段に格納する手段と、このメッセージ情報記憶手段に新たな障害メッセージが格納された際、及び各障害メッセージのステータスが変更された際に、障害メッセージの閲覧画面を生成し、上記運用管理端末に送信する手段と、上記運用管理端末から特定の障害メッセージについてステータス変更リクエストが送信された場合に、該当の障害メッセージに設定されたステータス及びステータス変更日時を更新する手段と、障害メッセージの重大度に対応した複数の警告間隔を設定しておく警告設定情報記憶手段と、上記の警告間隔よりも短い時間間隔である通知間隔が到来する度に、上記メッセージ情報記憶手段に格納された各障害メッセージについて、それぞれのステータス変更日時から現在日時を引き算した経過時間と、当該障害メッセージに設定された重大度に対応した警告間隔とを比較し、前者が後者以上となっている場合には当該障害メッセージについて再警告が必要であると判定し、再警告信号を上記運用管理端末に送信する再警告発動手段を備え、上記運用管理端末が、上記統合監視サーバから送信された閲覧画面をディスプレイに表示させる手段と、入力装置を介して閲覧画面に表示された特定の障害メッセージについて所定の入力動作がなされた場合に、上記統合監視サーバに対してステータス変更リクエストを送信する手段と、上記統合監視サーバから再警告信号が送信された場合に、所定の警告手段を介して再警告再生処理を実行する手段を備えたことを特徴としている。 A re-warning activation system for a failure message according to claim 3 is a system comprising an integrated monitoring server and an operation management terminal, wherein the integrated monitoring server is based on an operation status monitoring program set up on a plurality of monitoring target computers. When a failure message is transmitted, a status indicating an initial state is set in the failure message, and the reception date / time is set as the status change date / time, and then stored in the message information storage unit, and the message information storage when a new fault message is stored in the unit, and when the status of each failure message is changed, generates a viewing screen of a fault message, it means for transmitting to the operation management terminal, specified from the operation management terminal If a status change request is sent for a failure message , The means for updating the status and status change time set in the fault message in question and warning setting information storage means to set a plurality of warning interval corresponding to the severity of the fault message, than the warning distance For each failure message stored in the message information storage means each time a notification interval that is a short time interval arrives, the elapsed time obtained by subtracting the current date and time from the status change date and time, and the failure message are set. Compared with the warning interval corresponding to the severity, if the former is greater than or equal to the latter, it is determined that a re-warning is required for the failure message, and a re-warning is sent to the operation management terminal. Means for causing the operation management terminal to display the browsing screen transmitted from the integrated monitoring server on a display. A means for transmitting a status change request to the integrated monitoring server when a predetermined input operation is performed for a specific failure message displayed on the browsing screen via the input device, and a re-warning from the integrated monitoring server A feature is provided that includes means for executing a re-warning reproduction process via a predetermined warning means when a signal is transmitted .

請求項4に記載した障害メッセージに対する再警告発動システムは、請求項1〜3のシステムであって、さらに上記統合監視サーバの再警告発動手段が、特定の障害メッセージに関して再警告信号を生成し、運用管理端末に送信した場合に、その送信日時によって当該障害メッセージのステータス変更日時を更新する処理を実行することを特徴としている。 The re-warning system for a failure message described in claim 4 is the system according to claims 1 to 3, wherein the re-warning operation means of the integrated monitoring server generates a re-warning signal for a specific failure message, In the case of transmission to the operation management terminal, processing for updating the status change date and time of the failure message is executed according to the transmission date and time.

請求項1及び3の障害メッセージに対する再警告発動システムによれば、監視対象コンピュータから新たな障害メッセージが送信され、障害の発生を示す閲覧画面が送信された後も、障害メッセージのステータスが移行する度に所定の警告間隔(猶予間隔)が経過したか否かが、これよりも短い通知間隔(チェック間隔)が到来する度に判定され、警告間隔を過ぎても次のステータスに移行しない障害メッセージに対しては再警告信号が運用管理端末に送信されるため、障害メッセージが未対応のまま放置されることを有効に防止することができる。
しかも、各障害メッセージの重大度に応じて警告間隔を異ならせることが可能となり、重大度がより高い場合には比較的短い時間間隔で再警告を発動し、重大度が低い場合には長い時間間隔で再警告を発動するといった柔軟な運用が実現できる。
According to the rewarning activation system for a failure message according to claims 1 and 3 , the status of the failure message shifts even after a new failure message is transmitted from the monitored computer and a browsing screen indicating the occurrence of the failure is transmitted. A failure message that determines whether or not a predetermined warning interval (grace interval) has passed each time, every time a shorter notification interval (check interval) arrives, and does not shift to the next status even after the warning interval has passed. Since the re-warning signal is transmitted to the operation management terminal, it is possible to effectively prevent the failure message from being left unsupported.
Moreover, it is possible to change the warning interval according to the severity of each failure message. When the severity is higher, the re-warning is triggered at a relatively short time interval, and when the severity is low, the warning time is longer. Flexible operation such as re-warning at intervals can be realized.

請求項の障害メッセージに対する再警告発動システムによれば、各障害メッセージのステータスに応じて警告間隔を異ならせることが可能となり、より迅速な対応を要するステータスの場合には比較的短い時間間隔で再警告を発動し、緊急性の低いステータスの場合には長い時間間隔で再警告を発動するといった柔軟な運用が実現できる。 According to the re-warning activation system for the failure message of claim 2 , it becomes possible to change the warning interval according to the status of each failure message, and in the case of a status that requires a quicker response, in a relatively short time interval. It is possible to realize a flexible operation in which a re-warning is activated and a re-warning is activated at a long time interval in the case of a status of low urgency.

請求項の障害メッセージに対する再警告発動システムによれば、再警告信号を運用管理端末に送信した際に、その送信日時が当該障害メッセージのステータス変更日時として更新されるため、ステータスの変更がなくてもその時点で新たな警告間隔が適用されることとなる。
このため、ステータスの変更がないまま次の通知間隔が到来しても、新たな警告間隔が経過するまでは再警告信号の送信が停止されることとなり、オペレータ等は落ち着いた環境で障害対応に当たることが可能となる。
According to the re-warning activation system for the failure message of claim 4 , when the re-warning signal is transmitted to the operation management terminal, the transmission date / time is updated as the status change date / time of the failure message, so there is no status change. However, a new warning interval is applied at that time.
For this reason, even if the next notification interval arrives without changing the status, the transmission of the re-warning signal will be stopped until the new warning interval elapses, and the operator will respond to the failure in a calm environment. It becomes possible.

図1は、障害メッセージに対する再警告発動システム10の全体構成を示す概念図であり、システムの中核をなす統合監視サーバ12と、監視対象である複数のコンピュータネットワーク14と、監視オペレータαが操作する運用管理端末16を備えている。   FIG. 1 is a conceptual diagram showing an overall configuration of a re-warning system 10 for a failure message, which is operated by an integrated monitoring server 12 that forms the core of the system, a plurality of computer networks 14 to be monitored, and a monitoring operator α. An operation management terminal 16 is provided.

統合監視サーバ12は、メッセージ受信部20と、メッセージ処理部22と、メッセージ情報格納部24と、表示画面生成部26と、ステータス更新部28と、警告設定情報格納部30と、警告発動部32を備えている。
上記メッセージ受信部20、メッセージ処理部22、表示画面生成部26、ステータス更新部28及び警告発動部32は、統合監視サーバ12のCPUがOS及び各種アプリケーションプログラムに従って必要な処理を実行することによって実現される。
また、上記メッセージ情報格納部24及び警告設定情報格納部30は、統合監視サーバ12のハードディスク内に設けられている。
The integrated monitoring server 12 includes a message receiving unit 20, a message processing unit 22, a message information storage unit 24, a display screen generation unit 26, a status update unit 28, a warning setting information storage unit 30, and a warning issuing unit 32. It has.
The message receiving unit 20, the message processing unit 22, the display screen generation unit 26, the status update unit 28, and the warning issuing unit 32 are realized by the CPU of the integrated monitoring server 12 executing necessary processes according to the OS and various application programs. Is done.
Further, the message information storage unit 24 and the warning setting information storage unit 30 are provided in the hard disk of the integrated monitoring server 12.

監視対象である各コンピュータネットワーク14は、多数のサーバ36をLANを介して接続させたものよりなり、専用線38及びルータ40を介して統合監視サーバ12と接続されている。
図示の便宜上、二つのコンピュータネットワーク14のみが描かれているが、実際には多数のコンピュータネットワーク14が統合監視サーバ12に接続されている。
Each computer network 14 to be monitored consists of a number of servers 36 connected via a LAN, and is connected to the integrated monitoring server 12 via a dedicated line 38 and a router 40.
For convenience of illustration, only two computer networks 14 are illustrated, but in reality, a large number of computer networks 14 are connected to the integrated monitoring server 12.

また、コンピュータネットワーク14に含まれる各サーバ36には、業務用のアプリケーションプログラム以外に、システム障害発生時等にエラーメッセージ等の各種メッセージを統合監視サーバ12に送信するための専用監視ツール(プログラム)がセットアップされている。
これらの専用監視ツールは、個別に対象ソフトウェア及びハードウェアを監視し、その監視結果をメッセージとして統合監視サーバ12に送信する機能を備えており、例えばネットワーク障害を監視するネットワーク監視ツール、データベースの稼動状況を監視するDB監視ツール、ジョブの運用管理を行うジョブスケジュールツール等が該当する。
Each server 36 included in the computer network 14 includes a dedicated monitoring tool (program) for transmitting various messages such as an error message to the integrated monitoring server 12 when a system failure occurs in addition to a business application program. Has been set up.
These dedicated monitoring tools have the function of individually monitoring the target software and hardware and sending the monitoring result as a message to the integrated monitoring server 12. For example, a network monitoring tool for monitoring a network failure, operation of a database, etc. This includes DB monitoring tools that monitor status, job schedule tools that manage job operations, and so on.

運用管理端末16は、PC等のコンピュータよりなり、メッセージ表示部42と、ステータス変更要求部44と、警告再生部46を備えている。
これらメッセージ表示部42、ステータス変更要求部44、及び警告再生部46は、運用管理端末16のCPUがOS及び各種アプリケーションプログラムに従って必要な処理を実行することによって実現される。
運用管理端末16には、インターフェイスを介してディスプレイ48、マウスやキーボード等の入力装置50、パトランプ52、スピーカ54が接続されている。
また、これらの中のディスプレイ48、パトランプ52、スピーカ54が警告手段として機能することとなる。
The operation management terminal 16 includes a computer such as a PC, and includes a message display unit 42, a status change request unit 44, and a warning reproduction unit 46.
The message display unit 42, the status change request unit 44, and the warning reproduction unit 46 are realized by the CPU of the operation management terminal 16 executing necessary processes according to the OS and various application programs.
The operation management terminal 16 is connected to a display 48, an input device 50 such as a mouse and a keyboard, a patrol lamp 52, and a speaker 54 through an interface.
Of these, the display 48, the patrol lamp 52, and the speaker 54 function as warning means.

しかして、コンピュータネットワーク14の各サーバ36からメッセージが統合監視サーバ12に送信されると、メッセージ受信部20がこれを受け取り、メッセージ処理部22に渡す。
メッセージ処理部22は、各メッセージに必要な加工処理を施した後、メッセージ情報格納部24に登録する。
図2は、このメッセージ情報格納部24内に登録されたメッセージ情報の構成例を示すものであり、メッセージID、システム名、発生元ノードID、発生元APP(アプリケーションプログラム)名、発生日時、メッセージ種別(障害メッセージか状況通知メッセージか)、メッセージテキスト、重大度、ステータス、ステータス変更日時のデータ項目を備えている。
この時点では、メッセージ処理部22によって「ステータス」の項目に「オープン」が設定されると共に、「ステータス変更日時」の項目に受付日時が記録される。
Thus, when a message is transmitted from each server 36 of the computer network 14 to the integrated monitoring server 12, the message receiving unit 20 receives it and passes it to the message processing unit 22.
The message processing unit 22 performs necessary processing on each message and then registers it in the message information storage unit 24.
FIG. 2 shows a configuration example of the message information registered in the message information storage unit 24. The message ID, system name, source node ID, source APP (application program) name, date and time of occurrence, message It has data items of type (failure message or status notification message), message text, severity, status, and status change date / time.
At this point, “open” is set in the “status” item by the message processing unit 22, and the reception date and time is recorded in the “status change date” item.

メッセージ情報格納部24に新たなメッセージ情報が登録されると、表示画面生成部26によって新たなメッセージ一覧画面が生成され、運用管理端末16に送信される。
このメッセージ一覧画面は、図3に示すように、運用管理端末16のメッセージ表示部42によってディスプレイ48に表示される。
この際、新たなメッセージ情報が対応を要する障害メッセージである場合には、ディスプレイ48上にポップアップウィンドウが表示され、オペレータの注意を引くためのメッセージが表示される(図示省略)。
これに対してオペレータが、入力装置50を介してポップアップウィンドウ中の「OK」ボタンをクリックすると、ステータス変更要求部44から統合監視サーバ12に対してステータス変更リクエストが送信される。
When new message information is registered in the message information storage unit 24, a new message list screen is generated by the display screen generation unit 26 and transmitted to the operation management terminal 16.
This message list screen is displayed on the display 48 by the message display unit 42 of the operation management terminal 16, as shown in FIG.
At this time, if the new message information is a failure message that needs to be dealt with, a pop-up window is displayed on the display 48 and a message for drawing the operator's attention (not shown).
On the other hand, when the operator clicks an “OK” button in the pop-up window via the input device 50, a status change request is transmitted from the status change request unit 44 to the integrated monitoring server 12.

これを受けたステータス更新部28は、メッセージ情報格納部24内に格納された該当メッセージのステータスを「受付済み」に更新すると共に、ステータス変更日時に現在日時を上書きする。
つぎに表示画面生成部26によって上記の更新を反映させた一覧画面が生成され、運用管理端末16に送信される。
この結果、当該障害メッセージのステータスがオープンから受付済みに更新された一覧画面がディスプレイ48に表示される。
In response to this, the status update unit 28 updates the status of the corresponding message stored in the message information storage unit 24 to “accepted” and overwrites the current date and time with the status change date and time.
Next, a list screen reflecting the above update is generated by the display screen generation unit 26 and transmitted to the operation management terminal 16.
As a result, a list screen in which the status of the failure message is updated from open to accepted is displayed on the display 48.

つぎにオペレータは、マニュアルに従って担当のSEに連絡を行い、受付済みステータスの障害メッセージに関して必要な対応を依頼する。
ここで担当のSEに連絡が取れてトラブル復旧が約束された場合、オペレータは入力装置50を介してディスプレイ48上で当該障害メッセージを選択状態とした後、右クリック等によって表示される操作メニュー中の「割当済み」を選択する。
この結果、ステータス変更要求部44から統合監視サーバ12に対してステータス変更リクエストが送信される。
Next, the operator contacts the responsible SE according to the manual and requests the necessary response regarding the failure message of the accepted status.
Here, when the responsible SE is contacted and trouble recovery is promised, the operator selects the failure message on the display 48 via the input device 50, and then in the operation menu displayed by right-clicking etc. Select “Assigned”.
As a result, a status change request is transmitted from the status change request unit 44 to the integrated monitoring server 12.

これを受けたステータス更新部28は、メッセージ情報格納部24内に格納された該当メッセージのステータスを「割当済み」に更新すると共に、ステータス変更日時に現在日時を上書きする。
つぎに表示画面生成部26によって上記の更新を反映させた一覧画面が生成され、運用管理端末16に送信される。
この結果、当該障害メッセージのステータスが受付済みから割当済みに更新された一覧画面がディスプレイ48に表示される。
In response to this, the status update unit 28 updates the status of the corresponding message stored in the message information storage unit 24 to “allocated” and overwrites the current date and time with the status change date and time.
Next, a list screen reflecting the above update is generated by the display screen generation unit 26 and transmitted to the operation management terminal 16.
As a result, a list screen in which the status of the failure message is updated from accepted to assigned is displayed on the display 48.

そして、担当SEから問題が解決した旨の連絡を受けると、オペレータは入力装置50を介してディスプレイ48上で当該障害メッセージを選択状態とした後、操作メニュー中の「対処完了」を選択する。
この結果、ステータス変更要求部44から統合監視サーバ12に対してステータス変更リクエストが送信される。
Then, upon receiving notification from the responsible SE that the problem has been solved, the operator selects the failure message on the display 48 via the input device 50, and then selects “Correction Complete” in the operation menu.
As a result, a status change request is transmitted from the status change request unit 44 to the integrated monitoring server 12.

これを受けたステータス更新部28は、メッセージ情報格納部24内に格納された該当メッセージのステータスを「対処完了」に更新すると共に、ステータス変更日時に現在日時を上書きする。
つぎに表示画面生成部26によって上記の更新を反映させた一覧画面が生成され、運用管理端末16に送信される。
この結果、当該障害メッセージのステータスが割当済みから対処完了に更新された一覧画面がディスプレイ48に表示される。
In response to this, the status update unit 28 updates the status of the corresponding message stored in the message information storage unit 24 to “completion completed” and overwrites the current date and time with the status change date and time.
Next, a list screen reflecting the above update is generated by the display screen generation unit 26 and transmitted to the operation management terminal 16.
As a result, a list screen in which the status of the failure message is updated from assigned to completed is displayed on the display 48.

以上のように、障害メッセージが発生した際には、最初にポップアップ表示によってオペレータの注意が喚起されると共に、処理が進展するに従ってステータスが更新され、その都度一覧画面にステータスの更新が反映される。
したがって、オペレータは一覧画面に表示された各障害メッセージのステータスを監視することにより、対応漏れを防止することができる筈であるが、オペレータも人間である以上、大量の障害メッセージが集中的に発生した場合などには見落としが生じることは否めない。
このため、このシステム10は、オペレータによる人為的ミスを未然に防止するための仕掛けとして、再警告発動機能を備えている。
As described above, when a failure message occurs, the operator is first alerted by a pop-up display, and the status is updated as the processing progresses, and the status update is reflected on the list screen each time. .
Therefore, the operator should be able to prevent omissions by monitoring the status of each failure message displayed on the list screen. However, since the operator is also a human being, a large number of failure messages occur intensively. It is undeniable that oversight will occur in the event of a failure.
Therefore, this system 10 has a re-warning function as a device for preventing human error by the operator.

以下、図4のフローチャートに従い、この再警告の発動手順について説明する。
まず警告発動部32は、プログラムの起動時に警告設定情報格納部30をチェックし、警告設定情報を取得する(S10、S12)。
図5は警告設定情報の一例を示すものであり、「警告間隔」と「通知間隔」の二種類の設定項目を備えている。
これらの中の「警告間隔」は、あるステータスから他のステータスに移行した時点から再警告を発動するまでの時間間隔(一種の猶予間隔)を設定する項目であり、ここでは30分が設定されている。
これに対し「通知間隔」は、再警告を発動すべきか否かの判定処理を実行する間隔(チェック間隔)を設定する項目であり、ここでは5分が設定されている。
Hereinafter, the re-warning activation procedure will be described with reference to the flowchart of FIG.
First, the warning issuing unit 32 checks the warning setting information storage unit 30 when the program is started, and acquires warning setting information (S10, S12).
FIG. 5 shows an example of warning setting information, which includes two types of setting items, “warning interval” and “notification interval”.
"Warning interval" in these items is an item that sets the time interval (a kind of grace interval) from when a status changes to another status to when a rewarning is triggered. Here, 30 minutes is set. ing.
On the other hand, the “notification interval” is an item for setting an interval (check interval) for executing a process for determining whether or not a re-warning should be activated. Here, 5 minutes is set.

つぎに警告発動部32は、通知間隔の経過を待ち(S14)、上記の警告設定情報に従って各障害メッセージごとに再警告の要否を判定する。
まず警告発動部32は、メッセージ情報格納部24に判定対象となる障害メッセージが存在しているか否かを判断し(S15)、存在している場合には1件目の障害メッセージを読出し、そのステータスをチェックする(S16)。
ここでステータスとして「対処完了」が記録されている場合には(S18)、再警告不要であるため次の障害メッセージのチェックに移行することとなる(S15、S16)。
これに対し、当該障害メッセージのステータスが「オープン」、「受付済み」、「割当済み」の何れかである場合、ステータス変更日時から現在日時を引算し、このステータスに移行してから現在までの経過時間を算出する(S20)。
そして、この経過時間が警告間隔である30分未満である場合(S22)、警告発動部32は再警告不要と判定し、次の障害メッセージのチェックに移行する(S15、S16)。
これに対し、既に30分以上経過している場合、警告発動部32は要再警告と判定し、所定の再警告信号を生成すると共に、これを運用管理端末16に送信する(S24)。
Next, the warning issuing unit 32 waits for the notification interval to elapse (S14), and determines the necessity of rewarning for each failure message according to the warning setting information.
First, the warning issuing unit 32 determines whether or not a failure message to be determined exists in the message information storage unit 24 (S15), and if it exists, reads the first failure message, The status is checked (S16).
Here, when “status of response” is recorded as the status (S18), the re-warning is unnecessary, and the process proceeds to the next failure message check (S15, S16).
On the other hand, if the status of the failure message is “Open”, “Received”, or “Assigned”, the current date / time is subtracted from the status change date / time, and the status is transferred to the present Is calculated (S20).
If this elapsed time is less than 30 minutes, which is the warning interval (S22), the warning issuing unit 32 determines that re-warning is not necessary, and proceeds to check the next failure message (S15, S16).
On the other hand, when 30 minutes or more have already elapsed, the warning issuing unit 32 determines that a re-warning is necessary, generates a predetermined re-warning signal, and transmits it to the operation management terminal 16 (S24).

これを受けた運用管理端末16では、警告再生部46により、再警告信号に従った再警告動作が実行される。
例えば、運用管理端末16に接続されたパトランプを鳴動させると共に、スピーカ54から「ID○○の障害メッセージについて対応遅れが発生してます。直ちに調べてください。」といった内容の合成音声を出力させる。
あるいは、運用管理端末16のディスプレイ48にポップアップウィンドウを起動させ、上記の警告メッセージを表示させることもできる。
この結果、オペレータのうっかりミスを有効に防止できる。
In the operation management terminal 16 that has received this, the warning reproducing unit 46 executes a re-warning operation according to the re-warning signal.
For example, a patrol lamp connected to the operation management terminal 16 is sounded, and a synthesized voice with a content such as “A response delay has occurred for the failure message of ID XX. Please check immediately” is output from the speaker 54.
Alternatively, a pop-up window can be activated on the display 48 of the operation management terminal 16 to display the above warning message.
As a result, an operator's inadvertent mistake can be effectively prevented.

その後、上記S16〜S24までの処理がメッセージ情報格納部24内の障害メッセージについて次々と実行され、全ての障害メッセージについて処理が完了し、対象となる障害メッセージがなくなった時点で(S15)、警告発動部32は休止モードに移行する(S26)。
そして、警告発動部32のタイマ機能によって前回のチェック終了から5分の通知間隔が経過したことが検知されると(S14)、再びメッセージ情報格納部24内の全障害メッセージについてS16〜S24の処理が繰り返され、再警告発動の要否判定及び必要な場合には再警告信号の生成・送信処理が警告発動部32によって実行される。
Thereafter, the processes from S16 to S24 are successively executed for the failure messages in the message information storage unit 24. When all the failure messages have been processed and there are no target failure messages (S15), a warning is given. The activating unit 32 shifts to the pause mode (S26).
When it is detected by the timer function of the warning issuing unit 32 that the notification interval of 5 minutes has elapsed since the end of the previous check (S14), the processing of S16 to S24 is performed again for all failure messages in the message information storage unit 24. Are repeated, and the warning issuing unit 32 executes the determination of whether or not the re-warning is necessary and the generation / transmission processing of the re-warning signal when necessary.

図6は、警告間隔と通知間隔との関係を模式的に表したものであり、通知間隔が到来する度に障害メッセージA及び障害メッセージBに対する再警告の要否が警告発動部32によって判断され、各障害メッセージのステータス変更のタイミングに応じてそれぞれ再警告が発動される様子が描かれている。
また、この図からは、各障害メッセージの警告間隔が経過してから次の通知間隔が到来するまでに時間差が生じ、この結果警告間隔の満了と再警告発動との間に若干のタイムラグが生じ得ることが理解できる。
FIG. 6 schematically shows the relationship between the warning interval and the notification interval, and the warning invocation unit 32 determines whether or not a rewarning is required for the failure message A and the failure message B every time the notification interval arrives. A state in which a re-warning is activated according to the timing of status change of each failure message is depicted.
In addition, this figure shows that there is a time lag between the warning interval of each failure message and the arrival of the next notification interval, resulting in a slight time lag between the expiration of the warning interval and the re-warning activation. I can understand.

本来、各障害メッセージの警告間隔満了と同時に再警告を発動するのが望ましいことは言うまでもないが、これを実現するためには障害メッセージ毎にタイマ処理を実行することが要求され、膨大な数の障害メッセージが監視対象サーバ36から統合監視サーバ12に集約される環境下では、マシンのリソース不足が懸念される。
そこでこのシステム10では、障害メッセージ毎にバラバラに進行する警告間隔の他に、これよりも短い共通の時間軸として通知間隔という概念を設け、通知間隔経過時に再警告の要否を全障害メッセージについてまとめて判定する仕組みを採用している。
この結果、障害メッセージの数にかかわらずタイマ処理は1つで済むこととなり、マシンリソースを節約することが可能となる。
なお、上記のように警告間隔満了から再警告発動までタイムラグが生じるとはいえ、通知間隔を「5分」のように比較的短く設定しておけば、実際上の不都合はほとんど生じなくなる。
Naturally, it is desirable to activate a re-warning as soon as the warning interval of each fault message expires, but in order to realize this, it is required to execute timer processing for each fault message, and a huge number of In an environment where failure messages are aggregated from the monitoring target server 36 to the integrated monitoring server 12, there is a concern that the machine resources are insufficient.
Therefore, in this system 10, in addition to the warning interval that progresses separately for each failure message, the concept of notification interval is provided as a common time axis shorter than this, and whether or not re-warning is necessary for all failure messages when the notification interval elapses. Adopts a mechanism to judge collectively.
As a result, only one timer process is required regardless of the number of failure messages, and machine resources can be saved.
Although there is a time lag from the expiration of the warning interval to the re-warning activation as described above, if the notification interval is set relatively short, such as “5 minutes”, practical inconvenience hardly occurs.

上記にあっては、各障害メッセージのステータスにかかわらず30分の警告間隔が一律に適用される例を示したが、ステータスに応じて警告間隔に差違を設けることも可能である。
図7は、この場合の警告情報の設定例を示しており、初動態勢の迅速化を図るためオープンのステータスで10分、受付済みのステータスで20分と短めの警告間隔が設定されているのに対し、担当SEが決まった後はある程度の時間的余裕を持たせるため、割当済みのステータスには30分の警告間隔が設定されている。
この場合、警告発動部32は各障害メッセージに対する再警告の要否を判定するに際し、まずそれぞれのステータスに応じた警告間隔を取得し、現在日時とステータス変更日時に記録された日時との差がこの警告間隔以上の場合に「要再警告」と判定することとなる。
In the above, an example in which a warning interval of 30 minutes is uniformly applied regardless of the status of each failure message is shown, but it is also possible to provide a difference in the warning interval according to the status.
FIG. 7 shows an example of setting warning information in this case. In order to expedite initial dynamics, a short warning interval of 10 minutes for the open status and 20 minutes for the accepted status is set. On the other hand, a warning interval of 30 minutes is set for the assigned status in order to allow some time after the assigned SE is determined.
In this case, when determining whether or not rewarning is necessary for each failure message, the warning issuing unit 32 first acquires a warning interval corresponding to each status, and the difference between the current date and time and the date and time recorded in the status change date and time is If it is longer than this warning interval, it is determined as “re-warning required”.

また、障害メッセージには一般に、トラブルの深刻度の高い順にcritical、major、minor、warning、clear等の重大度が監視ツールによって設定されているが、上記にあっては各障害メッセージの重大度にかかわらず30分の警告間隔が適用される例を示した。
しかしながら、障害メッセージの重大度に応じて警告間隔に差違を設けることも当然に可能である。
例えば図8に示すように、障害メッセージの重大度に対応した1.0〜0.2の重み計数を予め警告設定情報格納部30内等に定義しておく。
この場合、警告発動部32は各障害メッセージに対する再警告の要否を判定するに際し、上記の定義情報を参照してそれぞれの重大度に応じた重み係数を特定した後、これで標準の警告間隔(例えば30分)を除することによって重大度に応じた警告間隔を算出し、つぎに現在日時とステータス変更日時に記録された日時との差が算出された警告間隔以上の場合に「要再警告」と判定することとなる。
Also, failure messages generally have critical, major, minor, warning, clear, etc. severity levels set by the monitoring tool in descending order of severity of trouble. Regardless of the example, a warning interval of 30 minutes is applied.
However, it is naturally possible to provide a difference in the warning interval according to the severity of the failure message.
For example, as shown in FIG. 8, a weighting factor of 1.0 to 0.2 corresponding to the severity of the failure message is defined in advance in the warning setting information storage unit 30 or the like.
In this case, when determining whether or not rewarning is necessary for each failure message, the warning issuing unit 32 refers to the above definition information, specifies the weighting factor corresponding to each severity, and then uses this standard warning interval. (For example, 30 minutes) is calculated to calculate the warning interval according to the severity. If the difference between the current date and time and the date and time recorded in the status change date is equal to or greater than the calculated warning interval, It is determined as “warning”.

因みに、標準の警告間隔=30分とした場合、図8の重み係数を適用した重大度別の警告間隔は、以下の通りとなる。
重大度:critical →警告間隔:30分
重大度:major →警告間隔:37.5分
重大度:minor →警告間隔:50分
重大度:warning →警告間隔:75分
重大度:clear →警告間隔:150分
すなわち、重大度が最も高いcriticalと最も低いclearとの間には、警告間隔について5倍の開きが生じることとなる。
Incidentally, when the standard warning interval is set to 30 minutes, the warning intervals according to severity to which the weighting coefficient of FIG. 8 is applied are as follows.
Severity: critical → Warning interval: 30 minutes Severity: major → Warning interval: 37.5 minutes Severity: minor → Warning interval: 50 minutes Severity: warning → Warning interval: 75 minutes Severity: clear → Warning interval: 150 minutes In other words, there is a five-fold gap in the warning interval between the highest severity critical and the lowest clear.

このように、障害メッセージの重大度に応じた重み係数を設定しておき、標準の警告間隔をこれで除することで重大度に応じた警告間隔を警告発動部32が算出するようにする代わりに、予め警告設定情報格納部30に重大度に応じた警告間隔を設定しておくこともできる。
この場合、警告発動部32は各障害メッセージに対する再警告の要否を判定するに際し、まずそれぞれの重大度に応じた警告間隔を取得し、現在日時とステータス変更日時に記録された日時との差がこの警告間隔以上の場合に「要再警告」と判定することとなる。
Instead of setting the weighting factor according to the severity of the failure message in this way and dividing the standard warning interval by this, the warning issuing unit 32 calculates the warning interval according to the severity. In addition, a warning interval corresponding to the severity can be set in the warning setting information storage unit 30 in advance.
In this case, when determining whether or not rewarning is required for each failure message, the warning issuing unit 32 first acquires a warning interval corresponding to each severity, and the difference between the current date and time and the date and time recorded in the status change date and time. Is determined to be “re-warning required” when the warning interval is longer than this warning interval.

また上記にあっては、30分の警告間隔を経過した後は、ステータスの進展に伴ってステータス変更日時が更新されるまで、通知間隔が到来する度に再警告が何度も発動されることとなる(図6参照)。
このように頻繁に再警告を発動することにより、オペレータに迅速な対応を促す効果が得られる反面、現場の状況によっては過度の心理的圧迫によってオペレータの冷静な判断を狂わせ、二次トラブルを誘発する場合もある。
また、障害の内容によっては元々解決に長時間を要するものがあり、このような場合にまで5分おきに再警告が発動されるのは煩わしいといえる。
そこで、警告間隔が経過して最初の再警告を発動させた後は、警告間隔に相当する期間が経過するまで再警告の発動をスキップする仕組みをこのシステム10に導入することもできる。
In the above case, after the warning interval of 30 minutes has passed, the re-warning will be triggered many times each time the notification interval arrives until the status change date and time is updated as the status progresses. (See FIG. 6).
Invoking re-warning frequently in this way is effective in prompting the operator to respond quickly, but depending on the situation, the operator's calm judgment may be distorted by excessive psychological pressure, causing secondary troubles. Sometimes
In addition, depending on the content of the failure, it may take a long time to solve the problem, and it can be said that it is troublesome to issue a re-warning every 5 minutes until such a case.
Therefore, after the warning interval elapses and the first re-warning is activated, a mechanism for skipping the re-warning until the time corresponding to the warning interval elapses can be introduced into the system 10.

具体的には、再警告を発動した際に、警告発動部32によって障害メッセージのステータス変更日時に再警告発動日時(再警告信号の送信日時)が記録されるようにプログラムしておく。
図9は、その場合における再警告の発動状況を示すものであり、障害メッセージCにあっては、ステータス変更から所定の警告間隔経過後、最初の再警告が発動された時点で次の警告間隔が適用されるため、その間に通知間隔が何度到来しても警告発動部32によって再警告不要と判定されている。
障害メッセージDの場合にも、再警告が発動された後に警告間隔が適用されているが、その途中でステータスの変更が生じたため、その時点でステータス変更日時が更新され、新たな警告間隔が適用される様子が描かれている。
Specifically, when the re-warning is activated, the re-warning activation date and time (re-warning signal transmission date and time) is recorded in the status change date and time of the failure message by the warning issuing unit 32.
FIG. 9 shows the status of re-warning in that case. In the failure message C, the next warning interval is reached when the first re-warning is triggered after a predetermined warning interval has elapsed since the status change. Therefore, the warning issuing unit 32 determines that the re-warning is unnecessary even if the notification interval comes during that time.
Even in the case of the failure message D, the warning interval is applied after the re-warning is triggered, but the status change occurred at that point, so the status change date and time is updated and the new warning interval is applied. The state of being done is drawn.

このように、再警告を発動させた時点で警告発動部32がステータス変更日時を更新させ、新たな警告間隔が満了するまで次の再警告発動を抑制する取扱いを、全ての障害メッセージに対し一律に適用することもできるが、ステータスに応じて使い分けることも有効である。
すなわち、障害メッセージのステータスがオープンあるいは受付済みの場合には、オペレータに迅速な対応を促すため、再警告を発動した際にステータス変更日時を更新することなく、したがって通知間隔が到来する度に警告発動部32によって再警告を発動させるのが妥当であるが、障害メッセージのステータスが割当済みの場合には、担当SEに時間的余裕を与えるため、一度再警告を発動した際にステータス変更日時を更新し、新たな警告間隔が満了するまで再警告の発動をスキップさせることが望ましい。
In this way, when the re-warning is triggered, the warning triggering unit 32 updates the status change date and time and suppresses the next re-warning trigger until the new warning interval expires. It can also be applied to, but it is also effective to use properly depending on the status.
In other words, if the status of the fault message is open or accepted, the operator will promptly respond, so that the status change date and time will not be updated when the re-warning is activated, so that a warning will be issued whenever the notification interval arrives. It is reasonable to activate the re-warning by the invoking unit 32, but if the status of the failure message has been assigned, the status change date and time will be given once the re-warning is activated to give the SE in charge time. It is desirable to update and skip the re-warning until the new warning interval expires.

この発明に係る障害メッセージに対する再警告発動システムの全体構成を示す概念図である。It is a conceptual diagram which shows the whole structure of the re-warning dispatch system with respect to the failure message which concerns on this invention. メッセージ情報の構成例を示す説明図である。It is explanatory drawing which shows the structural example of message information. メッセージ一覧画面を示すレイアウト図である。It is a layout figure which shows a message list screen. 再警告発動の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of re-warning dispatch. 警告設定情報の一例を示す説明図である。It is explanatory drawing which shows an example of warning setting information. 警告間隔と通知間隔との関係を示す模式図である。It is a schematic diagram which shows the relationship between a warning interval and a notification interval. 警告設定情報の他の例を示す説明図である。It is explanatory drawing which shows the other example of warning setting information. 障害メッセージの重大度に応じて設定された重み係数の一例を示す説明図である。It is explanatory drawing which shows an example of the weighting coefficient set according to the severity of the failure message. 警告間隔と通知間隔との他の関係を示す模式図である。It is a schematic diagram which shows the other relationship between a warning interval and a notification interval. 障害メッセージに設定されるステータスの一例を示す説明図である。It is explanatory drawing which shows an example of the status set to a failure message.

10 再警告発動システム
12 統合監視サーバ
14 コンピュータネットワーク
16 運用管理端末
20 メッセージ受信部
22 メッセージ処理部
24 メッセージ情報格納部
26 表示画面生成部
28 ステータス更新部
30 警告設定情報格納部
32 警告発動部
36 監視対象サーバ
38 専用線
40 ルータ
42 メッセージ表示部
44 ステータス変更要求部
46 警告再生部
48 ディスプレイ
50 入力装置
52 パトランプ
54 スピーカ
α オペレータ
10 Re-warning system
12 Integrated monitoring server
14 Computer network
16 Operation management terminal
20 Message receiver
22 Message processing section
24 Message information storage
26 Display screen generator
28 Status update section
30 Warning setting information storage
32 Warning trigger
36 Monitored servers
38 Dedicated line
40 routers
42 Message display
44 Status change request section
46 Warning playback section
48 display
50 input devices
52 Patrol
54 Speaker α Operator

Claims (4)

統合監視サーバと運用管理端末とからなるシステムであって、
上記統合監視サーバが、複数の監視対象コンピュータにセットアップされた運行状況監視プログラムから障害メッセージが送信された際に、当該障害メッセージに初期状態を示すステータスを設定すると共に、その受付日時をステータス変更日時として設定した上で、メッセージ情報記憶手段に格納する手段と、
このメッセージ情報記憶手段に新たな障害メッセージが格納された際、及び各障害メッセージのステータスが変更された際に、障害メッセージの閲覧画面を生成し、上記運用管理端末に送信する手段と、
上記運用管理端末から特定の障害メッセージについてステータス変更リクエストが送信された場合に、該当の障害メッセージに設定されたステータス及びステータス変更日時を更新する手段と、
警告間隔と、障害メッセージの重大度に対応した複数の重み係数とを設定しておく警告設定情報記憶手段と、
上記の警告間隔よりも短い時間間隔である通知間隔が到来する度に、上記メッセージ情報記憶手段に格納された各障害メッセージについて、それぞれのステータス変更日時から現在日時を引き算した経過時間と、上記の警告間隔を各障害メッセージに設定された重大度に対応した重み係数で除して得られた重大度に応じた警告間隔とを比較し、前者が後者以上となっている場合には当該障害メッセージについて再警告が必要であると判定し、再警告信号を上記運用管理端末に送信する再警告発動手段を備え、
上記運用管理端末が、上記統合監視サーバから送信された閲覧画面をディスプレイに表示させる手段と、
入力装置を介して、閲覧画面に表示された特定の障害メッセージについて所定の入力動作がなされた場合に、上記統合監視サーバに対してステータス変更リクエストを送信する手段と、
上記統合監視サーバから再警告信号が送信された場合に、所定の警告手段を介して再警告再生処理を実行する手段を備えたことを特徴とする障害メッセージに対する再警告発動システム。
A system consisting of an integrated monitoring server and an operation management terminal,
When the above integrated monitoring server sends a failure message from an operation status monitoring program set up on a plurality of monitored computers, it sets a status indicating the initial state in the failure message and sets the reception date / time to the status change date / time. Means for storing in the message information storage means,
When a new fault message is stored in the message information storing means, and when the status of each failure message is changed, generates a viewing screen of a fault message, it means for transmitting to the operation management terminal,
Means for updating the status and status change date and time set in the corresponding fault message when a status change request is transmitted for the specific fault message from the operation management terminal;
Warning setting information storage means for setting a warning interval and a plurality of weighting factors corresponding to the severity of the failure message ;
Each time a notification interval that is shorter than the warning interval arrives, for each failure message stored in the message information storage means, an elapsed time obtained by subtracting the current date and time from the status change date and time, and The warning interval is compared with the warning interval according to the severity obtained by dividing the warning interval by the weighting factor corresponding to the severity set for each failure message. It is determined that a re-warning is necessary, and includes a re-warning trigger means for transmitting a re-warning signal to the operation management terminal
Means for causing the operation management terminal to display a browsing screen transmitted from the integrated monitoring server on a display;
Means for transmitting a status change request to the integrated monitoring server when a predetermined input operation is performed for a specific failure message displayed on the browsing screen via the input device;
A re-warning activation system for a failure message, comprising means for executing a re-warning reproduction process via a predetermined warning means when a re-warning signal is transmitted from the integrated monitoring server .
上記統合監視サーバの警告設定情報記憶手段には、障害メッセージのステータスに対応した複数の警告間隔が設定されており、
上記統合監視サーバの再警告発動手段は、各障害メッセージに設定されたステータスに対応した警告間隔に基づいて上記の重大度に応じた警告間隔を算出することを特徴とする請求項1に記載の障害メッセージに対する再警告発動システム。
In the warning setting information storage means of the integrated monitoring server, a plurality of warning intervals corresponding to the status of the failure message are set,
The redistribution warning activation means integrated monitoring server, according to claim 1, characterized in that calculating a warning distance corresponding to the severity based on alert intervals corresponding to the status set in each fault message Re-warning system for failure messages.
統合監視サーバと運用管理端末とからなるシステムであって、
上記統合監視サーバが、複数の監視対象コンピュータにセットアップされた運行状況監視プログラムから障害メッセージが送信された際に、当該障害メッセージに初期状態を示すステータスを設定すると共に、その受付日時をステータス変更日時として設定した上で、メッセージ情報記憶手段に格納する手段と、
このメッセージ情報記憶手段に新たな障害メッセージが格納された際、及び各障害メッセージのステータスが変更された際に、障害メッセージの閲覧画面を生成し、上記運用管理端末に送信する手段と、
上記運用管理端末から特定の障害メッセージについてステータス変更リクエストが送信された場合に、該当の障害メッセージに設定されたステータス及びステータス変更日時を更新する手段と、
障害メッセージの重大度に対応した複数の警告間隔を設定しておく警告設定情報記憶手段と、
上記の警告間隔よりも短い時間間隔である通知間隔が到来する度に、上記メッセージ情報記憶手段に格納された各障害メッセージについて、それぞれのステータス変更日時から現在日時を引き算した経過時間と、当該障害メッセージに設定された重大度に対応した警告間隔とを比較し、前者が後者以上となっている場合には当該障害メッセージについて再警告が必要であると判定し、再警告信号を上記運用管理端末に送信する再警告発動手段を備え、
上記運用管理端末が、上記統合監視サーバから送信された閲覧画面をディスプレイに表示させる手段と、
入力装置を介して、閲覧画面に表示された特定の障害メッセージについて所定の入力動作がなされた場合に、上記統合監視サーバに対してステータス変更リクエストを送信する手段と、
上記統合監視サーバから再警告信号が送信された場合に、所定の警告手段を介して再警告再生処理を実行する手段を備えたことを特徴とする障害メッセージに対する再警告発動システム。
A system consisting of an integrated monitoring server and an operation management terminal,
When the above integrated monitoring server sends a failure message from an operation status monitoring program set up on a plurality of monitored computers, it sets a status indicating the initial state in the failure message and sets the reception date and time to the status change date and time. Means for storing in the message information storage means,
When a new fault message is stored in the message information storing means, and when the status of each failure message is changed, generates a viewing screen of a fault message, it means for transmitting to the operation management terminal,
When a status change request is transmitted for a specific failure message from the operation management terminal, means for updating the status and status change date and time set in the corresponding failure message;
Warning setting information storage means for setting a plurality of warning intervals corresponding to the severity of the failure message ;
Every time a notification interval that is shorter than the warning interval arrives, for each failure message stored in the message information storage means, an elapsed time obtained by subtracting the current date from the status change date and time, and the failure The warning interval corresponding to the severity set in the message is compared. If the former is greater than or equal to the latter, it is determined that a re-warning is necessary for the failure message, and the re-warning signal is sent to the operation management terminal. Re-warning trigger means to send to
Means for causing the operation management terminal to display on the display a browsing screen transmitted from the integrated monitoring server;
Means for transmitting a status change request to the integrated monitoring server when a predetermined input operation is performed for a specific failure message displayed on the browsing screen via the input device;
A rewarning activation system for a failure message, comprising means for executing a rewarning reproduction process via predetermined warning means when a rewarning signal is transmitted from the integrated monitoring server .
上記統合監視サーバの再警告発動手段が、特定の障害メッセージに関して再警告信号を生成し、運用管理端末に送信した場合に、その送信日時によって当該障害メッセージのステータス変更日時を更新する処理を実行することを特徴とする請求項1〜3の何れかに記載の障害メッセージに対する再警告発動システム。 When the re-warning means of the integrated monitoring server generates a re-warning signal for a specific failure message and transmits it to the operation management terminal, it executes a process of updating the status change date and time of the failure message according to the transmission date and time. The re-warning trigger system for a failure message according to any one of claims 1 to 3.
JP2004298459A 2004-10-13 2004-10-13 Re-warning system for failure messages Expired - Fee Related JP4533716B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004298459A JP4533716B2 (en) 2004-10-13 2004-10-13 Re-warning system for failure messages

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004298459A JP4533716B2 (en) 2004-10-13 2004-10-13 Re-warning system for failure messages

Publications (2)

Publication Number Publication Date
JP2006113708A JP2006113708A (en) 2006-04-27
JP4533716B2 true JP4533716B2 (en) 2010-09-01

Family

ID=36382193

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004298459A Expired - Fee Related JP4533716B2 (en) 2004-10-13 2004-10-13 Re-warning system for failure messages

Country Status (1)

Country Link
JP (1) JP4533716B2 (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008107989A (en) * 2006-10-24 2008-05-08 Toshiba Tec Corp Failure monitoring method and device for computer system, and failure monitoring program
FR2916890B1 (en) * 2007-05-31 2009-07-24 Airbus France Sas METHOD AND DEVICE FOR MONITORING AVIONIC SYSTEMS CONNECTED WITH A SHARED MEDIA
JP2009048425A (en) * 2007-08-20 2009-03-05 Ricoh Co Ltd Project management system, project management device, project management method, and project management program
WO2013021530A1 (en) * 2011-08-11 2013-02-14 日本電気株式会社 Monitoring apparatus, monitoring method and program
WO2013031066A1 (en) * 2011-08-26 2013-03-07 日本電気株式会社 Monitoring device, monitoring method, and program
JP5982903B2 (en) * 2012-03-15 2016-08-31 オムロン株式会社 Information processing device
JP6087673B2 (en) * 2013-03-13 2017-03-01 株式会社日立システムズ Workaround execution management system and workaround execution management method
JP6475329B2 (en) * 2015-06-22 2019-02-27 株式会社日立製作所 Train operation management system and railway equipment manual control method
CN115797001B (en) * 2022-11-14 2024-01-26 首约科技(北京)有限公司 Alarm method, alarm device, electronic equipment and storage medium

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002215424A (en) * 2001-01-16 2002-08-02 Hitachi Ltd Method of filtering operation monitoring data
JP2004280171A (en) * 2003-03-12 2004-10-07 Fujitsu Ltd Trouble information notification program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2923323B2 (en) * 1990-03-20 1999-07-26 富士通株式会社 Alarm information monitoring method
JPH04102937A (en) * 1990-08-22 1992-04-03 Nec Corp Fault counterplan managing system for information processor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002215424A (en) * 2001-01-16 2002-08-02 Hitachi Ltd Method of filtering operation monitoring data
JP2004280171A (en) * 2003-03-12 2004-10-07 Fujitsu Ltd Trouble information notification program

Also Published As

Publication number Publication date
JP2006113708A (en) 2006-04-27

Similar Documents

Publication Publication Date Title
CN109726072B (en) WebLogic server monitoring and alarming method, device and system and computer storage medium
JP4156663B2 (en) Method and apparatus for monitoring and controlling a program in a network
JP5474177B2 (en) Distributed application monitoring
JP4533716B2 (en) Re-warning system for failure messages
WO2016104025A1 (en) Fault information provision server and fault information provision method
CN112148505A (en) Data batching system, method, electronic device and storage medium
JP2007288378A (en) Data communication program, data communication method and mobile terminal device
US9461879B2 (en) Apparatus and method for system error monitoring
JP4867908B2 (en) Monitoring system, network monitoring apparatus, and service execution environment monitoring method
US9317354B2 (en) Dynamically determining an external systems management application to report system errors
JP2006252459A (en) Monitoring device and monitoring method
KR20110037969A (en) Targeted user notification of messages in a monitoring system
CN111010313A (en) Batch processing state monitoring method, server and storage medium
CN112969151B (en) Short message monitoring method, device and equipment
KR101490984B1 (en) Providing method for event information, Integrated control system performing the same, Computer program for the same, and Recording medium storing computer program thereof
CN113791887A (en) Audio task priority management method, device and system
JP2018110286A (en) Information processing device and program
JP5378847B2 (en) Monitoring device
CN112817727A (en) Task management method, system, equipment and storage medium based on micro-service architecture
JP2005141466A (en) Computer monitoring device and message processing method for processing message about computer to be monitored
KR20050075485A (en) Integrated alarm manager for omp process
US20070005756A1 (en) Shared data center monitor
JP5997005B2 (en) Information processing apparatus, process normal end determination method, and program
JP2013003896A (en) Information providing device, information providing method and program
JP2000222247A (en) Event fault monitoring device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070920

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100309

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100608

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100614

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130618

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees