JP4183602B2 - Fault monitoring method and program - Google Patents
Fault monitoring method and program Download PDFInfo
- Publication number
- JP4183602B2 JP4183602B2 JP2003374509A JP2003374509A JP4183602B2 JP 4183602 B2 JP4183602 B2 JP 4183602B2 JP 2003374509 A JP2003374509 A JP 2003374509A JP 2003374509 A JP2003374509 A JP 2003374509A JP 4183602 B2 JP4183602 B2 JP 4183602B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- failure
- view
- view data
- screen
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Computer And Data Communications (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
本発明は、障害監視のための技術に関するものである。 The present invention relates to a technique for fault monitoring.
ネットワークに接続されている装置の障害を監視する方法として、一般的には、被監視装置の一覧を画面表示し、各装置の状態をリアルタイム又は定期的にチェックして監視画面を更新する方法が用いられている。障害が検知された装置については、画面上の色を変えたり所定の印を付ける等して、ユーザが特定可能なように表示する場合もある。 As a method of monitoring a failure of a device connected to the network, generally, a method of displaying a list of monitored devices on a screen, checking the status of each device in real time or periodically, and updating the monitoring screen is available. It is used. An apparatus in which a failure is detected may be displayed so that the user can specify it by changing the color on the screen or adding a predetermined mark.
例えばネットワークを監視するオペレータは、監視画面で障害が発生したことを確認すると、障害が発生した旨を例えばネットワーク管理者に報告し、障害の原因調査や復旧依頼を行う。その際、例えば表示されている監視画面を市販のプログラム等を利用して画像ファイルに出力する。出力された画像ファイルは、例えばネットワーク管理者が障害の原因と実施した対処とを上司等へ報告する際の報告書の添付資料としても使用される。なお、監視画面を自動で例えば定期的に画像ファイルとして保存しておくようなことは、データ量が膨大になるため通常は行われない。すなわち、監視画面は保存されずに次々と上書きされていく。 For example, when an operator who monitors the network confirms that a failure has occurred on the monitoring screen, the operator who reports the failure has reported to the network administrator, for example, and investigated the cause of the failure and requested a recovery. At that time, for example, the displayed monitoring screen is output to an image file using a commercially available program or the like. The output image file is also used as, for example, an attached material of a report when the network administrator reports the cause of the failure and the countermeasure taken to the supervisor or the like. Note that automatically saving the monitoring screen as an image file, for example, regularly is not usually performed because the amount of data becomes enormous. That is, the monitoring screen is overwritten one after another without being saved.
一方、監視画面に表示する内容に関して、例えば、障害発生箇所を容易に特定可能とするための技術が存在する(例えば特許文献1参照)。すなわち、複数の伝送装置を回線により接続した伝送網の伝送装置の障害情報を収集する監視センタを有する障害監視システムであって、監視センタは、推定される障害情報のパターンを基に、障害発生個所と見做される部分と障害発生個所として疑わしい部分と正常と見做される部分とを判定する被疑判定テーブルと、伝送装置を含む伝送網を表示するカラー表示部と、伝送装置から収集した障害情報のパターンを基に被疑判定テーブルを参照して、障害発生個所と見做される部分と障害発生個所として疑わしい部分と正常と見做される部分とを判定し、判定結果に対応して伝送網を構成する各部及び回線を異なる表示色でカラー表示部に表示させる制御処理部とを備える。
しかしながら、このような従来技術によると、以下のような問題が残る。まず、監視画面をオペレータ等が手作業で画像ファイルに出力するような場合には、出力のための手間がかかる上、うっかり出力することを失念してしまうこともある。また、出力作業中に新しく別の障害が検知され、監視画面が更新されてしまい、出力のタイミングを逸することもある。また、例えばネットワーク管理者がエンドユーザからの問い合わせに対応する際には、障害が発生した時点の状況(どこにどのような問題が発生していたか)を示す監視画面を参照する必要があるが、画面が更新されてしまっていると、過去の障害の状況が把握できなくなってしまう。 However, according to such a conventional technique, the following problems remain. First, when an operator or the like manually outputs a monitoring screen to an image file, it takes time for output and may forget to output it inadvertently. In addition, a new failure may be detected during the output operation, and the monitoring screen may be updated, resulting in a loss of output timing. In addition, for example, when a network administrator responds to an inquiry from an end user, it is necessary to refer to a monitoring screen that shows the situation (where and what problem occurred) at the time of the failure. If the screen has been updated, the past failure situation cannot be grasped.
例えばネットワーク管理者は、障害が発生した時点のネットワークの状態を詳しく確認するために障害データを直接参照することも可能であるが、例えばデータベース等にアクセスして、ネットワークの障害情報(どの装置にいつどのような異常が発生したか、及びその時のネットワーク負荷実測値等)を含むレコードを1件1件確認するのは、監視画面で状況を把握するのに比べて時間や手間がかかってしまう。 For example, the network administrator can directly refer to the failure data in order to confirm in detail the state of the network at the time when the failure occurred. It is more time-consuming and time-consuming to check each record including when and what kind of abnormality occurred and the actual network load at that time. .
また一方で、ネットワーク接続されている装置の障害を監視する場合、監視装置から見てネットワーク上の上流に位置する装置の障害によって、下流に位置する他の装置も監視装置との通信ができなくなり障害と見なされることがある。このような場合、まず上流に位置する装置に対して障害対処を行うのが望ましいが、上で述べたような技術によると、そのような障害の関連性について明示されることがないため、例えばネットワーク管理者はどこから対処を実施すれば良いのかを把握しづらい。すなわち、同一原因で発生した障害のかたまりやまとまりを容易に把握できず、原因調査に時間と手間がかかるという問題もある。 On the other hand, when a failure of a device connected to the network is monitored, another device located downstream cannot communicate with the monitoring device due to a failure of the device located upstream on the network when viewed from the monitoring device. May be considered an obstacle. In such a case, it is desirable to deal with a failure first with respect to a device located upstream. However, according to the technique described above, the relevance of such a failure is not clearly indicated. It is difficult for the network administrator to figure out where to take action. That is, there is a problem in that it is difficult to grasp a cluster or a group of failures caused by the same cause, and it takes time and effort to investigate the cause.
そのため、本発明の目的は、障害監視画面データの効率的な管理を可能とするための新規な技術を提供することである。 Therefore, an object of the present invention is to provide a novel technique for enabling efficient management of failure monitoring screen data.
また、本発明の他の目的は、障害の関連性を即座に把握するための新規な技術を提供することである。 Another object of the present invention is to provide a novel technique for immediately grasping the relationship between faults.
本発明に係る方法は、所定のネットワークに接続されている装置の障害を監視する方法であって、障害が検知された装置と障害発生日時と監視項目に該当する障害内容とに関するデータを含み且つ障害データ・ファイル格納部に格納されている障害データと、画面表示内容に関するデータを含み且つビュー定義ファイル格納部に格納されているビュー定義データとを用いてビュー・データを生成し、ビュー・データ格納部に格納するビュー・データ生成ステップと、所定の間隔でビュー・データ生成ステップを実行し、ビュー・データを更新するステップと、ビュー・データに含まれる画面構成要素がビュー・データの更新前後において異なる値を示す場合、当該画面構成要素の値の変化に関するデータを用いて画面履歴データを生成し、画面履歴ファイル格納部に格納する画面履歴データ生成ステップとを含む。 The method according to the present invention is a method for monitoring a failure of a device connected to a predetermined network, including data relating to a device in which a failure is detected, a failure occurrence date and time, and a failure content corresponding to a monitoring item, and View data is generated by using the failure data stored in the failure data file storage unit and the view definition data including the data related to the screen display contents and stored in the view definition file storage unit. View data generation step to be stored in the storage unit, a view data generation step executed at a predetermined interval to update the view data, and screen components included in the view data before and after the view data update If a different value is indicated, screen history data is generated using data related to the change in the value of the screen component, And a screen history data generating step for storing the history file storage unit.
このように、新たに障害が発生した場合等、画面表示内容(ビュー・データ)に変化があった時だけ、変化があった表示要素についてのみ、更新情報(画面履歴データ)を保存する。これにより、画像ファイルを保存するのに比べ、少ない記憶容量で画面に関するデータを保存しておくことができる。 In this way, only when there is a change in the screen display content (view data), such as when a new failure occurs, the update information (screen history data) is stored only for the display element that has changed. As a result, it is possible to save data relating to the screen with a small storage capacity compared to saving an image file.
また、画面履歴ファイル格納部に格納された画面履歴データを用いて、所定の期間内において同一の監視項目又は監視項目グループについて障害が検知された装置グループを特定する関連装置特定ステップと、特定された装置グループの障害に関するデータを特定可能な態様でユーザに示すためのビュー・データを生成し、ビュー・データ格納部に格納する関連ビュー・データ生成ステップとをさらに含むようにしてもよい。 And a related device specifying step for specifying a device group in which a failure is detected for the same monitoring item or monitoring item group within a predetermined period using the screen history data stored in the screen history file storage unit. It may further include a related view data generation step of generating view data for showing to the user in a manner capable of specifying data relating to the failure of the device group, and storing the view data in the view data storage unit.
これにより、オペレータやネットワーク管理者等のユーザは、同一の原因により障害が発生したとみなされる装置グループを一目で把握することができる。なお、障害データに比べてデータ量の少ない画面履歴データを用いることにより、処理効率の向上を図ることができる。また、装置グループには必ずしも複数の装置が含まれているとは限らず、1つの装置により装置グループが構成されていてもよい。監視項目グループについても同様に、1種類の監視項目により監視項目グループが構成されていてもよい。 As a result, users such as operators and network managers can grasp at a glance the device groups that are considered to have failed due to the same cause. It should be noted that the processing efficiency can be improved by using the screen history data having a smaller data amount than the failure data. In addition, a device group does not necessarily include a plurality of devices, and a device group may be configured by one device. Similarly, for the monitoring item group, the monitoring item group may be configured by one type of monitoring item.
また、上記関連ビュー・データ生成ステップが、障害対処の実施に関するデータを含み且つ障害対処ファイル格納部に格納されている障害対処データに基づき、上記関連装置特定ステップにおいて特定された装置グループのうち、障害対処がなされた装置グループをルート・コーズとして特定するステップと、ルート・コーズとして特定され且つ障害対処がなされた装置グループの障害に関するデータを特定可能な態様でユーザに示すためのビュー・データを生成し、ビュー・データ格納部に格納するステップとを含むようにしてもよい。 Further, the related view data generation step includes data relating to the execution of the failure handling, and based on the failure handling data stored in the failure handling file storage unit, among the device groups specified in the related device specifying step, Identifying a device group that has been dealt with as a root cause, and view data for presenting the user with data relating to the failure of the device group that has been identified as the root cause and has been dealt with in a manner that can be identified Generating and storing in the view data storage unit.
ネットワークにおける障害には、例えば監視装置から見てネットワーク上の上流に設置されているある装置が故障したために下流に設置されてる他の装置と監視装置とのネットワークが遮断されたこと等による見かけ上の障害も存在する。このような場合、実際に障害対処がなされた装置グループをルート・コーズ(障害の根本原因)として特定することにより、同一の原因により障害が発生したとみなされる他の装置グループについては、見かけ上の障害である可能性が高いことをユーザに示すことが可能となる。 A failure in the network is apparently caused by, for example, a network failure between a monitoring device and another device installed downstream due to a failure of a device installed upstream from the monitoring device. There are also obstacles. In such a case, by identifying the device group that actually handled the failure as root cause (the root cause of the failure), other device groups that are considered to have failed due to the same cause are apparently It is possible to indicate to the user that there is a high possibility of the failure.
また、上記関連ビュー・データ生成ステップが、所定のネットワークにおける各装置の属性に関するデータを含み且つ構成情報ファイル格納部に格納されている構成情報に基づき、関連装置特定ステップにおいて特定された装置グループのうち、ホップ数が最小の装置を含む装置グループをルート・コーズとして特定するステップと、ルート・コーズとして特定され且つ前記ホップ数が最小の装置を含む装置グループの障害に関するデータを特定可能な態様でユーザに示すためのビュー・データを生成し、ビュー・データ格納部に格納するステップとを含むようにしてもよい。 Further, the related view data generation step includes the data of the device group specified in the related device specifying step based on the configuration information including data related to the attributes of each device in the predetermined network and stored in the configuration information file storage unit. Among them, in a mode capable of specifying a device group including a device having the smallest number of hops as a route cause, and data relating to a failure of the device group identified as the route cause and including the device having the smallest number of hops. Generating view data for showing to the user and storing the view data in the view data storage unit.
上で述べたように、ネットワークにおける障害には見かけ上の障害も存在するため、このように障害が発生しており且つ監視装置からのホップ数が最小の装置を含む装置グループをルート・コーズとして特定することにより、同一の原因により障害が発生したとみなされる他の装置グループについては、見かけ上の障害である可能性が高いことをユーザに示すことが可能となる。また、例えばネットワーク管理者は、まず最初にルート・コーズとして特定された装置グループに対して障害対処を行うことにより、無駄のない障害対処が可能となる。 As described above, since there are apparent failures in the failure in the network, the device group including the device in which such a failure has occurred and the number of hops from the monitoring device is minimum is set as the root cause. By specifying, it is possible to indicate to the user that other device groups that are considered to have failed due to the same cause are likely to be apparently failed. Further, for example, the network administrator can deal with a trouble without waste by first dealing with the trouble for the device group identified as the root cause.
なお、本発明に係る方法をコンピュータに実行させるためのプログラムを作成することも可能であって、当該プログラムは、例えばフレキシブル・ディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等の記憶媒体又は記憶装置に格納される。また、ネットワークを介してデジタル信号として配信される場合もある。なお、処理途中のデータについては、コンピュータのメモリ等の記憶装置に一時保管される。 It is also possible to create a program for causing a computer to execute the method according to the present invention, and the program is a storage medium such as a flexible disk, a CD-ROM, a magneto-optical disk, a semiconductor memory, and a hard disk. Alternatively, it is stored in a storage device. Moreover, it may be distributed as a digital signal via a network. Note that data being processed is temporarily stored in a storage device such as a computer memory.
本発明によれば、障害監視画面データを効率的に管理することや障害の関連性を即座に把握することが可能となり、適切な障害監視を行うことができる。 According to the present invention, it is possible to efficiently manage the failure monitoring screen data and immediately grasp the relevance of the failure, and perform appropriate failure monitoring.
本発明の一実施の形態に係るシステム構成図を図1に示す。例えば企業内ネットワークであるネットワーク1には、1又は複数の運用監視装置5と、例えばパーソナル・コンピュータである1又は複数のユーザ端末3と、例えばルータやハブ(HUB)等のネットワーク装置である被管理装置7と被管理装置13とが、無線又は有線によって接続されている。被管理装置7には被管理装置9と被管理装置11とが接続されている。また、図示していないが、他の被管理装置がネットワーク1又は被管理装置7乃至13のいずれかに接続されている場合もある。なお、これらの被管理装置は必ずしも各々独立した機器である必要はなく、ネットワーク・インタフェース等であってもよい。
A system configuration diagram according to an embodiment of the present invention is shown in FIG. For example, the
運用監視装置5には、監視定義ファイル格納部501と監視部503と構成情報ファイル格納部505と収集データ・ファイル格納部507と障害データ・ファイル格納部509と障害対処部511と障害対処ファイル格納部513と最新運用監視ビュー作成部515とビュー定義ファイル格納部517とビュー・データ格納部519と画面履歴ファイル格納部521と運用監視ビュー再現部523とが含まれている。
The
監視部503は、監視定義ファイル格納部501に格納されているデータ及び構成情報ファイル格納部505に格納されているデータを参照して被管理装置7乃至13の監視処理を実行し、処理結果に関するデータを収集データ・ファイル格納部507及び障害データ・ファイル格納部509に格納する。監視処理の詳細については処理フローの説明において述べる。障害対処部511は、障害データ・ファイル格納部509に格納されているデータ及びビュー定義ファイル格納部517に格納されているデータを参照して障害対処処理を実行し、処理結果に関するデータを障害対処ファイル格納部513に格納する。障害対処処理の詳細については処理フローの説明において述べる。
The
最新運用監視ビュー作成部515は、障害データ・ファイル格納部509に格納されているデータと障害対処ファイル格納部513に格納されているデータとビュー定義ファイル格納部517に格納されているデータとビュー・データ格納部519に格納されているデータと画面履歴ファイル格納部521に格納されているデータとを参照してビュー・データ生成及び更新処理を実行し、処理結果に関するデータをビュー・データ格納部519及び画面履歴ファイル格納部521に格納する。ビュー・データ生成及び更新処理の詳細については処理フローの説明において述べる。
The latest operation monitoring
運用監視ビュー再現部523は、構成情報ファイル格納部505に格納されているデータと障害対処ファイル格納部513に格納されているデータとビュー・データ格納部519に格納されているデータとビュー定義ファイル格納部517に格納されているデータと画面履歴ファイル格納部521に格納されているデータとを参照して監視ビュー表示再現処理を実行し、処理結果に関するデータをビュー・データ格納部519に格納する。監視ビュー表示再現処理の詳細については処理フローの説明において述べる。
The operation monitoring
監視定義ファイル格納部501には、監視内容及び条件を規定するデータが格納されている。監視内容としては、例えば通信可否のチェックや通信データ量のチェック等が挙げられる。条件としては、通信データ量のチェックに使用する閾値や、監視間隔、通信可否確認におけるリトライ回数等が挙げられる。収集データ・ファイル格納部507には、監視処理のログ・データが格納される。その他の格納部については、図を用いて後に説明する。
The monitoring definition
また、図示していないが、運用監視装置5はウェブ(Web)サーバ機能を有し、ユーザ端末3はWebブラウザ機能を有している。すなわち、ユーザ端末3はネットワーク1を介して運用監視装置5にアクセスし、運用監視装置5からWebページ・データを受信して表示することが可能となっている。なお、専用のサーバ・プログラム及びクライアント・プログラムを用いる場合や、運用監視装置5がユーザ端末3に組み込まれている場合もある。
Although not shown, the
図2に、構成情報ファイル格納部505のテーブル構成及び格納されるデータの一例を示す。図2の例には、ノード名の列200とIPアドレスの列202とサブネットアドレスの列204とホップ数の列206とコミュニティ名(public)の列208とコミュニティ名(private)の列210とが含まれている。ホップ数の列206には、運用監視装置5から各装置(ノード)までのホップ数が格納されている。コミュニティ名(public)の列208とコミュニティ名(private)の列210とには、SNMP(Simple Network Management Protocol)を用いた監視処理においてパスワードとして機能する文字列が格納されている。このように、構成情報ファイル格納部505には、監視対象となっている装置のネットワーク構成に関するデータが格納されている。
FIG. 2 shows an example of the table configuration of the configuration information
図3に、障害データ・ファイル格納部509のテーブル構成及び格納されるデータの一例を示す。図3の例には、日時の列300と被管理装置の列302と監視項目の列304と種別の列306と詳細の列308とが含まれている。監視項目304の列には、監視定義ファイル格納部501に設定されている監視内容(通信データ量のチェック等)を示す項目が格納される。例えば「PolicyA」は、通信可否のチェックをするという監視項目名である。障害データ・ファイル格納部509には、監視処理によって障害が検知された場合にレコードが追加される。
FIG. 3 shows an example of the table configuration of the failure data
図4に、ビュー定義ファイル格納部517に格納されるデータの一例を示す。図4の例には、運用監視ビュー名設定部400と運用監視ビュー更新間隔設定部402と被管理装置グループ設定部404と監視項目グループ設定部406とが含まれている。運用監視ビュー更新間隔設定部402には、ユーザが閲覧する画面を表示するためのビュー・データを生成し直す(更新する)間隔が設定される。図4の例では、例えば60秒毎にビュー・データを生成し直すという設定がなされている。なお、ユーザが閲覧する画面のリフレッシュ間隔を規定するものではなく、例えばWebブラウザで表示している画面の更新は別途行われる。被管理装置グループ設定部404には、装置グループ名と当該装置グループに属する装置名が設定されている。監視項目グループ設定部406には、監視項目グループ名と当該監視項目グループにおける監視項目名が設定されている。図4の例では、例えば「PolicyA」が通信可否のチェックをするという監視項目名であるとすると、「PolicyGroup1」における監視項目は通信可否のチェックである。「PolicyGroup1」に1又は複数のその他の監視項目が対応付けられる場合もある。このような定義に従ってビュー・データが生成される。
FIG. 4 shows an example of data stored in the view definition
図5に、障害対処ファイル格納部513のテーブル構成及び格納されるデータの一例を示す。図5の例には、データ更新日時の列550と被管理装置グループの列552と監視項目グループの列554と障害件数の列556と障害発生日時の列558と障害対処日時の列560とが含まれている。図5の例では、被管理装置グループ及び監視項目グループ毎に障害の発生及び対処に関するデータが格納されている。未だ対処のなされていない障害についても登録されるようにしてもよい。その場合には、障害対処日時の列560には値を登録しない又は未対処であることが判別できるような値を登録する。
FIG. 5 shows an example of the table configuration of the failure handling
図6に、画面履歴ファイル格納部521のテーブル構成及び格納されるデータの一例を示す。図6の例には、データ更新日時の列600と前後の列602と被管理装置グループの列604と監視項目グループの列606と健康状態の列608と障害件数の列610と障害発生日時の列612と障害対処日時の列614とが含まれている。画面履歴ファイル格納部521には、ビュー・データに変更が生じた際、更新前後のデータが対となって格納される。前後の列602には、当該レコードが更新前のデータを含んでいるのか更新後のデータを含んでいるのかを示す「前」又は「後」のいずれかを表すデータが格納される。
FIG. 6 shows an example of the table configuration of the screen history
障害件数の列610には、障害の合計件数及び内訳が格納される。括弧外左側の数値が合計件数であり、括弧内左側の数値が重要障害の件数、括弧内右側の数値が警告障害の件数を示している。例えば図6の2行目の「10(10/0)」というデータは、合計障害件数が10件であり、その内10件(全て)が重要障害であることを示している。
The
健康状態の列608には、障害の有無及び重要度を示すコード(例えば0、1又は2)が格納される。例えば障害件数の列610の値が「10(10/0)」であれば、重要障害が10件であるので、重要障害発生を示すコード「1」が格納される。なお、図6の例では、障害の状態を分かりやすくするために健康状態608の列を設けているが、上で述べたように、障害件数の列610の値によって障害の状態が判定可能であるため、健康状態608の列を設けないようにしてもよい。
The
図7に、ビュー・データ格納部519に格納されるデータの一例を示す。図7の例には、運用監視ビュー名の行700と運用監視ビュー更新日時の行702とデータ見出しの行704と実データ706とが含まれている。図7の例では、データ見出しの行704がカンマ区切りになっており、実データ706の各行も見出しに対応してカンマ区切りになっている。空白で区切る等、他の形式で格納するようにしてもよい。このようなビュー・データに基づく障害監視画面が、例えばユーザ端末3の表示装置に表示される。なお、このビュー・データは、障害監視画面を表示するために生成又は更新されるものであり、蓄積されていくデータではない。なお、本実施の形態においては、例えばビュー定義データ1件につき少なくとも2種類のビュー・データが保持される。1つは最新のビュー・データであり、もう1つは現画面表示に用いるカレント・ビュー・データである。例えばユーザが過去の特定の時点における障害状況を画面表示させているような場合には、当該過去の特定の時点における障害状況を含むビュー・データがカレント・ビュー・データとして保持される。また例えばユーザが最新の障害状況を画面表示させているような場合には、最新ビュー・データとカレント・ビュー・データとは、同様のデータとなる。そして、運用監視ビュー更新日時の行702には、当該ビュー・データがいつの時点の障害状況を示すデータであるのかを表す日時が格納されている。
FIG. 7 shows an example of data stored in the view
次に、図8乃至図21を用いて、図1に示したシステムの処理内容について説明する。図8に、監視処理の処理フローを示す。なお、この監視処理の処理主体は運用監視装置5の監視部503であり、以下の説明では処理主体の記載を省略する。
Next, processing contents of the system shown in FIG. 1 will be described with reference to FIGS. FIG. 8 shows a process flow of the monitoring process. Note that the processing entity of this monitoring process is the
まず、監視定義ファイル格納部501に格納されている監視定義データ及び構成情報ファイル格納部505に格納されている構成情報を読み込み、ワーク・メモリ領域等の記憶装置に一旦格納する(図8:ステップS1)。そして、ステップS1において読み込んだデータに基づき、被管理装置7乃至13の少なくともいずれかを対象として規定された監視項目についてヘルス・チェック(障害の有無の確認)を行う(ステップS3)。ヘルス・チェックを実行すると、実行ログとして収集データを生成し、収集データ・ファイル格納部507に格納する(ステップS5)。なお、ヘルス・チェックの処理方法については、一般的な通信プロトコルを用いた従来技術による方法でよく、また本発明の主旨ではないので、ここでは詳細な説明を省略する。
First, the monitoring definition data stored in the monitoring definition
そして、ヘルス・チェックによって障害が検知されたか判定する(ステップS7)。障害が検知されなかったと判定された場合(ステップS7:Noルート)、後に述べるステップS11の処理に移行する。一方、障害が検知されたと判定された場合(ステップS7:Yesルート)、障害データを生成し、障害データ・ファイル格納部509に格納する(ステップS9)。そして、ステップS1において読み込んだ監視定義データに含まれる監視間隔に基づき、監視時間になったか判定する(ステップS11)。監視時間になっていないと判定された場合(ステップS11:Noルート)、監視時間になるまで所定の間隔でステップS11の処理を繰り返す。一方、監視時間になったと判定された場合(ステップS11:Yesルート)、ステップS3の処理に戻り、再びヘルス・チェックを行う。 Then, it is determined whether a failure has been detected by the health check (step S7). When it is determined that no failure has been detected (step S7: No route), the process proceeds to step S11 described later. On the other hand, if it is determined that a failure has been detected (step S7: Yes route), failure data is generated and stored in the failure data file storage unit 509 (step S9). Then, based on the monitoring interval included in the monitoring definition data read in step S1, it is determined whether the monitoring time has come (step S11). When it is determined that the monitoring time is not reached (step S11: No route), the process of step S11 is repeated at a predetermined interval until the monitoring time is reached. On the other hand, if it is determined that the monitoring time has come (step S11: Yes route), the process returns to step S3 and the health check is performed again.
このようにして、監視処理が行われる。そして、監視処理の結果として、障害データ・ファイル格納部509に障害データが蓄積されていく。
In this way, the monitoring process is performed. As a result of the monitoring process, failure data is accumulated in the failure data /
図9に、ビュー・データ生成及び更新処理の処理フローを示す。なお、このビュー・データ生成及び更新処理の処理主体は運用監視装置5の最新運用監視ビュー作成部515であり、以下の説明では処理主体の記載を省略する。まず、ビュー定義ファイル格納部517に格納されているビュー定義データを読み込み、ワーク・メモリ領域等の記憶装置に一旦格納する(図9:ステップS21)。
FIG. 9 shows a processing flow of view data generation and update processing. Note that the processing subject of the view data generation and update processing is the latest operation monitoring
そして、ビュー定義データに含まれる運用監視ビュー更新間隔設定部402(図4)の値に基づき、更新時間になったか判定する(ステップS23)。新規に(初めて)ビュー・データを生成する場合には、この判定をスキップしてステップS25の処理に移行してもよい。更新時間になっていないと判定された場合(ステップS23:Noルート)、更新時間になるまで所定の間隔でステップS23の処理を繰り返す。一方、更新時間になったと判定された場合(ステップS23:Yesルート)、前回のビュー・データ更新時刻から現在時刻までにおける障害データを障害データ・ファイル格納部509から読み込み、ワーク・メモリ領域等の記憶装置に格納する(ステップS25)。前回のビュー・データ更新時間は、ビュー・データ格納部519に格納されている最新のビュー・データの運用監視ビュー更新日時の行702(図7)に含まれている。なお、新規にビュー・データを生成する場合には、現在時刻までの全ての障害データを読み込む。なお、新規にビュー・データを生成する場合を除き、該当する障害データがなければ、ステップS25の処理に戻る。さらに、読み込んだ障害データから1件特定する(ステップS27)。
Then, based on the value of the operation monitoring view update interval setting unit 402 (FIG. 4) included in the view definition data, it is determined whether the update time has come (step S23). When new (first time) view data is generated, this determination may be skipped and the process may proceed to step S25. When it is determined that the update time is not reached (step S23: No route), the process of step S23 is repeated at a predetermined interval until the update time is reached. On the other hand, when it is determined that the update time is reached (step S23: Yes route), the failure data from the previous view data update time to the current time is read from the failure data
そして、障害対処ファイル格納部513を検索し、ステップS27において特定した障害データに対応する障害対処データを確認する(ステップS29)。なお、障害データは被管理装置及び監視項目毎に登録されているため、ビュー定義データに基づき、該当する被管理装置グループ及び監視項目グループを特定する。そして、被管理装置グループ、監視項目グループ及び障害発生日時に基づき、障害データに対応する障害対処データを特定する。なお、障害発生日時については、完全に一致しなくても差が所定の範囲内(例えば1分)であればよいが、障害データにおける障害発生日時より障害対処データにおける障害対処日時(障害対処日時の列560(図5)の値)の方が過去である場合を除く。
Then, the failure handling
そして、対応する障害対処データの有無又は障害対処日時の列560(図5)の値に基づき、障害が対処済みか判定する(ステップS31)。対処済みであると判定された場合(ステップS31:Yesルート)、後に述べるステップS35の処理に移行する。一方、対処済みではないと判定された場合(ステップS31:Noルート)、被管理装置グループ及び監視項目グループ毎に、障害件数を加算(1インクリメント)し、ワーク・メモリ領域等の記憶装置に格納する(ステップS33)。 Then, based on the presence / absence of corresponding failure handling data or the value in the column 560 (FIG. 5) of the failure handling date / time, it is determined whether the failure has been handled (step S31). When it is determined that it has been dealt with (step S31: Yes route), the processing proceeds to step S35 described later. On the other hand, if it is determined that the countermeasure has not been taken (step S31: No route), the number of faults is added (incremented by 1) for each managed device group and monitoring item group, and stored in a storage device such as a work memory area. (Step S33).
そして、ステップS27において特定した障害データが、ステップS25において読み込んだ障害データのうち、最後のデータであるか判定する(ステップS35)。最後のデータではないと判定された場合(ステップS35:Noルート)、ステップS27の処理に戻り、次の障害データを1件特定する。一方、最後のデータであると判定された場合(ステップS35:Yesルート)、例えばビュー・データ格納部519から前回(更新前)のビュー・データを読み込み、前回のビュー・データ及びステップS33において加算された障害件数に基づき、前回のビュー・データと今回のビュー・データとで値が異なる表示要素(被管理装置グループと監視項目グループとのセット)があるか判定する(ステップS37)。例えば、ある被管理装置グループ及び監視項目グループについての障害件数が前回に比べて増えたりした場合には、値が異なる表示要素があると判定される。新規にビュー・データを生成する場合には、全ての表示要素について値が異なると判定される。
Then, it is determined whether the failure data identified in step S27 is the last data among the failure data read in step S25 (step S35). When it is determined that it is not the last data (step S35: No route), the process returns to the process of step S27, and one piece of next failure data is specified. On the other hand, when it is determined that the data is the last data (step S35: Yes route), for example, the previous view data (before update) is read from the view
値が異なる表示要素がないと判定された場合(ステップS37:Noルート)、ステップS23の処理に戻る。一方、値が異なる表示要素があると判定された場合(ステップS37:Yesルート)、当該表示要素の更新前後の値に基づき画面履歴データを生成し、画面履歴ファイル格納部521に格納する(ステップS39)。図6に示したように、1つの表示要素につき2つのレコードが生成される。そして、ステップS21において読み込んだビュー定義データと、新しい表示要素の値とに基づきビュー・データを新規生成又は更新し、ビュー・データ格納部519に格納する(ステップS41)。ビュー・データの新規生成又は更新後は、ステップS23の処理に戻る。 When it is determined that there is no display element having a different value (step S37: No route), the process returns to step S23. On the other hand, if it is determined that there is a display element with a different value (step S37: Yes route), screen history data is generated based on the values before and after the update of the display element, and stored in the screen history file storage unit 521 (step S37). S39). As shown in FIG. 6, two records are generated for one display element. Then, new view data is generated or updated based on the view definition data read in step S21 and the value of the new display element, and stored in the view data storage unit 519 (step S41). After the new generation or update of view data, the process returns to step S23.
このようにして、ビュー定義データ及び障害データに基づき最新のビュー・データが生成又は更新される。また、ビュー・データの更新の際には、画面履歴データが生成される。なお、このビュー・データ生成及び更新処理を一旦終了した後、再開するような場合には、ステップS21の処理において、ビュー・データ格納部519に格納されている最新ビュー・データとビュー定義ファイル格納部517に格納されているビュー定義データとを読み込む。なお、この最新ビュー・データには、ビュー・データ生成及び更新処理を一旦終了してから再開するまでに発生した障害等については反映されていないため、例えばステップS23をスキップし、ステップS25において、最新ビュー・データの更新時刻から現在時刻までにおける障害データを障害データ・ファイル格納部509から読み込み、ワーク・メモリ領域等の記憶装置に格納する。そして、ステップS27以降の処理を実行することにより、最新のビュー・データが生成できる。
In this way, the latest view data is generated or updated based on the view definition data and the failure data. Further, when the view data is updated, screen history data is generated. When the view data generation and update processing is once ended and then resumed, the latest view data and view definition file stored in the view
また、ビュー・データ生成及び更新処理を一旦終了したために、最新ビュー・データがクリアされる等して保持されていない場合には、ステップS21の処理において、ビュー定義ファイル格納部517に格納されているビュー定義データと画面履歴ファイル格納部521に格納されている画面履歴データとを読み込み、読み込んだビュー定義データと画面履歴データとを用いて、ビュー・データ生成及び更新処理の終了時点のビュー・データを生成し、ビュー・データ格納部519に格納するようにしてもよい。これにより、現在までの全ての障害データを用いてビュー・データを生成するのに比べ、取り扱うデータ量を少なくすることができ、効率良くビュー・データを生成することができる。
If the latest view data is not retained because the view data generation and update processing has been temporarily ended, the view data is stored in the view definition
具体的には、まず、全ての画面履歴データを読み込み、ワーク・メモリ領域等に格納する。画面履歴データのうち、生成日時が最も古いデータには、初めて生成されたビュー・データの内容が全て含まれている(全ての表示要素の値が更新(生成)前と異なる)ため、この画面履歴データとビュー定義データとに基づき、初めて生成された時のビュー・データを生成(再現)する。そして、このビュー・データを元にして、画面履歴データによるビュー・データの更新を、生成日時の古い順に画面履歴データを適用して行う。全ての画面履歴データによる更新がなされると、ビュー・データ生成及び更新処理を一旦終了した時点のビュー・データが生成(再現)される。なお、ここで生成されたビュー・データには、ビュー・データ生成及び更新処理を一旦終了してから再開するまでに発生した障害等については反映されていないため、例えばステップS23をスキップし、ステップS25において、最新の(上の処理で最後に適用した)画面履歴データの生成時刻から現在時刻までにおける障害データを障害データ・ファイル格納部509から読み込み、ワーク・メモリ領域等の記憶装置に格納する。そして、ステップS27以降の処理を実行することにより、最新のビュー・データが生成できる。
Specifically, first, all screen history data is read and stored in a work memory area or the like. Of the screen history data, the data with the oldest generation date / time contains all the contents of the view data generated for the first time (the values of all display elements are different from those before the update (generation)). Based on the history data and the view definition data, the view data when it is generated for the first time is generated (reproduced). Then, based on the view data, the view data is updated by the screen history data by applying the screen history data in the order of generation date and time. When all the screen history data is updated, the view data at the time when the view data generation and update processing is once completed is generated (reproduced). Note that the view data generated here does not reflect a failure or the like that occurs between the end of the view data generation and update processing and the restart, and therefore, for example, step S23 is skipped, In S25, failure data from the generation time of the latest screen history data (applied last in the above process) to the current time is read from the failure data
次に、図10乃至図21を用いて、監視ビュー表示再現処理について説明する。なお、以下の説明におけるユーザ端末3と運用監視装置5との通信は、ユーザ端末3のWebブラウザ機能及び運用監視装置5のWebサーバ機能により実現されることを想定しているが、専用のサーバ・プログラム及びクライアント・プログラムを用いる場合もある。
Next, the monitoring view display reproduction process will be described with reference to FIGS. Note that the communication between the
まず、ユーザ端末3は、例えばWebブラウザ画面を介し、最新ビューの表示指示をオペレータやネットワーク管理者等のユーザから受け付ける(図10:ステップS51)。最新ビューの表示指示を受け付けたユーザ端末3は、最新ビュー・ページ・データの要求を運用監視装置5に送信する(ステップS53)。なお、ログイン処理等は事前になされ、ユーザ端末3は運用監視装置5にアクセス可能な状態になっているものとする。例えばWebサーバ機能を有する、運用監視装置5の運用監視ビュー再現部523は、最新ビュー・ページ・データの要求をユーザ端末3から受信する(ステップS55)。そして、運用監視ビュー再現部523は、ビュー・データ格納部519から最新のビュー・データを読み込み、読み込んだビュー・データに基づき最新ビュー・ページ・データを生成し、ユーザ端末3に送信する(ステップS57)。ユーザ端末3のWebブラウザは、最新ビュー・ページ・データを運用監視装置5から受信し、表示装置に表示する(ステップS59)。
First, the
図11に、最新ビュー・ページの一例を示す。図11の例には、ビュー名表示部1100と最終更新日時表示部1110と監視データ一覧表示部1120と前画面ボタン1140と次画面ボタン1150と日時指定表示ボタン1160と関連障害表示ボタン1170と保存ボタン1180と終了ボタン1190とが含まれている。監視データ一覧表示部1120には、被管理装置グループの列1122と監視項目グループ1の列1124と監視項目グループ2の列1126と監視項目グループ3の列1128とが含まれている。なお、監視項目グループの数は3つに限定されず、これより多い場合も少ない場合もある。
FIG. 11 shows an example of the latest view page. In the example of FIG. 11, a view name display unit 1100, a last update date /
また、被管理装置グループの列1122には、被管理装置グループの名称であるグループA乃至Cが示されている。監視項目グループと同様に、被管理装置グループの数も3つに限定されず、これより多い場合も少ない場合もある。そして、監視データ一覧表示部1120には、監視項目グループ及び被管理装置グループ毎に、障害に関するデータが表形式で示されている。
Further, the managed
図11の例は、図7に示したビュー・データに基づき生成されたページの例である。例えば、監視項目グループ1の列1124の1行目(被管理装置グループAの行)の欄には、実データ706(図7)の1行目の内容が示されている。「10(10/0)」という表示は、合計障害件数が10件であり、その内10件(全て)が重要障害であることを示している。また「2003/07/11 11:03」という表示は、最新障害発生日時を示し、「2003/07/11 11:00」という表示は、最新障害対処日時を示している。なお、最新障害発生日時の方が最新障害対処日時よりも新しい日時となっているが、これは、新しく発生した障害に対して未だ対処がなされていないことを表している。そして、そのようなデータを含む欄には強調表示(ここでは縦縞線の付加)がなされ、ユーザが一目で分かるようになっている。また、強調表示がなされた欄は選択してクリックすることが可能となっており、ユーザによってクリックされると、後に説明する障害対処処理に移行する。図11の例では、強調表示がなされた欄が3つ存在している。
The example of FIG. 11 is an example of a page generated based on the view data shown in FIG. For example, the contents of the first row of the actual data 706 (FIG. 7) are shown in the column of the first row (row of managed device group A) in the
なお、この最新ビュー・ページのデータには、Webブラウザが定期的に画面をリフレッシュするためのコード及び所定の更新間隔が含まれている。また、最新ビュー・ページの下部に設けられている各ボタンについては後の処理フローの説明において述べる。 図10の説明に戻り、ユーザ端末3のWebブラウザは、最新ビュー・ページを更新すべき時間になったか判定する(図10:ステップS61)。更新時間になったと判定された場合(ステップS61:Yesルート)、ステップS53の処理に戻り、再び最新ビュー・ページ・データの要求を運用監視装置5に送信する。一方、更新時間になっていないと判定された場合(ステップS61:Noルート)、ユーザ端末3のWebブラウザは、最新ビュー・ページ(図11)に対するユーザからの選択入力を受け付け、選択入力データを運用監視装置5に送信する(ステップS63)。運用監視装置5の運用監視ビュー再現部523は、選択入力データをユーザ端末3から受信し、ワーク・メモリ領域等の記憶装置に一旦格納する(ステップS65)。
The latest view page data includes a code for the Web browser to periodically refresh the screen and a predetermined update interval. Each button provided at the bottom of the latest view page will be described later in the description of the processing flow. Returning to the description of FIG. 10, the Web browser of the
そして、運用監視装置5の運用監視ビュー再現部523は、ユーザの選択入力が「終了」であったか判定する(ステップS67)。最新ビュー・ページ(図11)において終了ボタン1190がクリックされていれば、ユーザの選択入力は「終了」である。「終了」であったと判定された場合(ステップS67:Yesルート)、運用監視ビュー再現部523は、終了処理を行う(ステップS69)。例えば終了ページ・データを生成し、ユーザ端末3に送信する。一方、「終了」ではなかったと判定された場合(ステップS67:Noルート)、運用監視ビュー再現部523は、ユーザの選択入力が「障害対処」であったか判定する(ステップS71)。
Then, the operation monitoring
上でも述べたとおり、最新ビュー・ページ(図11)において縦縞線が施された欄がクリックされていれば、ユーザの選択入力は「障害対処」である。「障害対処」であったと判定された場合(ステップS71:Yesルート)、運用監視装置5の障害対処部511は、障害対処処理を行う(ステップS73)。障害対処処理の詳細については後に述べる。一方、「障害対処」ではなかったと判定された場合(ステップS71:Noルート)、運用監視ビュー再現部523は、ユーザの選択入力が「画面保存」であったか判定する(ステップS75)。
As described above, if the column with vertical stripes is clicked in the latest view page (FIG. 11), the user's selection input is “fault handling”. When it is determined that the problem is “fault handling” (step S71: Yes route), the
最新ビュー・ページ(図11)において保存ボタン1180がクリックされていれば、ユーザの選択入力は「画面保存」である。「画面保存」であったと判定された場合(ステップS75:Yesルート)、運用監視ビュー再現部523は、画面データ保存処理を行う(ステップS77)。例えば現在ユーザ端末3に表示しているページのHTMLデータ等をダウンロードするためのページ・データをユーザ端末3に送信する。一方、「画面保存」ではなかったと判定された場合(ステップS75:Noルート)、処理は端子A及びBを介して図13の処理に移行する。
If the
図12に、画面データ・ダウンロード用ページの一例を示す。図12には、保存先指定欄1200と参照ボタン1210とOKボタン1220とキャンセル・ボタン1230とが含まれている。ユーザは、画面データを格納するディレクトリを保存先指定欄1200に入力又は参照ボタン1210を用いて指定し、OKボタン1220をクリックすることにより、画面データ(HTMLデータ)をダウンロードすることができる。キャンセル・ボタン1230がクリックされると、元のページに移行する。なお、専用のサーバ・プログラム及びクライアント・プログラムを用いている場合やWebブラウザが有する画面保存機能を用いる場合等、ユーザ端末3が単独で画面保存処理を行うこともある。
FIG. 12 shows an example of the screen data download page. FIG. 12 includes a storage
図13に、端子A及びBを介して移行した処理について示す。運用監視装置5の運用監視ビュー再現部523は、ユーザの選択入力が「日時指定」であったか判定する(図13:ステップS81)。最新ビュー・ページ(図11)において日時指定表示ボタン1160がクリックされていれば、ユーザの選択入力は「日時指定」である。「日時指定」ではなかったと判定された場合(ステップS81:Noルート)、処理は端子Cを介して図15の処理に移行する。一方、「日時指定」であったと判定された場合(ステップS81:Yesルート)、運用監視ビュー再現部523は、日時指定ページ・データを生成し、ユーザ端末3に送信する(ステップS83)。ユーザ端末3のWebブラウザは、運用監視装置5から日時指定ページ・データを受信し、表示装置に表示する(ステップS85)。
FIG. 13 shows a process transferred through terminals A and B. The operation monitoring
図14に、日時指定ページの一例を示す。図14の例には、日時入力部1400とOKボタン1410とキャンセル・ボタン1420とが含まれている。ユーザは、日時入力部1400に日時を入力してOKボタン1410をクリックすることにより、入力した日時におけるビュー・ページの閲覧を指示できる。キャンセル・ボタン1430がクリックされると、元のページに移行する。
FIG. 14 shows an example of the date / time designation page. The example of FIG. 14 includes a date and
図13の説明に戻り、ユーザ端末3のWebブラウザは、日時指定ページ(図14)に対するユーザからの日時データの入力を受け付け、入力された日時(指定日時)データを運用監視装置5に送信する(ステップS87)。運用監視装置5の運用監視ビュー再現部523は、指定日時データをユーザ端末3から受信し、ワーク・メモリ領域等の記憶装置に一旦格納する(ステップS89)。なおこの際、運用監視ビュー再現部523は、現在ユーザ端末3のWebブラウザに表示しているビュー・ページ・データを構成するビュー・データ(カレント・ビュー・データ)及び当該ビュー・データに対応する日時(現ビュー日時)データを特定し、併せてワーク・メモリ領域等の記憶装置に格納しておく。なお、現ビュー日時とは、現在のビュー・データが、いつの状態を表示するためのデータであるかを表す日時であり、カレント・ビュー・データの運用監視ビュー更新日時の行702(図7)の値である。
Returning to the description of FIG. 13, the Web browser of the
そして、運用監視ビュー再現部523は、指定日時と現ビュー日時とを比較する(ステップS91)。そして、運用監視ビュー再現部523は、指定日時の方が現ビュー日時よりも過去であるか判定する(ステップS93)。指定日時の方が現ビュー日時よりも過去であると判定された場合(ステップS93:Yesルート)、運用監視ビュー再現部523は、画面履歴ファイル格納部521に格納されている画面履歴データから、現在のビュー・データの更新前データを含む画面履歴データを特定する(ステップS95)。ここで、特定される画面履歴データは、データ更新日時の列600(図6)の値が現ビュー日時と等しく且つ前後の列602(図6)の値が「前」となっているデータである。なお、該当するデータが存在しない場合は、後に述べるステップS111の処理に移行する。
Then, the operation monitoring
そして、運用監視ビュー再現部523は、特定された画面履歴データに基づきビュー・データを更新する(ステップS97)。すなわち、ビュー・データを1つ前(過去)の状態に戻す。ここで、現ビュー日時には、ステップS95において特定された画面履歴データの1つ前の更新日時(データ更新日時の列600(図6)の値)を含む画面履歴データの更新日時が設定される。
Then, the operation monitoring
そして、運用監視ビュー再現部523は、更新された現ビュー日時と指定日時とを比較する(ステップS99)。そして、運用監視ビュー再現部523は、指定日時の方が現ビュー日時よりも過去であるか判定する(ステップS101)。指定日時の方が現ビュー日時よりも過去であると判定された場合(ステップS101:Yesルート)、ステップS95の処理に戻る。一方、指定日時よりも現ビュー日時の方が過去であると判定された場合(ステップS101:Noルート)、後に述べるステップS111の処理に移行する。
Then, the operation monitoring
また一方、ステップS93の判定処理において、指定日時よりも現ビュー日時の方が過去であると判定された場合(Noルート)、運用監視ビュー再現部523は、画面履歴ファイル格納部521に格納されている画面履歴データから、現在のビュー・データの更新後データを含む画面履歴データを特定する(ステップS103)。ここで、特定される画面履歴データは、データ更新日時の列600(図6)の値が現ビュー日時より後の次の日時であり且つ前後の列602(図6)の値が「後」となっているデータである。なお、該当するデータが存在しない場合は、後に述べるステップS111の処理に移行する。
On the other hand, if it is determined in step S93 that the current view date / time is earlier than the specified date / time (No route), the operation monitoring
そして、運用監視ビュー再現部523は、特定された画面履歴データの更新日時(データ更新日時の列600(図6)の値)と指定日時とを比較する(ステップS105)。そして、運用監視ビュー再現部523は、指定日時の方が特定された画面履歴データの更新日時よりも過去であるか判定する(ステップS107)。指定日時よりも特定された画面履歴データの更新日時の方が過去であると判定された場合(ステップS107:Noルート)、特定された画面履歴データに基づきビュー・データを更新する(ステップS109)。すなわち、ビュー・データを1つ後(未来)の状態に進める。ここで、現ビュー日時には、ステップS103において特定された画面履歴データの更新日時(データ更新日時の列600(図6)の値)が設定される。そして、ステップS103の処理に戻る。
Then, the operation monitoring
一方、指定日時の方が特定された画面履歴データの更新日時よりも過去であると判定された場合(ステップS107:Yesルート)、現在のビュー・データに基づきビュー・ページ・データを生成し、ユーザ端末3に送信する(ステップS111)。この際、ビュー・データ格納部519に格納されているカレント・ビュー・データを、現在のビュー・データに更新する。ユーザ端末3のWebブラウザは、運用監視装置5からビュー・ページ・データを受信し、表示装置に表示する(ステップS113)。そして、処理は端子Dを介してステップS63(図10)の処理に戻る。
On the other hand, when it is determined that the specified date / time is earlier than the update date / time of the specified screen history data (step S107: Yes route), view page data is generated based on the current view data, It transmits to the user terminal 3 (step S111). At this time, the current view data stored in the view
このように、画面履歴データを用いて、過去方向又は未来方向に向けて1つずつビュー・データを更新していくことにより、特定の日時についてのビュー・ページ・データを生成する。なお、最終的に生成されるビュー・ページ・データは、指定日時よりも過去であり且つ指定日時に最も近い更新日時を含む画面履歴データに基づき生成される。 In this way, view page data for a specific date and time is generated by updating the view data one by one in the past or future direction using the screen history data. Note that the view page data to be finally generated is generated based on the screen history data including the update date and time that is earlier than the specified date and time and is closest to the specified date and time.
図15に、端子Cを介して移行した処理について示す。運用監視装置5の運用監視ビュー再現部523は、ユーザの選択入力が「前画面」であったか判定する(図15:ステップS121)。最新ビュー・ページ(図11)において前画面ボタン1140がクリックされていれば、ユーザの選択入力は「前画面」である。「前画面」であったと判定された場合(ステップS121:Yesルート)、運用監視ビュー再現部523は、画面履歴ファイル格納部521に格納されている画面履歴データから、現在のビュー・データの更新前データを含む画面履歴データを特定する(ステップS123)。ここで、特定される画面履歴データは、データ更新日時の列600(図6)の値が現ビュー日時と等しく且つ前後の列602(図6)の値が「前」となっているデータである。そして、後に述べるステップS129の処理に移行する。なお、ステップS123の処理において該当するデータが存在しない場合は、後に述べるステップS131の処理に移行する。
FIG. 15 shows the processing that has been transferred via the terminal C. The operation monitoring
一方、「前画面」ではなかったと判定された場合(ステップS121:Noルート)、運用監視ビュー再現部523は、ユーザの選択入力が「次画面」であったか判定する(ステップS125)。最新ビュー・ページ(図11)において次画面ボタン1150がクリックされていれば、ユーザの選択入力は「次画面」である。「次画面」ではなかったと判定された場合(ステップS125:Noルート)、処理は端子Eを介して図17の処理に移行する。一方、「次画面」であったと判定された場合(ステップS125:Yesルート)、運用監視ビュー再現部523は、画面履歴ファイル格納部521に格納されている画面履歴データから、現在のビュー・データの更新後データを含む画面履歴データを特定する(ステップS127)。ここで、特定される画面履歴データは、データ更新日時の列600(図6)の値が現ビュー日時より後の次の日時であり且つ前後の列602(図6)の値が「後」となっているデータである。なお、該当するデータが存在しない場合は、後に述べるステップS131の処理に移行する。
On the other hand, when it is determined that it is not the “previous screen” (step S121: No route), the operation monitoring
そして、運用監視ビュー再現部523は、特定された画面履歴データに基づき、ビュー・データを更新する(ステップS129)。すなわち、ビュー・データを1つ前(過去)の状態に戻す又はビュー・データを1つ後(未来)の状態に進める。なお、ビュー・データを1つ前の状態に戻す場合には、ステップS123において特定された画面履歴データの1つ前の更新日時(データ更新日時の列600(図6)の値)を含む画面履歴データの更新日時を現ビュー日時に設定する。また、ビュー・データを1つ後の状態に進める場合には、ステップS127において特定された画面履歴データの更新日時(データ更新日時の列600(図6)の値)を現ビュー日時に設定する。さらに、運用監視ビュー再現部523は、現在のビュー・データに基づきビュー・ページ・データを生成し、ユーザ端末3に送信する(ステップS131)。ユーザ端末3のWebブラウザは、運用監視装置5からビュー・ページ・データを受信し、表示装置に表示する(ステップS133)。そして、処理は端子Dを介してステップS63(図10)の処理に戻る。
Then, the operation monitoring
このように、画面履歴データを用いて、過去方向又は未来方向に向けてビュー・データを1段階更新することにより、前画面又は次画面に該当するビュー・ページ・データを生成する。 In this way, view page data corresponding to the previous screen or the next screen is generated by updating the view data in one step in the past or future direction using the screen history data.
図16に、上記図8乃至図15を用いて説明した処理におけるビュー・データの更新(画面遷移)の概要図を示す。図16には、画面要素遷移1600とビュー・データ遷移1610と画面履歴データ遷移1620と表示ビュー遷移1630とが含まれている。
FIG. 16 shows a schematic diagram of view data update (screen transition) in the processing described with reference to FIGS. FIG. 16 includes a
まず、画面要素遷移1600には、図の左から右に時間が流れている場合に、障害の検知等により画面要素(画面表示要素の値)が変化していく様子が示されている。図16の例では、例えば画面要素としてA、B、C及びDが挙げられている。そして、監視処理が実施された際における各画面要素の状態が、監視1乃至7の列に示されている。監視1の列においては、A1、B1、C1、D1と示されており、これは各画面要素の例えば初期状態を表している。また、画面要素を表すアルファベットの右に付されている数値の違いは、状態が異なることを示している。例えば監視2の列では画面要素Aの状態はA2と示されており、A1であった監視1の列とは状態が異なっている。すなわち、1回目の監視時点と2回目の監視時点とでは、画面要素Aに変化があったことが示されている。
First, the
ビュー・データ遷移1610には、所定の更新間隔でビュー・データが更新される様子が示されている。図16の例では、前回と状態が異なる(変化があった)画面要素にはアンダーラインが付され、前回と状態が異なる画面要素が存在しない時には、データが保存(更新)されていない。例えば1回目の更新があった日時1の時点では、ビュー・データが新規生成されたため、全ての画面要素にアンダーラインが付されている。そして、日時2の時点では、日時1の時点のビュー・データに含まれる画面要素の状態と監視2の時点の画面要素の状態とを比較し、画面要素AがA1からA2へと変化していたため、ビュー・データを更新している。同様にビュー・データの更新を重ね、日時5におけるビュー・データが最新ビュー・データである。
The view data transition 1610 shows how the view data is updated at a predetermined update interval. In the example of FIG. 16, a screen element whose state is different (changed) from the previous time is underlined, and no data is saved (updated) when there is no screen element whose state is different from the previous time. For example, at the time of
画面履歴データ遷移1620には、ビュー・データ更新の際に、状態が変化した画面要素についての更新前の値と更新後の値とが画面履歴データとして格納される様子が示されている。「前」及び「後」の文字は各々更新前及び更新後を表している。また、「前」及び「後」の文字の右に付されている数値は、当該画面履歴データが生成された日時を示しており、ビュー・データの日時の右に付されている数値に対応している。まず、1件目(1番左)のデータは、ビュー・データの新規生成(日時1)に対応しており、更新前にはビュー・データは存在しなかったので、「前1」に該当するデータは含まれない。また、全ての画面要素が「後1」に該当するデータとして含まれている。そして、2件目(左から2つ目)のデータには、日時2のビュー・データ更新において、画面要素Aの状態がA1からA2に更新されたことが記録されている。3乃至5件目のデータも同様に、変化のあった画面要素について、更新前後の値が記録されている。
The screen
表示ビュー遷移1630には、例えばユーザ端末3に現在表示されている画面を構成するビュー・データ(カレント・ビュー・データ)が更新され、画面が遷移する様子が示されている。例えば現在のカレント・ビュー・データである最新ビュー・データには、表示ビュー遷移1630の1番右に示しているようにA2、B2、C3、D3という画面要素及びその状態が含まれている。また、カレント・ビュー・データに含まれるビュー更新日時(運用監視ビュー更新日時の行702(図7)の値)は日時5である。ここで、例えばユーザから「前画面」指示を受け付けたとすると、まず、画面履歴データの「前5」に該当するデータ(ビュー更新日時である日時5と同じ日時で「前」の画面履歴データ)を特定する。図16の例ではC2及びD2である。そこで、画面要素Cの状態をC2に、画面要素Dの状態をD2に更新する。この際、元がC3及びD3であったことは考慮しなくてよい。更新の結果、カレント・ビュー・データは、A2、B2、C2、D2となる。また、1つ前(過去)の状態に遷移する際、ビュー更新日には、特定された画面履歴データ(前5)の1つ前の更新日時が設定されるため、ビュー更新日は日時5から日時4に更新される。
In the display view transition 1630, for example, the view data (current view data) constituting the screen currently displayed on the
また、例えばカレント・ビュー・データがA2、B1、C1、D1であり、ビュー更新日時が日時2である場合(表示ビュー遷移1630の左から2番目に示されている状態)、ユーザから「次画面」指示を受け付けたとすると、まず、画面履歴データの「後3」に該当するデータ(ビュー更新日時である日時2の次の日時で「後」の画面履歴データ)を特定する。図16の例ではB2及びC2である。そこで、画面要素Bの状態をB2に、画面要素Cの状態をC2に更新する。この際、元がB1及びC1であったことは考慮しなくてよい。更新の結果、カレント・ビュー・データは、A2、B2、C2、D1となる。また、1つ後(未来)の状態に遷移する際、ビュー更新日には、特定された画面履歴データ(後3)の更新日時が設定されるため、ビュー更新日は日時2から日時3に更新される。
Also, for example, when the current view data is A2, B1, C1, and D1 and the view update date and time is date 2 (the state shown second from the left of the display view transition 1630), the user indicates If the “screen” instruction is received, first, data corresponding to “after 3” of the screen history data (screen history data “after” at the date and time after the date and
このようにして、カレント・ビュー・データが更新される。なお、ユーザから日時を指定された場合には、上のいずれかの処理(過去に戻る又は未来に進む処理)を1又は複数回繰り返すことにより、目的のビュー・データを生成する。これにより、ユーザは、自分が見たい日時における障害状況を画面表示させることができる。 In this way, the current view data is updated. When the date and time is designated by the user, the target view data is generated by repeating one of the above processes (returning to the past or proceeding to the future) one or more times. Thereby, the user can display on the screen the failure status at the date and time he / she wants to see.
図17に、端子Eを介して移行した処理について示す。運用監視装置5の運用監視ビュー再現部523は、関連障害指定ページ・データを生成し、ユーザ端末3に送信する(図17ステップS141)。ユーザ端末3のWebブラウザは、運用監視装置5から関連障害指定ページ・データを受信し、表示装置に表示する(ステップS143)。
FIG. 17 shows the processing that has been transferred via the terminal E. The operation monitoring
図18に、関連障害指定ページの一例を示す。図18の例には、監視項目グループ選択部1800とルート・コーズ検出指定部1810とOKボタン1820とキャンセル・ボタン1830とが含まれている。監視項目グループ選択部1800では、ユーザが関連障害を表示させたい監視項目グループを選択することが可能となっている。図18の例では、監視項目グループ1が選択されている。また、ルート・コーズ検出指定部1810では、ルート・コーズの検出を行うか否かを指定することができる。図18の例では、する(ルート・コーズの検出を行う)と指定されている。ユーザはOKボタン1820をクリックすることにより、監視項目グループ選択部1800とルート・コーズ検出指定部1810とにおいて指定した条件に従った関連障害表示の指示を行う。キャンセル・ボタン1820がクリックされると、元のページに移行する。
FIG. 18 shows an example of the related failure designation page. The example of FIG. 18 includes a monitoring item
図17の説明に戻り、ユーザ端末3のWebブラウザは、関連障害指定ページ(図18)に対するユーザからの選択入力を受け付け、選択入力データを運用監視装置5に送信する(図17:ステップS145)。運用監視装置5の運用監視ビュー再現部523は、選択入力データをユーザ端末3から受信し、ワーク・メモリ領域等の記憶装置に一旦格納する(ステップS147)。そして、運用監視ビュー再現部523は、現在のビュー・データの日時(現ビュー日時)から所定の間隔以内に生成された画面履歴データを画面履歴ファイル格納部521から特定し、当該画面履歴データに基づき、指定された監視項目グループにおける障害があった被管理装置グループを抽出する(ステップS149)。
Returning to the description of FIG. 17, the Web browser of the
さらに、運用監視ビュー再現部523は、ステップS147において受信した選択入力データに基づき、ルート・コーズ検出の指定がなされていたか判定する(ステップS151)。ルート・コーズ検出の指定がなされていなかったと判定された場合(ステップS151:Noルート)、後に述べるステップS161の処理に移行する。一方、ルート・コーズ検出の指定がなされていたと判定された場合(ステップS151:Yesルート)、障害対処ファイル格納部513から、ステップS149において特定された画面履歴データに対応する障害対処データを検索する(ステップS153)。検索条件は、被管理装置グループ、監視項目グループ及び障害発生日時である。なお、障害対処が未実施のデータを除く。
Further, the operation monitoring
そして、運用監視ビュー再現部523は、該当する障害対処データが存在したか判定する(ステップS155)。該当する障害対処データが存在したと判定された場合(ステップS155:Yesルート)、運用監視ビュー再現部523は、検索された障害対処データに含まれる被管理装置グループを特定する(ステップS157)。そして、後に述べるステップS161の処理に移行する。一方、該当する障害対処データが存在しなかったと判定された場合(ステップS155:Noルート)、運用監視ビュー再現部523は、ステップS149において抽出された被管理装置グループと構成情報ファイル格納部505に格納されている構成情報とビュー定義ファイル格納部517に格納されているビュー定義データとに基づき、障害が発生した被管理装置グループに含まれ且つ最もホップ数(ホップ数の列206の値(図2))が少ない装置を含む被管理装置グループを特定する(ステップS159)。
Then, the operation monitoring
そして、運用監視ビュー再現部523は、ステップS149、及びステップS157又はステップS159において特定された被管理装置グループに基づき、ビュー・ページ・データを更新(強調表示等)し、ユーザ端末3に送信する(ステップS161)。ユーザ端末3のWebブラウザは、更新されたビュー・ページ(関連障害表示ビュー・ページ)データを運用監視装置5から受信し、表示装置に表示する(ステップS163)。そして、処理は端子Dを介してステップS63(図10)の処理に戻る。
Then, the operation monitoring
図19に、関連障害表示ビュー・ページの一例を示す。図19の例には、監視データ一覧表示部1900が含まれている。また、監視データ一覧表示部1900には、監視項目グループ1の列1910が含まれている。画面の構成は図11に示した最新ビュー・ページと同様である。監視項目グループ1の列1910の1行目(被管理装置グループAの行)の欄には、強調表示(格子模様の付加)がなされており、被管理装置グループAがルート・コーズであることを示している。また、監視項目グループ1の列1910の3行目(被管理装置グループCの行)の欄にも、強調表示(縦線模様の付加)がなされており、被管理装置グループAの障害と関連のある障害が被管理装置グループCにも発生したことが示されている。
FIG. 19 shows an example of the related failure display view page. The example of FIG. 19 includes a monitoring data
このようにして、関連障害及びルート・コーズ表示処理が行われる。なお、ステップS149(図17)の処理において、指定された監視項目グループに含まれる監視項目のうち、同一の監視項目について障害が検知された被管理装置に基づき、被管理装置グループを特定するようにしてもよい。この場合、画面履歴データだけではなく、障害データ・ファイル格納部509に格納されている障害データ及びビュー・定義ファイル格納部517に格納されているビュー定義データも参照して処理を行う。
In this way, the related failure and route cause display processing is performed. In the process of step S149 (FIG. 17), the managed device group is identified based on the managed device in which a failure is detected for the same monitored item among the monitored items included in the designated monitored item group. It may be. In this case, processing is performed with reference to not only the screen history data but also the failure data stored in the failure data /
次に、図20及び図21を用いて障害対処処理(図10:ステップS73)について説明する。まず、運用監視装置5の障害対処部511は、ユーザに指定された箇所(最新ビュー・ページ(図11)においてクリックされた欄)に該当する障害データを障害データ・ファイル格納部509から読み込み、ワーク・メモリ領域等の記憶装置に一旦格納する(図20:ステップS171)。なお、最新ビュー・ページ(図11)の監視データ一覧表示部1120には、被管理装置グループ及び監視項目グループ毎にデータが示されているため、ビュー定義データに基づき、被管理装置グループに含まれる装置及び監視項目グループに含まれる監視項目を特定する。そして、被管理装置、監視項目及び障害発生日時に基づき、障害データを特定して読み込む。
Next, the failure handling process (FIG. 10: step S73) will be described with reference to FIGS. First, the
そして、運用監視ビュー再現部523は、読み込まれた障害データに基づき、障害対処ページ・データを生成し、ユーザ端末3に送信する(ステップS173)。ユーザ端末3のWebブラウザは、障害対処ページ・データを運用監視装置5から受信し、表示装置に表示する(ステップS175)。
Then, the operation monitoring
図21に、障害対処ページの一例を示す。図21の例には、障害データ表示欄2100とチェック・ボックス部2110とOKボタン2120とキャンセル・ボタン2130とが含まれている。チェック・ボックス部2100に含まれている各チェック・ボックスは、障害データ表示欄2100に含まれている各行に対応しており、ユーザは、対処済みの障害を示している行のチェック・ボックスにチェックを入れ、OKボタン2120をクリックすることにより、対処がなされたことを登録する指示を行う。キャンセル・ボタン2130がクリックされると、元のページに移行する。なお、図21の例では5行の障害データが示されているが、表示行数はいくつであってもよい。例えばスクロール・バーや画面遷移のためのボタンが設けられる場合もある。
FIG. 21 shows an example of the failure handling page. The example of FIG. 21 includes a failure
図20の説明に戻り、ユーザ端末3のWebブラウザは、障害対処ページ(図21)に対するユーザからの選択入力を受け付け、選択入力データを運用監視装置5に送信する(図20:ステップS177)。運用監視装置5の運用監視ビュー再現部523は、選択入力データをユーザ端末3から受信し、ワーク・メモリ領域等の記憶装置に一旦格納する(ステップS179)。そして、障害対処部511は、ビュー定義データ及び受信した選択入力データに基づき障害対処データを生成し、障害対処ファイル格納部513に格納する(ステップS181)。そして元の処理に戻る。
Returning to the description of FIG. 20, the Web browser of the
このようにして、障害に対する対処がなされたことを障害対処データとして登録する。なお、この障害対処処理の後、ビュー・データ生成・更新処理を実施し、ビュー・データを最新のものに更新するようにしてもよい。 In this way, the fact that the failure has been dealt with is registered as failure handling data. Note that after this failure handling processing, view data generation / update processing may be performed to update the view data to the latest one.
以上のように、図1に示したシステム構成における処理が行われる。 As described above, the processing in the system configuration shown in FIG. 1 is performed.
以上本発明の一実施の形態について説明したが、本発明はこれに限定されるものではない。例えば、図2乃至図7に示したテーブル構成及びファイル構成は一例であって、同様のデータを格納するためであれば別の構成を採用するようにしてもよいし、必要に応じて項目を追加又は削除してもよい。なお、被管理装置グループには、必ずしも複数の装置が含まれているとは限らず、1つの被管理装置により構成されていてもよい。監視項目グループについても同様に、1種類の監視項目により構成されていてもよい。また、画面履歴ファイル格納部521に格納される画面履歴データには、更新前データ及び更新後データが含まれるような例を示したが、日時や障害件数の差分を計算して格納するようにしてもよい。
Although one embodiment of the present invention has been described above, the present invention is not limited to this. For example, the table configurations and file configurations shown in FIGS. 2 to 7 are examples, and other configurations may be adopted as long as similar data is stored, and items may be changed as necessary. You may add or delete. Note that a managed device group does not necessarily include a plurality of devices, and may be configured by a single managed device. Similarly, the monitoring item group may be composed of one type of monitoring item. Moreover, although the example in which the screen history data stored in the screen history
また、図1に示した運用監視装置5の機能ブロック構成は一例であって、実際のプログラム・モジュール構成とは異なる場合がある。また、各装置が複数のサーバやコンピュータによって構成されていてもよい。また、図11、図12、図14、図18、図19及び図21に示した画面例は一例であって、同様のデータを別の態様で表現する場合もある。さらに、図8、図9、図10、図13、図15、図17及び図20に示した処理フローも一例であって、同様の処理結果が得られる範囲において処理の順序を入れ替えてもよいし、必要に応じてステップを追加又は削除してもよい。また、図16に示したビュー・データの更新(画面遷移)の概要図も一例であって、画面要素、更新のタイミング及び更新内容は、図16に示したようなケースに限られない。
Also, the functional block configuration of the
(付記1)
所定のネットワークに接続されている装置の障害を監視する方法であって、
障害が検知された装置と障害発生日時と監視項目に該当する障害内容とに関するデータを含み且つ障害データ・ファイル格納部に格納されている障害データと、画面表示内容に関するデータを含み且つビュー定義ファイル格納部に格納されているビュー定義データとを用いてビュー・データを生成し、ビュー・データ格納部に格納するビュー・データ生成ステップと、
所定の間隔で前記ビュー・データ生成ステップを実行し、前記ビュー・データを更新するステップと、
前記ビュー・データに含まれる画面構成要素が前記ビュー・データの更新前後において異なる値を示す場合、当該画面構成要素の値の変化に関するデータを用いて画面履歴データを生成し、画面履歴ファイル格納部に格納する画面履歴データ生成ステップと
を含み、コンピュータにより実行される障害監視方法。
(Appendix 1)
A method for monitoring a failure of a device connected to a predetermined network,
A view definition file that includes data relating to the device in which the failure is detected, the date and time of occurrence of the failure, and the failure content corresponding to the monitoring item, and the failure data stored in the failure data file storage unit, and data relating to the screen display content A view data generation step of generating view data using the view definition data stored in the storage unit and storing the view data in the view data storage unit;
Executing the view data generation step at a predetermined interval to update the view data;
When the screen component included in the view data shows different values before and after the update of the view data, screen history data is generated using data related to a change in the value of the screen component, and a screen history file storage unit A failure monitoring method executed by a computer, including a screen history data generation step stored in the computer.
(付記2)
前記画面履歴ファイル格納部に格納された前記画面履歴データを用いて、所定の期間内において同一の監視項目又は監視項目グループについて障害が検知された装置グループを特定する関連装置特定ステップと、
特定された前記装置グループの障害に関するデータを特定可能な態様でユーザに示すためのビュー・データを生成し、前記ビュー・データ格納部に格納する関連ビュー・データ生成ステップと、
をさらに含む付記1記載の障害監視方法。
(Appendix 2)
Using the screen history data stored in the screen history file storage unit, a related device specifying step for specifying a device group in which a failure is detected for the same monitoring item or monitoring item group within a predetermined period;
A related view data generation step of generating view data for indicating to a user in a manner capable of specifying data relating to the failure of the specified device group, and storing the generated view data in the view data storage unit;
The failure monitoring method according to
(付記3)
前記関連ビュー・データ生成ステップが、
障害対処の実施に関するデータを含み且つ障害対処ファイル格納部に格納されている障害対処データに基づき、前記関連装置特定ステップにおいて特定された前記装置グループのうち、障害対処がなされた装置グループをルート・コーズとして特定するステップと、
ルート・コーズとして特定され且つ前記障害対処がなされた装置グループの障害に関するデータを特定可能な態様でユーザに示すためのビュー・データを生成し、前記ビュー・データ格納部に格納するステップと、
を含む付記2記載の障害監視方法。
(Appendix 3)
The related view data generation step includes:
Based on the failure handling data stored in the failure handling file storage unit including data relating to the implementation of the failure handling, among the device groups identified in the related device identification step, the device group that has been treated for the failure is routed. Identifying as a cause,
Generating view data for indicating to a user in a manner capable of specifying data relating to a failure of a device group that has been identified as a root cause and has been treated for the failure, and storing the generated view data in the view data storage unit;
The fault monitoring method according to
(付記4)
前記関連ビュー・データ生成ステップが、
前記所定のネットワークにおける各装置の属性に関するデータを含み且つ構成情報ファイル格納部に格納されている構成情報に基づき、前記関連装置特定ステップにおいて特定された前記装置グループのうち、ホップ数が最小の装置を含む装置グループをルート・コーズとして特定するステップと、
ルート・コーズとして特定され且つ前記ホップ数が最小の装置を含む装置グループの障害に関するデータを特定可能な態様でユーザに示すためのビュー・データを生成し、前記ビュー・データ格納部に格納するステップと、
を含む付記2記載の障害監視方法。
(Appendix 4)
The related view data generation step includes:
A device having the smallest number of hops among the device groups identified in the related device identification step based on configuration information that includes data relating to attributes of each device in the predetermined network and stored in a configuration information file storage unit Identifying a device group containing as root causes;
Generating view data for indicating to a user in a manner capable of specifying data relating to a failure of a device group including a device having the smallest number of hops identified as route causes, and storing the generated view data in the view data storage unit When,
The fault monitoring method according to
(付記5)
前記ビュー・データ生成ステップが、
前記障害データ及び前記障害対処データに基づき、前回の更新時刻から現在時刻までにおいて検知され且つ未対処の障害件数を、装置グループ及び監視項目グループ毎に集計するステップと、
集計された前記障害件数を用いてビュー・データを生成し、前記ビュー・データ格納部に格納するステップと、
を含む付記1乃至4のいずれか1つに記載の障害監視方法。
(Appendix 5)
The view data generation step includes:
Based on the failure data and the failure handling data, totaling the number of failures that have been detected from the previous update time to the current time and are not yet handled for each device group and monitoring item group;
Generating view data using the total number of failures and storing the view data in the view data storage unit;
The failure monitoring method according to any one of
(付記6)
前画面表示の要求を受け付けた場合、現画面のビュー・データに対応し且つ前記画面履歴ファイル格納部に格納されている画面履歴データを特定するステップと、
特定された前記画面履歴データと前記現画面のビュー・データとを用いて前画面のビュー・データを生成し、前記ビュー・データ格納部に格納するステップと、
をさらに含む付記1乃至5のいずれか1つに記載の障害監視方法。
(Appendix 6)
If the previous screen display request is received, the step of identifying the screen history data corresponding to the view data of the current screen and stored in the screen history file storage unit;
Generating view data of the previous screen using the identified screen history data and the view data of the current screen, and storing the view data in the view data storage unit;
The fault monitoring method according to any one of
(付記7)
前記画面履歴データには、前記画面構成要素の値の変化を検知した日時である構成要素更新日時が含まれており、
後画面表示の要求を受け付けた場合、現画面のビュー・データに対応し且つ前記画面履歴ファイル格納部に格納されている画面履歴データを特定するステップと、
特定された前記画面履歴データに含まれる構成要素更新日時より後の次の構成要素更新日時を含む画面履歴データと前記現画面のビュー・データとを用いて後画面のビュー・データを生成し、前記ビュー・データ格納部に格納するステップと、
をさらに含む付記1乃至6のいずれか1つに記載の障害監視方法。
(Appendix 7)
The screen history data includes a component update date and time that is a date and time when a change in the value of the screen component is detected,
When receiving a request for a subsequent screen display, identifying screen history data corresponding to the view data of the current screen and stored in the screen history file storage unit;
Using the screen history data including the next component update date and time after the component update date and time included in the identified screen history data and the view data of the current screen to generate the view data of the rear screen, Storing in the view data storage unit;
The fault monitoring method according to any one of
(付記8)
前記画面履歴データには、前記画面構成要素の値の変化を検知した日時である構成要素更新日時が含まれており、
特定の日時についての画面表示の要求を受け付けた場合、現画面のビュー・データと前記特定の日時よりも過去であり且つ前記特定の日時に最も近い構成要素更新日時を含む画面履歴データとを少なくとも用いて、前記特定の日時におけるビュー・データを生成し、前記ビュー・データ格納部に格納するステップと、
をさらに含む付記1乃至7のいずれか1つに記載の障害監視方法。
(Appendix 8)
The screen history data includes a component update date and time that is a date and time when a change in the value of the screen component is detected,
When a screen display request for a specific date and time is received, at least screen view data on the current screen and screen history data including a component update date and time that is earlier than the specific date and time and closest to the specific date and time Using the specific date and time to generate view data and storing it in the view data storage unit;
The fault monitoring method according to any one of
(付記9)
前記ビュー・データ生成ステップが、
障害対処の実施に関するデータを含み且つ障害対処ファイル格納部に格納されている障害対処データと前記障害データとに基づき、未だ障害対処が実施されていない装置グループ及び監視項目グループを特定するステップと、
特定された前記装置グループ及び監視項目グループの障害に関するデータを特定可能な態様でユーザに示すためのビュー・データを生成し、前記ビュー・データ格納部に格納するステップと、
を含む付記1乃至8のいずれか1つに記載の障害監視方法。
(Appendix 9)
The view data generation step includes:
Identifying a device group and a monitoring item group that have not yet been subjected to the failure handling based on the failure handling data that includes data relating to the implementation of the failure handling and that is stored in the failure handling file storage unit; and
Generating view data for showing data to the user in a manner capable of specifying data relating to the failure of the specified device group and monitoring item group, and storing the generated view data in the view data storage unit;
The failure monitoring method according to any one of
(付記10)
所定のネットワークに接続されている装置の障害を監視するための障害監視プログラムであって、
障害が検知された装置と障害発生日時と監視項目に該当する障害内容とに関するデータを含み且つ障害データ・ファイル格納部に格納されている障害データと、画面表示内容に関するデータを含み且つビュー定義ファイル格納部に格納されているビュー定義データとを用いてビュー・データを生成し、ビュー・データ格納部に格納するビュー・データ生成ステップと、
所定の間隔で前記ビュー・データ生成ステップを実行し、前記ビュー・データを更新するステップと、
前記ビュー・データに含まれる画面構成要素が前記ビュー・データの更新前後において異なる値を示す場合、当該画面構成要素の値の変化に関するデータを用いて画面履歴データを生成し、画面履歴ファイル格納部に格納するステップと
をコンピュータに実行させる障害監視プログラム。
(Appendix 10)
A failure monitoring program for monitoring a failure of a device connected to a predetermined network,
A view definition file that includes data relating to the device in which the failure is detected, the date and time of occurrence of the failure, and the failure content corresponding to the monitoring item, and the failure data stored in the failure data file storage unit, and data relating to the screen display content A view data generation step of generating view data using the view definition data stored in the storage unit and storing the view data in the view data storage unit;
Executing the view data generation step at a predetermined interval to update the view data;
When the screen component included in the view data shows different values before and after the update of the view data, screen history data is generated using data relating to a change in the value of the screen component, and a screen history file storage unit A fault monitoring program that causes a computer to execute the steps stored in.
(付記11)
所定のネットワークに接続されている装置の障害を監視する障害監視装置であって、
障害が検知された装置と障害発生日時と監視項目に該当する障害内容とに関するデータを含み且つ障害データ・ファイル格納部に格納されている障害データと、画面表示内容に関するデータを含み且つビュー定義ファイル格納部に格納されているビュー定義データとを用いてビュー・データを生成し、ビュー・データ格納部に格納するビュー・データ生成手段と、
所定の間隔で前記ビュー・データ生成手段による前記ビュー・データの生成を実行し、前記ビュー・データを更新する手段と、
前記ビュー・データに含まれる画面構成要素が前記ビュー・データの更新前後において異なる値を示す場合、当該画面構成要素の値の変化に関するデータを用いて画面履歴データを生成し、画面履歴ファイル格納部に格納する手段と
を有する障害監視装置。
(Appendix 11)
A failure monitoring device that monitors a failure of a device connected to a predetermined network,
A view definition file that includes data relating to the device in which the failure is detected, the date and time of occurrence of the failure, and the failure content corresponding to the monitoring item, and the failure data stored in the failure data file storage unit, and data relating to the screen display content View data generation means for generating view data using the view definition data stored in the storage unit and storing the view data in the view data storage unit;
Means for generating the view data by the view data generating means at a predetermined interval and updating the view data;
When the screen component included in the view data shows different values before and after the update of the view data, screen history data is generated using data related to a change in the value of the screen component, and a screen history file storage unit A fault monitoring device having means for storing the fault.
1 ネットワーク 3 ユーザ端末
5 運用監視装置 7,9,11,13 被管理装置
501 監視定義ファイル格納部 503 監視部
505 構成情報ファイル格納部
507 収集データ・ファイル格納部
509 障害データ・ファイル格納部
511 障害対処部 513 障害対処ファイル格納部
515 最新運用監視ビュー作成部
517 ビュー定義ファイル格納部
519 ビュー・データ格納部
521 画面履歴ファイル格納部
523 運用監視ビュー再現部
DESCRIPTION OF
Claims (5)
障害が検知された装置と障害発生日時と監視項目に該当する障害内容とに関するデータを含み且つ障害データ・ファイル格納部に格納されている障害データと、画面表示内容に関するデータを含み且つビュー定義ファイル格納部に格納されているビュー定義データとを用いてビュー・データを生成し、ビュー・データ格納部に格納するビュー・データ生成ステップと、
所定の間隔で前記ビュー・データ生成ステップを実行し、前記ビュー・データを更新するステップと、
前記ビュー・データに含まれる画面構成要素が前記ビュー・データの更新前後において異なる値を示す場合、当該画面構成要素の値の変化に関するデータを用いて画面履歴データを生成し、画面履歴ファイル格納部に格納する画面履歴データ生成ステップと
を含み、コンピュータにより実行される障害監視方法。 A method for monitoring a failure of a device connected to a predetermined network,
A view definition file that includes data relating to the device in which the failure is detected, the date and time of occurrence of the failure, and the failure content corresponding to the monitoring item, and the failure data stored in the failure data file storage unit, and data relating to the screen display content A view data generation step of generating view data using the view definition data stored in the storage unit and storing the view data in the view data storage unit;
Executing the view data generation step at a predetermined interval to update the view data;
When the screen component included in the view data shows different values before and after the update of the view data, screen history data is generated using data related to a change in the value of the screen component, and a screen history file storage unit A failure monitoring method executed by a computer, including a screen history data generation step stored in the computer.
特定された前記装置グループの障害に関するデータを特定可能な態様でユーザに示すためのビュー・データを生成し、前記ビュー・データ格納部に格納する関連ビュー・データ生成ステップと、
をさらに含む請求項1記載の障害監視方法。 Using the screen history data stored in the screen history file storage unit, a related device specifying step for specifying a device group in which a failure is detected for the same monitoring item or monitoring item group within a predetermined period;
A related view data generation step of generating view data for indicating to a user in a manner capable of specifying data relating to the failure of the specified device group, and storing the generated view data in the view data storage unit;
The fault monitoring method according to claim 1, further comprising:
障害対処の実施に関するデータを含み且つ障害対処ファイル格納部に格納されている障害対処データに基づき、前記関連装置特定ステップにおいて特定された前記装置グループのうち、障害対処がなされた装置グループをルート・コーズとして特定するステップと、
ルート・コーズとして特定され且つ前記障害対処がなされた装置グループの障害に関するデータを特定可能な態様でユーザに示すためのビュー・データを生成し、前記ビュー・データ格納部に格納するステップと、
を含む請求項2記載の障害監視方法。 The related view data generation step includes:
Based on the failure handling data stored in the failure handling file storage unit including data relating to the implementation of the failure handling, among the device groups identified in the related device identification step, the device group that has been treated for the failure is routed. Identifying as a cause,
Generating view data for indicating to a user in a manner capable of specifying data relating to a failure of a device group that has been identified as a root cause and has been treated for the failure, and storing the generated view data in the view data storage unit;
The fault monitoring method according to claim 2 including:
前記所定のネットワークにおける各装置の属性に関するデータを含み且つ構成情報ファイル格納部に格納されている構成情報に基づき、前記関連装置特定ステップにおいて特定された前記装置グループのうち、ホップ数が最小の装置を含む装置グループをルート・コーズとして特定するステップと、
ルート・コーズとして特定され且つ前記ホップ数が最小の装置を含む装置グループの障害に関するデータを特定可能な態様でユーザに示すためのビュー・データを生成し、前記ビュー・データ格納部に格納するステップと、
を含む請求項2記載の障害監視方法。 The related view data generation step includes:
A device having the smallest number of hops among the device groups identified in the related device identification step based on configuration information including data relating to attributes of each device in the predetermined network and stored in a configuration information file storage unit Identifying a device group containing as root causes;
Generating view data for indicating to a user in a manner capable of specifying data relating to a failure of a device group including a device having the smallest number of hops identified as route causes, and storing the generated view data in the view data storage unit When,
The fault monitoring method according to claim 2 including:
障害が検知された装置と障害発生日時と監視項目に該当する障害内容とに関するデータを含み且つ障害データ・ファイル格納部に格納されている障害データと、画面表示内容に関するデータを含み且つビュー定義ファイル格納部に格納されているビュー定義データとを用いてビュー・データを生成し、ビュー・データ格納部に格納するビュー・データ生成ステップと、
所定の間隔で前記ビュー・データ生成ステップを実行し、前記ビュー・データを更新するステップと、
前記ビュー・データに含まれる画面構成要素が前記ビュー・データの更新前後において異なる値を示す場合、当該画面構成要素の値の変化に関するデータを用いて画面履歴データを生成し、画面履歴ファイル格納部に格納するステップと
をコンピュータに実行させる障害監視プログラム。 A failure monitoring program for monitoring a failure of a device connected to a predetermined network,
A view definition file that includes data relating to the device in which the failure is detected, the date and time of occurrence of the failure, and the failure content corresponding to the monitoring item, and the failure data stored in the failure data file storage unit, and data relating to the screen display content A view data generation step of generating view data using the view definition data stored in the storage unit and storing the view data in the view data storage unit;
Executing the view data generation step at a predetermined interval to update the view data;
When the screen component included in the view data shows different values before and after the update of the view data, screen history data is generated using data related to a change in the value of the screen component, and a screen history file storage unit A fault monitoring program that causes a computer to execute the steps stored in.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003374509A JP4183602B2 (en) | 2003-11-04 | 2003-11-04 | Fault monitoring method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003374509A JP4183602B2 (en) | 2003-11-04 | 2003-11-04 | Fault monitoring method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005141308A JP2005141308A (en) | 2005-06-02 |
JP4183602B2 true JP4183602B2 (en) | 2008-11-19 |
Family
ID=34686206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003374509A Expired - Fee Related JP4183602B2 (en) | 2003-11-04 | 2003-11-04 | Fault monitoring method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4183602B2 (en) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007323463A (en) * | 2006-06-02 | 2007-12-13 | Sharp Corp | History management device |
JP2011253310A (en) * | 2010-06-01 | 2011-12-15 | Panasonic Corp | Information data management device, information data management method and program |
CN103378982A (en) * | 2012-04-17 | 2013-10-30 | 深圳市腾讯计算机系统有限公司 | Internet business operation monitoring method and Internet business operation monitoring system |
JP2017034311A (en) * | 2015-07-28 | 2017-02-09 | 株式会社リコー | Information processing device, information processing system, and program |
JP6527442B2 (en) * | 2015-10-02 | 2019-06-05 | 日本電信電話株式会社 | Network monitoring device and network monitoring method |
JP6595960B2 (en) * | 2016-09-02 | 2019-10-23 | 日本電信電話株式会社 | Network monitoring apparatus, network monitoring method, and network monitoring program |
JP2018190029A (en) * | 2017-04-28 | 2018-11-29 | アズビル株式会社 | Facility monitoring device |
-
2003
- 2003-11-04 JP JP2003374509A patent/JP4183602B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005141308A (en) | 2005-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11657309B2 (en) | Behavior analysis and visualization for a computer infrastructure | |
JP4758259B2 (en) | Network monitoring apparatus and method | |
US10454782B2 (en) | System and method for automating network management tasks | |
US7159081B2 (en) | Automatic scenario management for a policy-based storage system | |
JP4672722B2 (en) | Network design processing apparatus, method and program thereof | |
JP6919569B2 (en) | Log analysis systems, methods, and recording media | |
EP3327637B1 (en) | On-demand fault reduction framework | |
US20140282027A1 (en) | Graphic user interface based network management system to define and execute troubleshooting procedure | |
JP4594387B2 (en) | In-service system check processing apparatus, method and program thereof | |
US11271824B2 (en) | Visual overlays for network insights | |
JP4183602B2 (en) | Fault monitoring method and program | |
JP5268589B2 (en) | Information processing apparatus and information processing apparatus operating method | |
JP3916232B2 (en) | Knowledge-type operation management system, method and program | |
JP2016099938A (en) | Event analysis system and method | |
US11522770B2 (en) | Visual overlays for network insights | |
JP6950576B2 (en) | Network systems, topology management methods, and programs | |
US8402125B2 (en) | Method of managing operations for administration, maintenance and operational upkeep, management entity and corresponding computer program product | |
CN110855456B (en) | Network change method and equipment | |
JPH09321760A (en) | Method and system for monitoring route information | |
WO2021250873A1 (en) | Rule generation device, rule generation method, and program | |
JP2010009127A (en) | Management program and management device | |
Cisco | CiscoWorks User Guide Software Release 2.0 | |
JP2007072545A (en) | Monitoring device and monitoring method | |
CN113079059A (en) | Network state monitoring method and device, electronic equipment and readable storage medium | |
WO2016130337A1 (en) | System and method for automating network management tasks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060612 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080902 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080902 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110912 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130912 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |