JP2009151456A - Monitoring system, network monitoring apparatus and service execution environment monitoring method - Google Patents

Monitoring system, network monitoring apparatus and service execution environment monitoring method Download PDF

Info

Publication number
JP2009151456A
JP2009151456A JP2007327470A JP2007327470A JP2009151456A JP 2009151456 A JP2009151456 A JP 2009151456A JP 2007327470 A JP2007327470 A JP 2007327470A JP 2007327470 A JP2007327470 A JP 2007327470A JP 2009151456 A JP2009151456 A JP 2009151456A
Authority
JP
Japan
Prior art keywords
monitoring
execution environment
service execution
sub
conditions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007327470A
Other languages
Japanese (ja)
Other versions
JP4867908B2 (en
Inventor
Motoo Kawamura
元夫 河村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007327470A priority Critical patent/JP4867908B2/en
Publication of JP2009151456A publication Critical patent/JP2009151456A/en
Application granted granted Critical
Publication of JP4867908B2 publication Critical patent/JP4867908B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a monitoring system, a monitoring apparatus and a service execution environment monitoring method that evaluate in the apparatus whether or not monitoring settings are appropriate and prompt an administrator to change them if necessary. <P>SOLUTION: A manager apparatus 100 has a monitoring rule storage part 120 for storing monitoring rules each defined by a plurality of conditions including a main condition and at least one sub condition, an analysis part 110 for determining whether or not the state of a service execution environment 300 matches the main conditions and sub conditions defined in the monitoring rules, a monitoring failure verification part 130 for determining whether or not any sub condition and the main condition of an optional monitoring rule return different results of matching against the state of the service execution environment 300, a monitoring failure display part 150 for requesting an administrator to update a monitoring rule in which any sub condition and the main condition return different matching results, and a monitoring rule update part 160 for storing a revised monitoring rule in the monitoring rule storage part 120. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、アプリケーションを実行する装置の運用条件を監視する監視システム、ネットワーク監視装置及びサービス実行環境監視方法に関し、特に、実環境に合わせた監視設定を行える監視システム、ネットワーク監視装置及びサービス実行環境監視方法に関する。   The present invention relates to a monitoring system, a network monitoring apparatus, and a service execution environment monitoring method for monitoring operation conditions of an apparatus that executes an application, and in particular, a monitoring system, a network monitoring apparatus, and a service execution environment that can perform monitoring settings according to an actual environment. It relates to the monitoring method.

運用監視製品にとって、監視、分析、対処という自律のループをいかに正しく回すかが大きな課題となっている。   For operational monitoring products, a major issue is how to properly rotate the autonomous loop of monitoring, analysis, and handling.

その中でも、分析結果の正しさを検証する手法は実現されておらず、運用を継続することによって分析結果が適正なものになっていくこと、すなわち監視設定が自動最適化されることが求められている。   Among them, there is no method to verify the correctness of the analysis results, and it is required that the analysis results become appropriate by continuing operation, that is, the monitoring settings are automatically optimized. ing.

そのためには、監視設定が適切になされているか否かをシステム自体が評価して管理者に変更を促す、又は監視設定を自動修正する必要がある。   For this purpose, it is necessary for the system itself to evaluate whether or not the monitoring setting is appropriately made and to prompt the administrator to make a change or to automatically correct the monitoring setting.

しかし、監視設定が適切になされているか否かをシステム自体が評価するためには、本当の障害が発生しているのか、又は監視設定が適切ではない“監視不良状態”であるのかをシステムが区別できなければならない。   However, in order for the system itself to evaluate whether or not the monitoring settings are properly set, the system determines whether a real failure has occurred or whether the monitoring settings are not set properly. It must be distinguishable.

運用監視製品の監視条件の妥当性確認方法に関しては、本当に障害が発生しているのか、実際には障害が発生していないのにもかかわらず監視設定が適切でないために障害が検出されているのかを区別できないというのが実状であった。また、管理者が監視条件を見直すのには実行環境に関する膨大な知識や経験が必要であった。   Regarding the validity check method for the monitoring conditions of the operation monitoring product, a failure has been detected because the monitoring settings are not appropriate even though a failure has actually occurred or no failure has actually occurred The fact was that it was not possible to distinguish between the two. In addition, in order for the administrator to review the monitoring conditions, a large amount of knowledge and experience regarding the execution environment was required.

上記のような運用監視製品の監視条件の妥当性を確認することに関連する技術として、特許文献1には、1回目の関数処理後に異常時の制御用ルールを用いて2回目の関数処理を行い、1回目の処理の妥当性を評価する火災警報装置が開示されている。
特許文献1に開示される発明は、複数の条件で異常判定を行うことで判定精度を向上させるものである。
特開平06−318292号公報
As a technique related to confirming the validity of the monitoring condition of the operation monitoring product as described above, Patent Document 1 discloses that the second function processing is performed using the control rule at the time of abnormality after the first function processing. A fire alarm device is disclosed that performs and evaluates the validity of the first treatment.
The invention disclosed in Patent Document 1 improves determination accuracy by performing abnormality determination under a plurality of conditions.
Japanese Patent Laid-Open No. 06-318292

しかし、特許文献1には、2回目の関数処理によって1回目の処理の妥当性が低いと評価した場合に、1回目の処理に用いた処理ルールを修正することについて何の開示も無く、示唆さえされていない。すなわち、特許文献1に開示される発明は、実環境に合わせて監視設定を自動最適化することはできない。よって、ある状態において1回目の処理と2回目の処理とで判断結果が一致しなかった場合、それ以降に同じ状態となったとしても、1回目の処理結果と2回目の処理結果は不一致となったままである。   However, Patent Document 1 has no disclosure and suggestion of correcting the processing rule used for the first process when the second function process evaluates that the validity of the first process is low. Not even been done. That is, the invention disclosed in Patent Document 1 cannot automatically optimize the monitoring setting in accordance with the actual environment. Therefore, if the determination result does not match between the first process and the second process in a certain state, the first process result and the second process result do not match even if the determination result is the same after that. Remains.

本発明は係る問題に鑑みてなされたものであり、監視設定が適切になされているか否かを装置自体が評価して管理者に変更を促す監視システム、ネットワーク監視装置、及びサービス実行環境監視方法を提供することを目的とする。   The present invention has been made in view of such problems, and a monitoring system, a network monitoring apparatus, and a service execution environment monitoring method that the apparatus itself evaluates whether or not the monitoring setting is appropriately made and prompts the administrator to make a change. The purpose is to provide.

上記目的を達成するため、本発明は、第1の態様として、監視対象であるサービス実行環境を監視するシステムであって、サービス実行環境の状態を把握するためのエージェント装置と、サービス実行環境の監視ルールを管理するためのマネージャ装置とを有し、エージェント装置は、サービス実行環境から該サービス実行環境の状態を示す状態情報を取得する手段と、状態情報をマネージャ装置へ送信する手段と、マネージャ装置から取得したコマンドを実行してサービス実行環境の状態を変化させる手段とを有し、マネージャ装置は、主条件と少なくとも一つの副条件との複数の条件で定義される監視ルールを蓄積する蓄積手段と、状態情報によって示されるサービス実行環境の状態が、監視ルールに定義された主条件に適合するか否かを判断する手段と、サービス実行環境の状態が、監視ルールに定義された副条件のそれぞれに適合するか否かを判断する手段と、サービス実行環境の状態が、任意の監視ルールにおいて、副条件のいずれかと主条件とで適否が異なるか否かを判断する手段と、副条件のいずれかと主条件とで適否が異なる監視ルールの更新を管理者に要求する手段と、改正された監視ルールを蓄積手段へ蓄積する手段と、サービス実行環境に発生した障害を解消するためのコマンドをエージェント装置へ発行する手段とを有することを特徴とする監視システムを提供するものである。   In order to achieve the above object, the present invention provides, as a first aspect, a system for monitoring a service execution environment to be monitored, an agent device for grasping the state of the service execution environment, and a service execution environment. A manager device for managing the monitoring rules, wherein the agent device obtains status information indicating the status of the service execution environment from the service execution environment, means for transmitting the status information to the manager device, and manager Means for executing a command acquired from the device to change the state of the service execution environment, and the manager device stores the monitoring rule defined by a plurality of conditions of a main condition and at least one sub-condition. Whether the status of the service execution environment indicated by the means and status information meets the main conditions defined in the monitoring rule The means for determining, the means for determining whether the status of the service execution environment matches each of the sub-conditions defined in the monitoring rule, and the status of the service execution environment for the sub-condition in any monitoring rule Stores revised monitoring rules, means for judging whether or not the suitability differs between any of the main conditions, means for requesting the administrator to update monitoring rules that differ in suitability between any of the subconditions and the main conditions It is an object of the present invention to provide a monitoring system comprising means for accumulating in a means and means for issuing a command for solving a failure occurring in a service execution environment to an agent device.

また、上記目的を達成するため、本発明は、第2の態様として、主条件と少なくとも一つの副条件との複数の条件で定義される監視ルールを蓄積する蓄積手段と、監視の対象であるサービス実行環境の状態が、蓄積手段に蓄積されたいずれかの監視ルールに定義された主条件に適合するか否かを判断する手段と、サービス実行環境の状態が、蓄積手段に蓄積されたいずれかの監視ルールに定義された副条件のそれぞれに適合するか否かを判断する手段と、サービス実行環境の状態が、任意の監視ルールにおいて、副条件のいずれかと主条件とで適否が異なるか否かを判断する手段と、副条件のいずれかと主条件とで適否が異なる監視ルールの更新を管理者に要求する手段と、改正された監視ルールを蓄積手段へ蓄積する手段とを有する監視装置を提供するものである。   In order to achieve the above object, as a second aspect, the present invention is a storage means for storing a monitoring rule defined by a plurality of conditions of a main condition and at least one sub-condition, and a monitoring target. Means for determining whether the state of the service execution environment conforms to a main condition defined in any of the monitoring rules stored in the storage means, and any of the states of the service execution environment stored in the storage means Whether or not the means for determining whether or not the sub-conditions defined in each monitoring rule are met and the status of the service execution environment differ between any of the sub-conditions and the main condition in any monitoring rule A monitoring device comprising: means for judging whether or not; means for requesting an administrator to update a monitoring rule whose suitability is different between one of the sub-conditions and the main condition; and means for storing the revised monitoring rule in the storage means It is intended to provide.

また、上記目的を達成するため、本発明は、第3の態様として、監視の対象であるサービス実行環境の状態が、蓄積手段に蓄積されたいずれかの監視ルールに定義された主条件に適合するか否かを判断する工程と、サービス実行環境の状態が、蓄積手段に蓄積されたいずれかの監視ルールに定義された副条件のそれぞれに適合するか否かを判断する工程と、サービス実行環境の状態が、任意の監視ルールにおいて、副条件のいずれかと主条件とで適否が異なるか否かを判断する工程と、副条件のいずれかと主条件とで適否が異なる監視ルールの更新を管理者に要求する工程と、改正された監視ルールを蓄積手段へ蓄積する工程とを有するサービス実行環境監視方法を提供するものである。   In order to achieve the above object, according to a third aspect of the present invention, the status of the service execution environment to be monitored conforms to the main condition defined in any of the monitoring rules stored in the storage means. Determining whether or not to perform, determining whether or not the status of the service execution environment meets each of the sub-conditions defined in any of the monitoring rules stored in the storage means, and executing the service Manages the process of determining whether the status of an environment differs in suitability between any of the sub-conditions and the main condition in any monitoring rule, and updates of monitoring rules that differ in suitability between any of the sub-conditions and the main condition A service execution environment monitoring method having a process of requesting a user and a process of storing the revised monitoring rule in a storage means.

本発明によれば、監視設定が適切になされているか否かを装置自体が評価して管理者に変更を促す監視システム、ネットワーク監視装置、及びサービス実行環境監視方法を提供できる。   According to the present invention, it is possible to provide a monitoring system, a network monitoring device, and a service execution environment monitoring method in which the device itself evaluates whether or not the monitoring setting is appropriately made and prompts the administrator to make a change.

図1に、本発明に係るネットワーク監視装置の構成を示す。ネットワーク監視装置10は、主条件と少なくとも一つの副条件との複数の条件で定義される監視ルールを蓄積する監視ルール蓄積部12と、監視の対象であるサービス実行環境の状態が、監視ルール蓄積部12に蓄積されたいずれかの監視ルールに定義された主条件に適合するか否か及び副条件のそれぞれに適合するか否かを判断する分析部11と、サービス実行環境の状態が、任意の監視ルールにおいて、副条件のいずれかと主条件とで適否が異なるか否かを判断する監視不良検証部13と、副条件のいずれかと主条件とで適否が異なる監視ルールの更新を管理者に要求する監視不良表示部15と、改正された監視ルールを蓄積手段へ蓄積する監視ルール更新部16とを有する。   FIG. 1 shows a configuration of a network monitoring apparatus according to the present invention. The network monitoring apparatus 10 includes a monitoring rule accumulating unit 12 that accumulates monitoring rules defined by a plurality of conditions including a main condition and at least one sub-condition, and the status of a service execution environment to be monitored is a monitoring rule accumulation The analysis unit 11 that determines whether or not the main condition defined in any of the monitoring rules stored in the unit 12 meets each of the sub-conditions and whether or not the service execution environment state is arbitrary. The monitoring failure verification unit 13 that determines whether or not the suitability is different between one of the sub-conditions and the main condition, and updates the monitoring rule that is suitability is different between one of the sub-conditions and the main condition. A monitoring failure display unit 15 to request and a monitoring rule update unit 16 to store the revised monitoring rule in the storage unit.

分析部11は、監視対象の状態情報を受け取り、監視ルール蓄積部12に蓄積されている監視ルールの条件を満たすか否かを判定する。監視ルール蓄積部12は、複数の条件によって定義される障害の監視のための監視ルールを格納し管理する。監視不良検証部13は、分析部11からの障害判定結果を受け取り、複数存在する条件の判定結果が一致しない場合には、監視設定が適切ではないことを示す監視不良警告を監視不良表示部15に表示させる。監視ルール更新部16は、監視不良が発生し監視ルールを変更する必要が生じた場合には、管理者からの入力操作を受け付け、監視ルール蓄積部12に蓄積されている監視ルールを変更し更新する。   The analysis unit 11 receives the status information of the monitoring target and determines whether or not the conditions of the monitoring rules stored in the monitoring rule storage unit 12 are satisfied. The monitoring rule accumulation unit 12 stores and manages monitoring rules for monitoring failures defined by a plurality of conditions. The monitoring failure verification unit 13 receives the failure determination result from the analysis unit 11, and when the determination results of a plurality of conditions do not match, the monitoring failure display unit 15 displays a monitoring failure warning indicating that the monitoring setting is not appropriate. To display. The monitoring rule update unit 16 accepts an input operation from the administrator and changes and updates the monitoring rule stored in the monitoring rule storage unit 12 when a monitoring failure occurs and the monitoring rule needs to be changed. To do.

以下、本発明の好適な実施の形態について説明する。   Hereinafter, preferred embodiments of the present invention will be described.

本発明の好適な実施の形態について説明する。図2に、本実施形態に係るネットワーク監視システムの構成を示す。このシステムは、マネージャ装置100、エージェント装置200及びサービス実行環境300を含む。本発明に係るネットワーク監視装置は、マネージャ装置100としてネットワーク監視システムに適用されている。   A preferred embodiment of the present invention will be described. FIG. 2 shows the configuration of the network monitoring system according to the present embodiment. This system includes a manager device 100, an agent device 200, and a service execution environment 300. The network monitoring apparatus according to the present invention is applied as a manager apparatus 100 to a network monitoring system.

マネージャ装置100は、分析部110、監視ルール蓄積部120、監視不良検証部130、障害表示部140、監視不良表示部150及び監視ルール更新部160を有する。マネージャ装置100としては、SNMPサーバなどが用いられる。   The manager device 100 includes an analysis unit 110, a monitoring rule storage unit 120, a monitoring failure verification unit 130, a failure display unit 140, a monitoring failure display unit 150, and a monitoring rule update unit 160. As the manager device 100, an SNMP server or the like is used.

分析部110は、エージェント装置200からイベント20を受け取り、監視ルール蓄積部120に蓄積されている監視ルールの条件を満たすか否かを判定する。分析部110は、イベント20が条件を満たすと判定した場合、それを監視不良検証部130に通知し、障害表示部140によって画面表示を行い管理者10にそれを告知する。監視ルール蓄積部120は、複数の条件によって定義される障害の監視のための監視ルールを格納し管理する。監視不良検証部130は、分析部110からの障害判定結果を受け取り、複数存在する条件の判定結果が一致しない場合には、監視設定が適切ではないことを示す監視不良警告を監視不良表示部150に表示させる。監視ルール更新部160は、監視不良が発生し監視ルールを変更する必要が生じた場合には、管理者10からの入力操作を受け付け、監視ルール蓄積部120に蓄積されている監視ルールを変更し更新する。   The analysis unit 110 receives the event 20 from the agent device 200 and determines whether or not the conditions of the monitoring rules stored in the monitoring rule storage unit 120 are satisfied. If the analysis unit 110 determines that the event 20 satisfies the condition, the analysis unit 110 notifies the monitoring failure verification unit 130 of this, displays the screen by the failure display unit 140, and notifies the administrator 10 of the screen display. The monitoring rule accumulating unit 120 stores and manages monitoring rules for monitoring failures defined by a plurality of conditions. The monitoring failure verification unit 130 receives the failure determination result from the analysis unit 110, and if the determination result of a plurality of conditions does not match, the monitoring failure display unit 150 displays a monitoring failure warning indicating that the monitoring setting is not appropriate. To display. When a monitoring failure occurs and the monitoring rule needs to be changed, the monitoring rule update unit 160 receives an input operation from the administrator 10 and changes the monitoring rule stored in the monitoring rule storage unit 120. Update.

マネージャ装置100は、管理者10の指令により障害解消のためのアクションをコマンド30としてエージェント装置200へ発行する機能を備える。   The manager device 100 has a function of issuing an action for solving a failure as a command 30 to the agent device 200 according to an instruction from the administrator 10.

エージェント装置200は、監視部210及び制御部220を有する。
監視部210は、サービス実行環境300から性能情報を取り出し、イベント20を生成してマネージャ装置100に通知する。制御部220は、マネージャ装置100から障害解消のためのアクションとしてのコマンド30を受け取り、サービス実行環境300にそのコマンドを発行して障害を解消させる。
The agent device 200 includes a monitoring unit 210 and a control unit 220.
The monitoring unit 210 extracts performance information from the service execution environment 300, generates an event 20, and notifies the manager device 100 of it. The control unit 220 receives the command 30 as an action for solving the failure from the manager device 100, and issues the command to the service execution environment 300 to solve the failure.

このシステムは、イベント20を収集して分析(障害条件の判定)した結果をマネージャ装置100が管理者に提示する構成であるが、監視ルール蓄積部120に格納される監視ルールには、異なる観点で同一状態を判定する複数の条件を定義する。監視不良検出部130がこの複数の条件での判定の違いを検出した場合には、監視設定が適切ではない監視不良状態にあるとして警告を発し、管理者に条件を修正させる。   This system has a configuration in which the manager device 100 presents the result of collecting and analyzing the event 20 (determination of a failure condition) to the administrator, but the monitoring rules stored in the monitoring rule storage unit 120 have different viewpoints. Define multiple conditions to determine the same state. When the monitoring failure detection unit 130 detects a difference in determination under the plurality of conditions, a warning is issued that the monitoring setting is not appropriate, and the condition is corrected by the administrator.

本実施形態に係る監視システムの動作について説明する。
図3に、監視ルールのデータ構造を示す。監視ルールは、番号、ルール名称、主条件、副条件及びアクションからなる。ここでは、副条件の最大数を3としているが、これに限定されることはなく任意個数である。
The operation of the monitoring system according to this embodiment will be described.
FIG. 3 shows the data structure of the monitoring rule. The monitoring rule includes a number, a rule name, a main condition, a sub condition, and an action. Here, the maximum number of sub-conditions is set to 3, but the number is not limited to this and is an arbitrary number.

図3の番号“1”の監視ルール(ルール名称「Websrv過負荷」)は、Webサーバ、データベースサーバ及びアプリケーションサーバからなる3層構成のシステムのうちWebサーバの過負荷を監視するルールの例であり、Webサーバの負荷が80%以上のとき障害と判定する条件が主条件として定義されている。さらに、アプリケーションのレスポンスが5000ms以上の時に障害発生と判定する“副条件1”、APサーバの負荷が70%以上の時に障害発生と判定する“副条件2”、DBサーバの負荷が60%以上のときに障害発生と判定する“副条件3”の三つの副条件が定義されている。このように監視ルールは、障害状態を示す主条件と、主条件の状態を別の観点から表す少なくとも一つの副条件との複数の条件を備える。   The monitoring rule of number “1” in FIG. 3 (rule name “Websrv overload”) is an example of a rule for monitoring an overload of a Web server in a three-layer system including a Web server, a database server, and an application server. Yes, a condition for determining a failure when the load of the Web server is 80% or more is defined as a main condition. Furthermore, “sub-condition 1” for determining that a failure has occurred when the application response is 5000 ms or more, “sub-condition 2” for determining that a failure has occurred when the load on the AP server is 70% or higher, and the load on the DB server being 60% or higher Three sub-conditions “sub-condition 3” for determining that a failure has occurred are defined. As described above, the monitoring rule includes a plurality of conditions including a main condition indicating a failure state and at least one sub-condition expressing the state of the main condition from another viewpoint.

図4に、監視システムの動作の流れを示す。ステップA01及びA02は監視部210の動作、ステップA11〜A16は分析部の動作、ステップA21〜24は監視条件検証部の動作、ステップA31は監視不良表示部の動作、ステップA41は監視ルール更新部の動作である。
まず、エージェント装置200の監視部210がサービス実行環境300から性能情報を収集する(ステップA01)。監視部210は、性能情報を取得するとそれを基にイベント20を生成し、マネージャ装置100へ送る(ステップA02)。
FIG. 4 shows the operation flow of the monitoring system. Steps A01 and A02 are the operations of the monitoring unit 210, steps A11 to A16 are the operations of the analysis unit, steps A21 to 24 are the operations of the monitoring condition verification unit, step A31 is the operation of the monitoring failure display unit, and step A41 is the monitoring rule update unit Is the operation.
First, the monitoring unit 210 of the agent device 200 collects performance information from the service execution environment 300 (step A01). When the monitoring unit 210 acquires the performance information, the monitoring unit 210 generates an event 20 based on the performance information, and sends the event 20 to the manager device 100 (step A02).

マネージャ装置100の分析部110では、エージェント装置200からイベント20が送られてくるのを待機している(ステップA11)。分析部110は、エージェント装置200からイベント20が送られてきたならば、監視ルール蓄積部120から適合未判定の監視ルールを一つ取り出す(ステップA12)。
未判定の監視ルールが無ければ(ステップA13/Yes)、ステップA11に戻り、分析部110は次のイベントがエージェント装置200から送られてくるのを待機する。監視ルールを取り出した場合には(ステップA13/No)、分析部110は取り出した監視ルールの主条件が満たされているか否かを判定する(ステップA14)。主条件を満たしていた場合には(ステップA15/Yes)、分析部110は障害判定結果を障害表示部140へ通知し、障害状態にあることを表示させる(ステップA16)。一方、主条件を満たしていない場合にはステップA21へ進む。
The analysis unit 110 of the manager device 100 waits for the event 20 to be sent from the agent device 200 (step A11). When the event 20 is sent from the agent device 200, the analysis unit 110 extracts one monitoring rule that has not been determined from the monitoring rule storage unit 120 (step A12).
If there is no undetermined monitoring rule (step A13 / Yes), the process returns to step A11, and the analysis unit 110 waits for the next event to be sent from the agent device 200. When the monitoring rule is extracted (step A13 / No), the analysis unit 110 determines whether or not the main condition of the extracted monitoring rule is satisfied (step A14). If the main condition is satisfied (step A15 / Yes), the analysis unit 110 notifies the failure determination result to the failure display unit 140 and displays that it is in a failure state (step A16). On the other hand, if the main condition is not satisfied, the process proceeds to step A21.

分析部110が主条件の判定を終えた後、監視不良検証部130は、主条件の判定結果と副条件の判定結果とが異なる場合に監視設定が適切ではない“監視不良状態”にあると判断するために以下の動作を行う。副条件は複数存在しうるため、まず監視不良検証部130は、監視ルールから判定対象の副条件を一つ取り出す(ステップA21)。監視ルールの全ての副条件について判定を終えたならば(ステップA22/Yes)、ステップA12へ戻って次の監視ルールの処理を行う。一方、未判定の副条件が存在するならば(ステップA22/No)、ステップA23へ進む。   After the analysis unit 110 finishes determining the main condition, the monitoring failure verification unit 130 is in a “monitoring failure state” in which the monitoring setting is not appropriate when the determination result of the main condition is different from the determination result of the sub condition. The following operations are performed in order to determine. Since a plurality of subconditions may exist, first, the monitoring failure verification unit 130 extracts one subcondition to be determined from the monitoring rule (step A21). If the determination is completed for all the sub-conditions of the monitoring rule (step A22 / Yes), the process returns to step A12 and the next monitoring rule is processed. On the other hand, if an undetermined sub-condition exists (step A22 / No), the process proceeds to step A23.

ステップA21で判定対象の副条件を取り出した場合には、監視不良検証部130は主条件の判定結果と副条件の判定結果とが異なるか否かを判定する(ステップA23)。主条件の判定結果と副条件の判定結果とが一致する場合には(ステップA24/No)、ステップA21へ戻って他の副条件について同様の処理を行う。一方、主条件の判定結果と副条件の判定結果とが一致しない場合には(ステップA24/Yes)、ステップA31へ進み、監視設定が適切ではない“監視不良状態”の処理を行う。   When the sub-condition to be determined is extracted in step A21, the monitoring failure verification unit 130 determines whether the determination result of the main condition is different from the determination result of the sub-condition (step A23). If the determination result of the main condition matches the determination result of the sub condition (step A24 / No), the process returns to step A21 and the same processing is performed for the other sub conditions. On the other hand, if the determination result of the main condition and the determination result of the sub condition do not match (step A24 / Yes), the process proceeds to step A31, and the processing of “monitoring failure state” in which the monitoring setting is not appropriate is performed.

監視設定が適切ではない“監視不良状態”にある場合には、監視不良表示部150は、監視不良警告として主条件及びその判定結果と副条件及びその判定結果とを表示することによって監視不良状態にあることを管理者10に報知する(ステップA31)。報知された監視不良警告に応じて管理者10が監視ルール更新部160を用いて監視ルールの条件の修正を実施すると、監視ルール更新部160は、更新した監視ルールを監視ルール蓄積部120に格納する(ステップA41)。その後、ステップA21へ戻り次の副条件を処理する。   When the monitoring setting is in the “monitoring failure state” where the monitoring setting is not appropriate, the monitoring failure display unit 150 displays the main condition, its determination result, the sub-condition, and its determination result as a monitoring failure warning, thereby displaying the monitoring failure state. To the administrator 10 (step A31). When the administrator 10 corrects the condition of the monitoring rule using the monitoring rule update unit 160 according to the notified monitoring failure warning, the monitoring rule update unit 160 stores the updated monitoring rule in the monitoring rule accumulation unit 120. (Step A41). Thereafter, the process returns to step A21 to process the next subcondition.

このように、本実施形態に係るネットワーク監視システムは、監視ルールの条件を主条件と副条件との2種類で構成し、監視時に主条件と副条件とで判定結果に差がある場合には監視設定が適切ではない状態にあるとして管理者に条件の修正を求める。このため、運用を続けるうちに主副条件の差が小さくなり監視設定を改善できる。   As described above, the network monitoring system according to the present embodiment is configured with two types of monitoring rule conditions, the main condition and the sub condition, and when there is a difference in the determination result between the main condition and the sub condition during monitoring. The administrator is requested to correct the condition because the monitoring setting is not appropriate. For this reason, as the operation continues, the difference between the main and sub conditions becomes smaller and the monitoring setting can be improved.

また、主条件と副条件とで判定結果に差がある場合に、監視設定が適切ではないことを示す監視不良警告を表示するため、管理者は障害が発生しているのか監視不良なのかを区別できる。   In addition, when there is a difference in the judgment result between the main condition and the sub condition, the administrator displays a monitoring failure warning indicating that the monitoring setting is not appropriate, so the administrator can check whether a failure has occurred or whether the monitoring has failed. Can be distinguished.

なお、上記実施形態は本発明の好適な実施の一例であり、本発明はこれに限定されることはない。
例えば、上記実施形態においては3層構造のシステムを監視する処理を例としたが、監視対象の構成は任意であることは言うまでもない。
また、障害発生の表示は行わず監視条件の検証のみを行うことも可能である。
このように、本発明は様々な変形が可能である。
In addition, the said embodiment is an example of suitable implementation of this invention, and this invention is not limited to this.
For example, in the above embodiment, the process of monitoring a system with a three-layer structure is taken as an example, but it goes without saying that the configuration of the monitoring target is arbitrary.
It is also possible to verify only the monitoring conditions without displaying the occurrence of a failure.
As described above, the present invention can be variously modified.

本発明に係るネットワーク監視装置の構成を示す図である。It is a figure which shows the structure of the network monitoring apparatus which concerns on this invention. 本発明の好適な実施の形態に係るネットワーク監視システムの構成を示す図である。It is a figure which shows the structure of the network monitoring system which concerns on suitable embodiment of this invention. 監視ルールの一例を示す図である。It is a figure which shows an example of the monitoring rule. 本発明の好適な実施の形態に係るネットワーク監視システムの動作の流れを示す図である。It is a figure which shows the flow of operation | movement of the network monitoring system which concerns on suitable embodiment of this invention.

符号の説明Explanation of symbols

10 ネットワーク監視装置
11、110 分析部
12、120 監視ルール蓄積部
13、130 監視結果検証部
15、150 監視不良表示部
16、160 監視ルール更新部
100 マネージャ装置
140 障害表示部
200 エージェント装置
210 監視部
220 制御部
300 サービス実行環境
DESCRIPTION OF SYMBOLS 10 Network monitoring apparatus 11,110 Analysis part 12,120 Monitoring rule storage part 13,130 Monitoring result verification part 15,150 Monitoring failure display part 16,160 Monitoring rule update part 100 Manager apparatus 140 Fault display part 200 Agent apparatus 210 Monitoring part 220 Control unit 300 Service execution environment

Claims (9)

監視対象であるサービス実行環境を監視するシステムであって、
前記サービス実行環境の状態を把握するためのエージェント装置と、前記サービス実行環境の監視ルールを管理するためのマネージャ装置とを有し、
前記エージェント装置は、
前記サービス実行環境から該サービス実行環境の状態を示す状態情報を取得する手段と、
前記状態情報を前記マネージャ装置へ送信する手段と、
前記マネージャ装置から取得したコマンドを実行して前記サービス実行環境の状態を変化させる手段とを有し、
前記マネージャ装置は、
主条件と少なくとも一つの副条件との複数の条件で定義される監視ルールを蓄積する蓄積手段と、
前記状態情報によって示される前記サービス実行環境の状態が、前記監視ルールに定義された主条件に適合するか否かを判断する手段と、
前記サービス実行環境の状態が、前記監視ルールに定義された副条件のそれぞれに適合するか否かを判断する手段と、
前記サービス実行環境の状態が、任意の監視ルールにおいて、副条件のいずれかと主条件とで適否が異なるか否かを判断する手段と、
副条件のいずれかと主条件とで適否が異なる監視ルールの更新を管理者に要求する手段と、
改正された監視ルールを前記蓄積手段へ蓄積する手段と、
前記サービス実行環境に発生した障害を解消するためのコマンドを前記エージェント装置へ発行する手段とを有することを特徴とする監視システム。
A system for monitoring a service execution environment to be monitored,
An agent device for grasping the state of the service execution environment, and a manager device for managing monitoring rules of the service execution environment;
The agent device is:
Means for obtaining status information indicating the status of the service execution environment from the service execution environment;
Means for transmitting the status information to the manager device;
Means for executing a command acquired from the manager device and changing the state of the service execution environment;
The manager device is
Storage means for storing monitoring rules defined by a plurality of conditions of a main condition and at least one sub-condition;
Means for determining whether the state of the service execution environment indicated by the state information conforms to a main condition defined in the monitoring rule;
Means for determining whether the state of the service execution environment meets each of the sub-conditions defined in the monitoring rule;
Means for determining whether the status of the service execution environment is different in suitability between any of the sub-conditions and the main condition in an arbitrary monitoring rule;
Means for requesting the administrator to update a monitoring rule whose suitability is different between one of the sub-conditions and the main condition;
Means for storing the revised monitoring rule in the storage means;
A monitoring system comprising: means for issuing a command for solving a failure occurring in the service execution environment to the agent device.
前記監視ルールの更新を前記管理者へ要求する際に、前記主条件の再設定を要求することを特徴とする請求項2記載の監視システム。   The monitoring system according to claim 2, wherein when the administrator is requested to update the monitoring rule, resetting of the main condition is requested. 前記コマンドの処理内容が前記監視ルールに含まれて定義されていることを特徴とする請求項1又は2記載の監視システム。   The monitoring system according to claim 1 or 2, wherein the processing content of the command is defined by being included in the monitoring rule. 前記マネージャ装置と前記エージェント装置とは、SNMPプロトコルによって通信することを特徴とする請求項1から3のいずれか1項記載の監視システム。   The monitoring system according to any one of claims 1 to 3, wherein the manager device and the agent device communicate with each other by an SNMP protocol. 前記マネージャ装置は、前記状態情報によって示される前記サービス実行環境の状態が、前記監視ルールに定義された主条件に適合する場合に、障害の発生を管理者に通知する手段を有することを特徴とする請求項1から4のいずれか1項記載の監視システム。   The manager device has means for notifying an administrator of the occurrence of a failure when the state of the service execution environment indicated by the state information conforms to a main condition defined in the monitoring rule. The monitoring system according to any one of claims 1 to 4. 主条件と少なくとも一つの副条件との複数の条件で定義される監視ルールを蓄積する蓄積手段と、
監視の対象であるサービス実行環境の状態が、前記蓄積手段に蓄積されたいずれかの前記監視ルールに定義された主条件に適合するか否かを判断する手段と、
前記サービス実行環境の状態が、前記蓄積手段に蓄積されたいずれかの前記監視ルールに定義された副条件のそれぞれに適合するか否かを判断する手段と、
前記サービス実行環境の状態が、任意の監視ルールにおいて、副条件のいずれかと主条件とで適否が異なるか否かを判断する手段と、
副条件のいずれかと主条件とで適否が異なる監視ルールの更新を管理者に要求する手段と、
改正された監視ルールを前記蓄積手段へ蓄積する手段とを有する監視装置。
Storage means for storing monitoring rules defined by a plurality of conditions of a main condition and at least one sub-condition;
Means for determining whether the state of the service execution environment to be monitored is compatible with a main condition defined in any of the monitoring rules stored in the storage means;
Means for determining whether the state of the service execution environment meets each of the sub-conditions defined in any of the monitoring rules stored in the storage means;
Means for determining whether the status of the service execution environment is different in suitability between any of the sub-conditions and the main condition in an arbitrary monitoring rule;
Means for requesting the administrator to update a monitoring rule whose suitability is different between one of the sub-conditions and the main condition;
A monitoring device having means for storing the revised monitoring rule in the storage means.
前記サービス実行環境の状態が、前記監視ルールに定義された主条件に適合する場合に、障害の発生を管理者に通知する手段を有することを特徴とする請求項6記載の監視装置。   7. The monitoring apparatus according to claim 6, further comprising means for notifying an administrator of the occurrence of a failure when the state of the service execution environment meets a main condition defined in the monitoring rule. 監視の対象であるサービス実行環境の状態が、前記蓄積手段に蓄積されたいずれかの前記監視ルールに定義された主条件に適合するか否かを判断する工程と、
前記サービス実行環境の状態が、前記蓄積手段に蓄積されたいずれかの前記監視ルールに定義された副条件のそれぞれに適合するか否かを判断する工程と、
前記サービス実行環境の状態が、任意の監視ルールにおいて、副条件のいずれかと主条件とで適否が異なるか否かを判断する工程と、
副条件のいずれかと主条件とで適否が異なる監視ルールの更新を管理者に要求する工程と、
改正された監視ルールを前記蓄積手段へ蓄積する工程とを有するサービス実行環境監視方法。
Determining whether the status of the service execution environment to be monitored conforms to the main condition defined in any of the monitoring rules stored in the storage means;
Determining whether the state of the service execution environment meets each of the sub-conditions defined in any of the monitoring rules stored in the storage unit;
Determining whether the status of the service execution environment is different in suitability between any of the sub-conditions and the main condition in an arbitrary monitoring rule;
Requesting the administrator to update a monitoring rule whose suitability is different between one of the sub-conditions and the main condition;
A service execution environment monitoring method comprising the step of storing the revised monitoring rule in the storage means.
前記サービス実行環境の状態が、前記監視ルールに定義された主条件に適合する場合に、障害の発生を管理者に通知する工程を有することを特徴とする請求項8記載のサービス実行環境監視方法。   9. The service execution environment monitoring method according to claim 8, further comprising a step of notifying an administrator of the occurrence of a failure when the state of the service execution environment meets a main condition defined in the monitoring rule. .
JP2007327470A 2007-12-19 2007-12-19 Monitoring system, network monitoring apparatus, and service execution environment monitoring method Expired - Fee Related JP4867908B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007327470A JP4867908B2 (en) 2007-12-19 2007-12-19 Monitoring system, network monitoring apparatus, and service execution environment monitoring method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007327470A JP4867908B2 (en) 2007-12-19 2007-12-19 Monitoring system, network monitoring apparatus, and service execution environment monitoring method

Publications (2)

Publication Number Publication Date
JP2009151456A true JP2009151456A (en) 2009-07-09
JP4867908B2 JP4867908B2 (en) 2012-02-01

Family

ID=40920568

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007327470A Expired - Fee Related JP4867908B2 (en) 2007-12-19 2007-12-19 Monitoring system, network monitoring apparatus, and service execution environment monitoring method

Country Status (1)

Country Link
JP (1) JP4867908B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010150847A1 (en) 2009-06-25 2010-12-29 富士フイルム株式会社 Novel dehydroabietic acid polymer
JP2012238213A (en) * 2011-05-12 2012-12-06 Hitachi Ltd Monitoring server and monitoring evaluation method
WO2016104025A1 (en) * 2014-12-25 2016-06-30 クラリオン株式会社 Fault information provision server and fault information provision method
CN110297739A (en) * 2019-06-04 2019-10-01 平安科技(深圳)有限公司 The data monitoring method and relevant device of platform are administered based on data
CN113272743A (en) * 2019-02-19 2021-08-17 奥普塔姆软件股份有限公司 Rule-based automation control using dynamic environment with channel structure

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003271422A (en) * 2002-03-18 2003-09-26 Fujitsu Ltd Preventive maintenance decision processing method, preventive maintenance decision processing program and maintenance managing method
JP2005038223A (en) * 2003-07-16 2005-02-10 Nec Corp Failure restoration device, failure restoration method, and program
JP2006094180A (en) * 2004-09-24 2006-04-06 Fujitsu Ltd Network monitoring method and apparatus

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003271422A (en) * 2002-03-18 2003-09-26 Fujitsu Ltd Preventive maintenance decision processing method, preventive maintenance decision processing program and maintenance managing method
JP2005038223A (en) * 2003-07-16 2005-02-10 Nec Corp Failure restoration device, failure restoration method, and program
JP2006094180A (en) * 2004-09-24 2006-04-06 Fujitsu Ltd Network monitoring method and apparatus

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010150847A1 (en) 2009-06-25 2010-12-29 富士フイルム株式会社 Novel dehydroabietic acid polymer
JP2012238213A (en) * 2011-05-12 2012-12-06 Hitachi Ltd Monitoring server and monitoring evaluation method
WO2016104025A1 (en) * 2014-12-25 2016-06-30 クラリオン株式会社 Fault information provision server and fault information provision method
JP2016122337A (en) * 2014-12-25 2016-07-07 クラリオン株式会社 Fault information providing server and fault information providing method
CN107003926A (en) * 2014-12-25 2017-08-01 歌乐株式会社 Fault message provides server, fault message and provides method
EP3239840A4 (en) * 2014-12-25 2018-08-29 Clarion Co., Ltd. Fault information provision server and fault information provision method
US10437695B2 (en) 2014-12-25 2019-10-08 Clarion Co., Ltd. Fault information providing server and fault information providing method for users of in-vehicle terminals
CN113272743A (en) * 2019-02-19 2021-08-17 奥普塔姆软件股份有限公司 Rule-based automation control using dynamic environment with channel structure
US11853777B2 (en) 2019-02-19 2023-12-26 Optumsoft, Inc. Using a lane-structured dynamic environment for rule-based automated control
CN113272743B (en) * 2019-02-19 2024-04-12 奥普塔姆软件股份有限公司 Rule-based automation control using dynamic environments with channel structures
CN110297739A (en) * 2019-06-04 2019-10-01 平安科技(深圳)有限公司 The data monitoring method and relevant device of platform are administered based on data

Also Published As

Publication number Publication date
JP4867908B2 (en) 2012-02-01

Similar Documents

Publication Publication Date Title
US8645769B2 (en) Operation management apparatus, operation management method, and program storage medium
EP3239840B1 (en) Fault information provision server and fault information provision method
JP4867908B2 (en) Monitoring system, network monitoring apparatus, and service execution environment monitoring method
JPWO2012046293A1 (en) Fault monitoring apparatus, fault monitoring method and program
JP5425720B2 (en) Virtualization environment monitoring apparatus and monitoring method and program thereof
US20140006607A1 (en) Monitoring method and apparatus
US20130311646A1 (en) Management method and management system
JP2012080181A (en) Method and program for fault information management
EP2940540B1 (en) Power system monitoring and control system
JP4905165B2 (en) Monitoring support program, monitoring method and monitoring system
JP5613570B2 (en) Batch job delay warning automatic alert system, automatic alert method, and program therefor
JP2011197817A (en) Monitoring system, monitoring device, method for monitoring service execution environment, and program for monitoring device
US9372746B2 (en) Methods for identifying silent failures in an application and devices thereof
JP2011028490A (en) System monitoring device, system monitoring method, and program
JP2007068090A (en) Network device monitor system and monitoring method, and program therefor
JP2009059204A (en) Computer remote control system
JP2014021586A (en) Server performing upgrade of program, upgrade system composed of server and plurality of devices, and upgrade method of program
JP2012068812A (en) Countermeasure presentation device, countermeasure presentation method and countermeasure presentation program
JP5520864B2 (en) Maintenance device, maintenance method and program
JP2012174079A (en) Equipment management system
JP6572722B2 (en) Event occurrence notification program, event occurrence notification method, and event occurrence notification device
WO2015194651A1 (en) Malfunction notification apparatus, malfunction notification method, and program
JP2014089603A (en) Information processing device, normal end determination method for process, and program
JP2021047784A (en) Processing device, processing program and processing method
JP2011159234A (en) Fault handling system and fault handling method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110411

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20110919

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111018

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111031

R150 Certificate of patent or registration of utility model

Ref document number: 4867908

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees